The words you are searching are inside this book. To get more targeted content, please make full-text search by clicking here.
Discover the best professional documents and content resources in AnyFlip Document Base.
Search
Published by sairufsa, 2022-05-13 22:34:08

Classificacao de sentimento-ecommerce

Classificacao de sentimento-ecommerce

@Odemir Depieri Jr

Classificação de
sentimento no
E-Commerce

com Regressão
Logística

@Odemir Depieri Jr

Contexto

Analise de Sentimento

Análise de sentimento é um termo que se refere ao uso de processamento de
linguagem natural, análise de texto e linguística computacional para determinar a
atitude de um falante ou escritor em relação a um tópico específico.

Basicamente, ajuda a determinar se um texto expressa sentimentos positivos,
negativos ou neutros. A análise de sentimento é uma excelente maneira de
descobrir como as pessoas, principalmente os consumidores, se sentem sobre um
determinado tópico, produto ou ideia.

Origem dos Dados

Esses dados foram disponibilizados no site da Kaggle.
Nessa base de dados há milhares de comentários feitos por clientes do Brasil
inteiro em sites E-commerce.

Vamos minerar esses dados e criar um modelo de classificação de emoção.

https://www.kaggle.com/olistbr/brazilian-ecommerce

@Odemir Depieri Jr
Vamos utilizar uma base de dados da Kaggle
https://www.kaggle.com/olistbr/brazilian-ecommerce
Vamos importar as bibliotecas necessárias

Vamos instalar alguns pacotes e ler os dados

Nessa base de dados vamos utilizar apenas o Comentário e Avaliação do cliente.

@Odemir Depieri Jr
Vamos filtrar apenas as colunas essenciais

Retirando os valores nulos
Vamos criar a classe, a variável que vamos tentar prever

Para gerar a classe, usei o seguinte racional.
Classificação maior que 3 será considerado ‘Positivo = 1 ’, menor que isso será
‘negativo = 0’

@Odemir Depieri Jr
Vamos criar 3 Funções para tratar nossos dados

Essa função irá retirar os ‘resíduos’ das frases.
Caracteres especiais, espaços, link e afins, não agregam em nada nos modelos ao
contrário, podem piorar.
Assim vamos fazer essa limpeza.

Vamos Extrair o Radical da Palavra

Caso não saiba o que é o Radical da palavra.
https://querobolsa.com.br/enem/portugues/radical

@Odemir Depieri Jr
Vamos retirar pontuações e palavras sem relevâncias

Explicação do que seria as Stops Words
https://virtuati.com.br/cliente/knowledgebase/25/Lista-de-StopWords.html

Vamos aplicar essas 3 funções nos dados

O que aconteceu ate aqui ?
Veja que as palavras ficaram com uma certa abreviação, certo? Esse processo é
referente ao radical da palavra.
Outro detalhe que as frases ficaram mais curtas, isso se deve ao processo da
remoção das stops words.
Quando treinamos um modelo de NLP ( Linguagem de processamento natural) é
essencial fazer esse tipo de treinamento para melhorarmos a performance do
modelo.
Toda vez que for trabalhar com NLP é primordial fazer esse tipo de tratamento.

@Odemir Depieri Jr
Vamos aplicar a vetorização nas Frases

Sugiro a leitura caso não entenda sobre Vetorização
https://carlos-bonfim.medium.com/machine-learning-e-processamento-de-
linguagem-natural-pln-com-modelos-lineares-d5aaaaf0efa5

Vamos treinar o modelo e medir sua Acuracia

Modelo foi muito bem !!!

@Odemir Depieri Jr
Vamos plotar essas acurácias

Hora dos Testes

Mandamos muito bem !!!

@Odemir Depieri Jr

Final

Esse guia foi elaborado para classificação de comentários.
Link do Colab
https://colab.research.google.com/drive/1CmC4SbPpjdmlcD2WAunoadX
q6_rsjH1A?usp=sharing

Odemir Depieri Jr

Data Intelligence Analyst Sr
Tech Lead

Specialization AI


Click to View FlipBook Version