•  
  •  
 
RELCASI

DOI

10.17705/1relc.00079

Abstract

Application of opinion mining in SAC 2.0 databases extracted from Facebook in order to measure the degree of satisfaction and dissatisfaction of consumers. One of the specific objectives is the analysis of tools that help in the steps of the knowledge discovery process in text and the selection of the most appropriate for opinion mining at the sentence level, resulting in positive, negative and neutral sentiment. It proposes a process for opinion analysis structured in a) starts with the operation of NetVizz to extract the Facebook database; b) use of Microsoft Excel® for data selection and reduction; c) Python codes for cleaning and transformation; d) use of Semantria for text analysis; e) execution of Naïve Bayes, SMO and J48 algorithms existing in Weka for the opinion classification step. It presents accuracy levels between 67.4% and 69.9% for Naïve Bayes, 73.3% and 93.4% for SMO, and 68.4% and 86.7% for J48. Research limitations include a) a single social media as a data source (Facebook); b) evaluation of opinions related to a single company, in a single line of business (motor vehicles). Future work includes applying the flow to SAC databases and investigating the causes of consumer satisfaction and dissatisfaction as well as adopting alternative tools in each of the proposed steps.

Aplicación de minería de opinión en bases de datos SAC 2.0 extraídas de Facebook para medir el grado de satisfacción e insatisfacción de los consumidores. Uno de los objetivos específicos consiste en el análisis de herramientas que ayuden en las etapas del proceso de descubrimiento de conocimiento en el texto y la selección de las más adecuadas para la minería de opinión a nivel de frase, dando lugar a sentimientos positivos, negativos y neutros. Propone un proceso de análisis de opinión estructurado en a) comienza con la operación de NetVizz para extraer la base de datos de Facebook; b) uso de Microsoft Excel® para la selección y reducción de datos; c) códigos en Python para la limpieza y transformación; d) uso de Semantria para el análisis de texto; e) ejecución de los algoritmos Naïve Bayes, SMO y J48 existentes en Weka para el paso de clasificación de opiniones. Presenta niveles de precisión entre el 67,4% y el 69,9% para Naïve Bayes, el 73,3% y el 93,4% para SMO y el 68,4% y el 86,7% para J48. Las limitaciones de la investigación incluyen a) un único medio social como fuente de datos (Facebook); b) la evaluación de las opiniones relacionadas con una única empresa, en una única línea de negocio (vehículos de motor). Los trabajos futuros incluyen la aplicación del flujo en las bases de datos del SAC y la investigación de las causas de satisfacción e insatisfacción de los consumidores, así como la adopción de herramientas alternativas en cada uno de los pasos propuestos.

Aplicação de mineração de opinião em bases de dados SAC 2.0 extraídas a partir do Facebook com o intuito de medir o grau de satisfação e insatisfação de consumidores. Um dos objetivos específicos consiste na análise de ferramentas que auxiliem nas etapas do processo de descoberta de conhecimento em texto e a seleção das mais adequadas para a mineração de opinião no nível de sentença, resultando em sentimento positivo, negativo e neutro. Propõe um processo para análise de opinião estruturado em a) inicia com a operação do NetVizz para extrair a base de dados do Facebook; b) uso do Microsoft Excel® para seleção e redução de dados; c) códigos em Python para a limpeza e transformação; d) uso do Semantria para de análise de texto; e) execução dos algoritmos Naïve Bayes, SMO e J48 existente no Weka para a etapa de classificação das opiniões. Apresenta níveis de acurácia entre 67,4% e 69,9% para o Naïve Bayes, 73,3% e 93,4% para o SMO e 68,4% e 86,7% para o J48. Limitações de pesquisa incluem a) uma única mídia social como fonte de dados (Facebook); b) avaliação das opiniões relativas a uma única empresa, em um único ramo de negócio (veículos automotores). Trabalhos futuros incluem a aplicação do fluxo em bases de dados SAC e investigação das causas de satisfação e insatisfação dos consumidores bem como a adoção de ferramentas alternativas em cada uma das etapas propostas.

Share

COinS