Descripción
Mediante las técnicas de investigación online y el procesado del lenguaje natural podemos obtener y analizar información expresada de forma libre en diferentes formatos (texto, audio, video, fotos…) tanto en tiempo real como de forma asíncrona.
La opinión expresada de manera libre por las personas, puede extraerse de fuentes primarias como puede ser una pregunta abierta en una encuesta o entrevista. Y también puede extraerse de fuentes secundarias como Amazon o Google Reviews, Twitter…
Es una técnica muy flexible que permite que sea utilizada en diferentes campos de investigación, y con diferentes objetivos. Algunos de ellos pueden ser:
- Analizar las percepciones de los usuarios, sobre los términos o expresiones que ellos mismos emplean.
- Identificar los criterios más importantes para el usuario en la toma de decisiones para determinar qué producto/ servicio le agrada más y cuál menos.
- Obtener los puntos fuertes y débiles que caracterizan al producto o servicio analizado (generación de argumentos de venta).
- Comparar el producto o servicio evaluado frente a los productos o servicios de la competencia.
- Generar especificaciones de diseño de un producto o servicio que maximice la intención de compra del usuario.
El procesado del lenguaje natural (NLP) es un campo de aplicación muy amplio y en desarrollo, que puede ir desde el análisis de la polaridad, sintaxis, tono de voz… esta sección se centra en la aplicación para el análisis de opiniones de los usuarios sobre un producto/servicio.
Pasos
Hay tres pasos a seguir para la realización de un análisis de respuestas abiertas mediante procesado del lenguaje natural (NLP):
Obtención opinión expresada de forma libre
Son aquellas opiniones expresadas por el usuario de manera espontánea con sus propias palabras (lenguaje natural).
Pueden provenir de redes sociales u otras fuentes de datos no estructurados como:
• transcripciones de llamadas de call center,
• valoraciones de productos o servicios como Amazon o Google Maps
• respuestas abiertas de encuestas,
• mensajes de chats,
• testimonios,
• emails, etc.
Para la extracción de opiniones ya existentes en internet se utilizan técnicas de webscrapping.
Clasificación de polaridad
En esta fase, ya tenemos un set de opiniones del usuario expresadas de forma libre bien sea mediante la extracción de dichas opiniones de internet o a partir de una pregunta abierta en un cuestionario semiestructurado.
Dichas opiniones pueden provenir de preguntas abiertas con una polaridad ya definida, es decir, pueden ser verbatims u opiniones que ya son negativos o positivos por respuesta a una pregunta que define la polaridad como, por ejemplo: ¿Qué te gusta del producto de la imagen?, ¿Qué no te gusta del producto de la imagen? En estos casos no es necesario una clasificación de polaridad previa al análisis del procesado del lenguaje natural.
En otras ocasiones para poder realizar un procesado del lenguaje natural será necesario hacer una clasificación de polaridad, es decir, clasificar las opiniones en positivas, negativas, neutras o mixtas.
Para ello, se pueden utilizar librerías de Python como pysentimento, Amazon Comprehend o incluso desarrollar un modelo de clasificación propio.
Interpretación y visualización de los resultados
En esta fase, se utilizan algoritmos que permitan obtener:
• Palabras más frecuentes.
• Palabras más frecuentes juntas.
• Palabras que acompañan normalmente a una palabra seleccionada.
• Selección de opiniones que se relacionan con una de las palabras frecuentes.
• Nubes de palabras agrupadas por polaridad para una mejor visualización de los resultados.
• …
Utilidades
Ventajas
- Permite una interacción más natural y fácil expresada en las propias palabras de los usuarios.
- Permite procesar y extraer información clave de grandes volúmenes de información, lo que facilita la toma de decisiones y el análisis de patrones y tendencias.
- Puede determinar el sentimiento general asociado a una opinión, como positivo, negativo o neutro. Esto es especialmente útil para comprender la satisfacción del cliente y detectar problemas o áreas de mejora.
- Puede identificar los aspectos o temas más mencionados en las opiniones de los usuarios, lo que ayuda a comprender las preocupaciones y prioridades de los clientes.
- Puede agrupar a los usuarios en segmentos según sus opiniones, permitiendo una personalización y adaptación más efectiva de los productos y servicios.
Desventajas
- El lenguaje humano puede ser ambiguo y subjetivo, lo que dificulta el análisis preciso de la opinión de los usuarios. El procesado del lenguaje natural puede tener dificultades para captar matices y sarcasmo, lo que puede afectar la interpretación de las opiniones.
- Puede tener dificultades para capturar la subjetividad y el contexto específico de las opiniones de los usuarios, lo que puede afectar la precisión del análisis.
Referencias
- Liu, B. (2012). Sentiment Analysis and Opinion Mining. Synthesis Lectures on Human Language Technologies, 5(1), 1-167.
- Pang, B., & Lee, L. (2008). Opinion mining and sentiment analysis. Foundations and Trends in Information Retrieval, 2(1-2), 1-135.
- Medhat, W., Hassan, A., & Korashy, H. (2014). Sentiment analysis algorithms and applications: A survey. Ain Shams Engineering Journal, 5(4), 1093-1113.
- https://youtu.be/MjZlMiovPVE
- https://www.youtube.com/watch?v=85PITl0WltI&t=2s