¿Qué es el análisis del sentimiento?
Desde que empecé a trabajar en Bitext, me han preguntado ya muchas veces qué es el análisis del sentimiento (o, en inglés, “sentiment analysis”): es el proceso por el que determinamos si una frase o acto de habla contiene una opinión, positiva o negativa, sobre una entidad concreta o sobre un concepto. Es un término que está muy ligado a las redes sociales pero que, en realidad, no está limitado a ellas.
Mediante el análisis del sentimiento, aspiramos a entender, en primer lugar, con qué guarda relación el texto que analizamos. Por ejemplo, nos interesa saber si la frase en cuestión trata sobre nuestra marca o sobre el concepto que nos interesa analizar (p. ej. - “hoteles”). Idealmente, querremos saber esto pero con mayor nivel de granularidad: ¿a qué se refiere exactamente la frase? ¿A nuestra marca, en general, o a un aspecto de nuestro producto o servicio (envase, precio, la habitación, la atención recibida…)? Una vez que el sistema tiene claro sobre qué es la opinión, nuestro segundo objetivo será conocer el sentido de esa opinión (positiva o negativa, básicamente), así como la intensidad de esa opinión. A esa puntuación, técnicamente, la llamamos “intensidad de la polaridad”.
Los sistemas más sencillotes se limitan a leer una frase y buscar en ella palabras que tienen registradas en su diccionario como buenas o como malas. Si aparece una palabra buena (p. ej. - “estupendo”), es una opinión positiva. Si aparece una palabra mala (p. ej. - “decepcionada”), es una opinión negativa. Si no encuentran ninguna palabra que, según su diccionario, exprese algo negativo o positivo, estos sistemas más sencillos suelen hablar de “opiniones neutras”, aunque para mí sería preferible entender que lo que ocurre es que no hay opinión como, por ejemplo, si yo tuiteo “Estoy esperando a mi primo en el McDonald’s”. Paradójicamente, muchos de esos sistemas simples también te dirán que una opinión es neutra si han encontrado una palabra negativa y otra positiva. Esto último debería provocar sonrojo a más de uno, pero no.
A partir de ese mínimo, los distintos sistemas de análisis del sentimiento que hay en el mercado van incrementando su refinamiento y su capacidad de proporcionar información realmente útil. Las áreas en las que se notan las mejoras son:
Capacidad para interpretar correctamente construcciones complejas como, por ejemplo, las oraciones comparativas (“McDonald’s es mucho mejor que Burger King”), negativas (“La tercera parte de El Hobbit no me ha gustado”) o condicionales (“Me compraría un iPhone si no fuera tan caro”) y, en general, para lidiar con todas las particularidades del habla natural: desde el uso de la ironía, el lenguaje informal o los errores en la escritura.
Capacidad para identificar exactamente a qué está haciendo referencia la opinión. Los sistemas más burdos sólo son capaces de saber que la frase tiene algo que ver con el concepto que estamos monitorizando, pero no interpretan la frase realmente. Dicho de otro modo, para un sistema básico, si tu marca está en la frase, entonces la opinión es sobre tu marca, incluso en casos tan evidentes para un humano como “No hay nada peor que te interrumpan mientras te bebes una Coca-Cola”, que un sistema simple identificaría como negativo hacia tu marca (es una frase de tono negativo, sin duda, pero no hacia la marca).
Los sistemas que se limitan a detectar la presencia de palabras en las frases analizadas son, generalmente, incapaces de alcanzar la mínima eficacia en esas dos áreas. Las complejidades del idioma humano son tales que ningún sistema puede aspirar, hoy por hoy, a la eficacia absoluta, pero los sistemas de análisis del sentimiento más avanzados sí son capaces de superar la mayor parte de los obstáculos y pueden proporcionar a las marcas información fiable.
En el caso de Bitext, nuestra tecnología va mucho más allá de la mera detección de palabras. También va más allá de los mecanismos matemáticos y estadísticos del machine learning, puesto que la tecnología de Bitext analiza la frase hasta “comprender” su estructura profunda, por lo que es capaz de detectar giros de significado, la presencia de múltiples opiniones sobre conceptos distintos y, por supuesto, a qué elemento concreto se refiere cada opinión. Todo esto hace que los resultados del análisis del sentimiento realizado con nuestra plataforma no sólo sean mucho más precisos y fiables, sino que además son más fácilmente convertibles en información “accionable” para las marcas: saber que un 60% de las opiniones detectadas sobre tu marca son positivas no es más que un dato bonito; en cambio, puedes tomar decisiones si sabes, por ejemplo, que hay muchos clientes que se quejan sobre el envase de tu producto o que lo más valorado de tu hotel es el desayuno.
¿Para qué se usa el análisis de sentimiento?
Como decía al principio, lo habitual es identificar el análisis del sentimiento con su uso en las redes sociales pero, en realidad, su aplicación va mucho más allá. Analizar tuits es importante, pero muchas marcas no se limitan a eso y monitorizan de forma constante toda la web, principalmente aquellos lugares donde es más probable que se viertan opiniones relevantes, como las webs de comercio electrónico, los agregadores, los comparadores, etc.
Las marcas que cuentan con un buen motor de análisis del sentimiento, extraen conclusiones y toman decisiones concretas basadas en la información que les proporcionan: modificar elementos de su offering, lanzar acciones correctivas cuando detectan un problema con la experiencia del cliente o construir sus mensajes de marketing.
Es evidente que, para poder llevar a cabo estas prácticas de sentiment analysis, necesitamos algo más que un buen motor de análisis del sentimiento. Los otros dos elementos fundamentales suelen ser:
Un motor de monitorización (a menudo llamado "crawler"), que encuentra los textos que se deben analizar. Estas herramientas suelen incorporar capacidades de búsqueda en redes sociales y en la web, para encontrar todas las menciones de las palabras clave que hayamos definido y pasárselas al motor de análisis para que las evalúe.
Una herramienta de visualización y explotación de la información, que recoge la información proporcionada por el motor de análisis del sentimiento y compone con ella la interfaz de usuario. También, en este "lado" de la ecuación se realiza la agregación de la información sobre sentimiento con otros datos relevantes disponibles.
¿Existe alguna herramienta 100% precisa?
Ojalá, pero no. El análisis de sentimiento no es, por el momento, 100% preciso. De hecho, en función del contexto, las cifras de acierto pueden andar docenas de puntos por debajo de la perfección. Los motivos más habituales son:
Ni siquiera los seres humanos somos capaces de estar 100% de acuerdo sobre la “intensidad de la polaridad” de la mayoría de las frases. Si pides a cinco personas que analicen el sentimiento de un conjunto de frases, en la mayoría de las frases no conseguirás que coincidan más de cuatro de esas personas. Cuando hablamos de la precisión de una herramienta automatizada, lo hacemos comparándola con la de esos grupos de control humanos, así que es imposible alcanzar el 100% de eficacia real.
La complejidad y riqueza de nuestros idiomas y de nuestro lenguaje nos permite hacer frases tremendamente complicadas, jugar con conocimiento implícito que no se refleja de forma explícita en nuestros actos de habla o, sencillamente, confiar en el contexto para que se entienda el significado real de lo que queremos decir, contexto que no tiene por qué estar disponible para el motor de análisis. Podemos detectar las ironías más evidentes, pero no las más sutiles, por ejemplo.
En ocasiones, las distintas variedades dialectales o el argot de los diversos grupos sociales puede impedir el correcto análisis de algunos textos, aunque esto es algo que se puede amortiguar si el proveedor del sistema es suficientemente concienzudo.
Por eso, es importante no fiarse de quienes afirman, sin justificación técnica, gozar de cifras de precisión escandalosamente altas y, al mismo tiempo, hay que ser muy consciente de cuánta confianza podemos depositar en las herramientas que usamos.