Análisis de sentimiento: una herramienta para medir tu reputación online

Share Button

Últimamente he oído mucho hablar sobre el análisis de sentimientos (también llamado minería de opiniones), análisis «automático» se entiende. ¿Pero esto qué es? Se trata de una rama del saber muy joven, poco más de diez años, que está muy relacionada con la minería de datos, el aprendizaje estadístico, el procesamiento del lenguaje natural y con técnicas de web scraping y uso de APIs de acceso a redes sociales. Consiste básicamente en detectar e identificar sentimientos u opiniones que la gente expresa libremente sobre cualquier tema en redes sociales, blogs, comentarios de noticias, foros, etc. Dicho de otro modo, se trata de la detección y la extracción de información subjetiva en todo tipo de documentos escritos.

Es un área de especial interés para las empresas, pues les interesa descubrir si la gente está hablando de ellas o de sus productos, y además, si lo que dicen es bueno o malo.

En este contexto, una opinión se compone de dos partes:

  • El tema u objetivo sobre el que versa la opinión.
  • El sentimiento (o la ausencia del mismo) sobre dicho tema. Dicho sentimiento se detecta mediante la orientación semántica o la polaridad (positiva, neutra, negativa) de las palabras utilizadas en la opinión.

Bonne_Humeur

Así por ejemplo, imaginemos que soy el CEO de una empresa que cultiva y vende legumbres empaquetadas. Me interesará saber qué se cuece en el perfil social de mi empresa (perdón por el chiste, pero no he podido resistirme). Supongamos que encontramos este mensaje escrito por un usuario:

Me encanta comer lentejas X.

Aquí el tema de la opinión son las «lentejas de la marca X», mientras que el sentimiento es «me encanta» (es decir, un sentimiento positivo).

El mensaje puede ser más elaborado y complejo:

Me encanta comer lentejas X, pero siempre se me pegan al fondo de la cazuela.

Esta frase es más complicada porque expresa dos ideas o subtemas sobre el mismo tema («lentejas X») con sentimientos encontrados («me encanta» y «se pegan con facilidad»). Por ello el análisis de sentimientos puede realizarse a diferentes niveles:

  • A nivel de documento, que es cuando se analiza todo el documento en su conjunto. Se entiende en estos casos que el texto habla de un solo tema, aunque pueden aparecer varios subtemas que se expresan con un sentimiento particular. El balance de dichos subtemas hará que hablemos de un documento globalmente positivo, neutro o negativo.
  • A nivel de frase, que es cuando descomponemos el documento en párrafos y frases y realizamos el análisis del sentimiento frase a frase. Cada una de las frases tiene una valoración independiente de las demás.
  • A nivel de sintagma o grupo sintáctico, que es cuando descomponemos cada una de las frases en sintagmas o grupos sintácticos. Es el caso por ejemplo la frase anterior de las lentejas, que no es otra cosa que una frase compuesta de tipo coordinado adversativo (delatada por la conjunción «pero»), donde se contraponen dos ideas («me encanta las lentejas X» y «se pegan con facilidad»).

El análisis de sentimiento es complejo porque no nos basta con detectar la presencia de palabras positivas o negativas en el discurso. También importa la aparición de modificadores del sentido, como adjetivos, adverbios, verbos, signos de puntuación, etc. Por ejemplo consideremos estas frases:

He comprado lentejas X (valoración neutra).

Las lentejas X salen ricas (valoración positiva).

Las lentejas X salen ricas ricas ricas (repetición del adjetivo: valoración mucho mejor que la anterior).

Las lentejas X salen más o menos ricas (valoración atenuada).

Las lentejas X, ricas ricas no salen (valoración negativa, a pesar de la repetición del adjetivo).

Dicen que las lentejas X salen ricas… ¡Ja! (valoración negativa, por la ironía).

Como hemos indicado las empresas están muy interesadas en saber lo que la gente opina sobre ellas en las redes sociales, pues se trata de una información valiosísima y de importancia estratégica para conocer y gestionar su reputación online, que el INTECO define como «el conjunto de la información sobre una empresa expuesta en Internet (datos, imágenes, registros, noticias, comentarios, etc.) que conforma una descripción de dicha organización en el plano digital». Monitorizar la imagen que una empresa tiene en las redes sociales es fundamental para:

  • Adaptar su oferta, productos o servicios a la demanda esperada por el consumidor.
  • Identificar clientes potenciales.
  • Fidelizar clientes habituales.
  • Encontrar nichos de mercado.
  • Habilitar canales de comunicación alternativos a los existentes actualmente.
  • Identificar rápidamente quejas de los clientes y fallos en sus productos y servicios antes de que su imagen de marca resulte dañada.

El análisis de sentimiento es un tema apasionante, del que me oiréis hablar más a lo largo del próximo año. Y es que en la Universidad Francisco de Vitoria vamos a empezar en enero de 2014 varios proyectos relacionados con este tema. Para el que no pueda esperar a saber más, os recomiendo el siguiente libro escrito por el profesor Bing Liu de la Universidad de Illinois en Chicago (Estados Unidos): Sentiment Analysis and Opinion Mining (Morgan & Claypool, 2012).

Aprovecho para desearos a todos muy Feliz Navidad y un Próspero Año 2014. ¡Nos vemos tras las vacaciones!

mano

One thought on “Análisis de sentimiento: una herramienta para medir tu reputación online

  1. goddie

    yo estuve un tiempo haciendo esto y no es muy dificil solo que tienes que entrenar muy bien al modelo con muchas variantes ya que puede ser que te de un falso positivo o algo irrelevante. ósea requiere mucho entrenamiento también para poder identificar el tipo de frase que es.

    Reply

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos necesarios están marcados *