Segmentación en medios sociales con PLN

El pasado 26 de octubre presenté en el eShow 2017 un trabajo donde empleamos nuestras técnicas de Social Media Analytics y Big Data para escuchar, entender y visualizar las conversaciones en medios sociales.  En particular, usamos técnicas Procesamiento de Lenguaje Natural (PLN) que permiten analizar grandes volúmenes de datos y poder encontrar información que sería imposible de analizar manualmente.

En este estudio se analizaron las reacciones de aquellos usuarios que hacen likes o comentarios en muros de múltiples cadenas de supermercados. Son usuarios con un elevado grado de implicación que participan activamente en los distintos muros de las  marcas. Empleando tanto los likes como los comentarios se crearon automáticamente grupos de usuarios que se comportan de manera similar caracterizando perfiles que tienen intereses comunes en dos o más supermercados. Estos perfiles son clave para entender las similitudes y diferencias con la competencia.

El siguiente vídeo incluye una entrevista donde se resume el contenido de la ponencia:

Nuevo post «La interesante alianza entre ‘big data’ y comportamiento social»

Artículo publicado en El Pais Retina donde resalto como el procesamiento del lenguaje natural, permite analizar  plataformas, como las redes sociales,  permitiendo conocer de primera mano el pulso de la sociedad, qué piensa y cómo se posiciona sobre la actualidad. En general,  el uso del big data es una de las claves para el desarrollo en cualquier campo, contar con este dotará a los diferentes sectores de nuevos instrumentos capaces de mejorar y facilitar su trabajo.

Búsqueda de anglicismos en el español estadounidense a través de Twitter

Recientemente hemos terminado la primera parte de un proyecto en el colaboramos con Francisco Moreno, uno de los investigadores españoles más influyentes en el area de  sociolingüísitica. Este proyecto es una iniciativa de investigación conjunta, entre el Observatorio de la lengua española y las culturas hispánicas en los Estados Unidos del Instituto Cervantes en la Universidad de Harvard y el Instituto de Ingeniería del Conocimiento (IIC).

El origen de esta investigación está en la redacción de un Diccionario de anglicismos del español estadounidense (DAEE) que esta siendo coordinada por Francisco Moreno. La participación del IIC se concreta en observar los nuevos términos que se está produciendo en una red social tan activa como Twitter. Nos interesan las innovaciones léxicas en marcha que se puedan observar de manera masiva, general y rápida. Los mensajes de Twitter proporcionan una fuente de datos inmejorable para este fin por su inmediatez, por su tamaño y por la disponibilidad en formato electrónico.

Un primer resultado ha sido la elaboración de un informe donde se resumen los resultados obtenidos hasta el momento.

Periodista de datos: una profesión con futuro

A raíz de una entrevista en el programa Oficiorama de  RTVE2 que me hicieron sobre el periodista de datos como profesión de futuro (mi colaboración sale a partir del minuto 9.30), he publicado un nuevo post en el Huffington sobre el Periodismo de datos donde amplio lo dicho en el programa de televisión.

¡Gracias a Isa Moya e Manuel Recio por las aportaciones y correcciones al artículo!

Aunque el programa de TV parte de la premisa de ofrecer una imagen de las profesiones del 2050, en este caso estamos hablando de una profesión que es ya una realidad. Y para muestra un botón: recientemente  han salido a la luz los Panama Papers en cuyo análisis ha jugado un papel importante la tecnología. Esto es un ejemplo más que pone de manifiesto que la consolidación del periodismo de datos va a necesitar potentes herramientas que faciliten la recuperación y manipulación de datos, así como el apoyo de otros profesionales especializados.