Investigaciones de mercado 2.0

Otras investigaciones de mercado son posibles ahora, gracias a los datos que hay disponibles en la gran red de redes: Internet. En el video que acompaña a esta entrada, se pueden ver algunos de los resultados de un curioso estudio realizado por Víctor Ruíz y Fernando Tricas, en el que analizan 150.000 fotos de la provincia de Málaga publicadas en Flickr para extraer conclusiones sobre el comportamiento de los turistas en la zona.

La clave está en los metadatos disponibles en cada fotografía o en muchos de los elementos que cargamos en muchos servicios sociales ¿Qué son los metadatos? Son pequeñas porciones de información que van adosadas a un documento y que están adosadas a él. Por ejemplo, en una fotografía es normal que lleve adosados metadatos como la fecha en la que se tomó, el modelo de cámara, la posición GPS del punto en el que se tomó la imagen (si se dispone de GPS), los parámetros de la cámara,…

En el post de presentación del estudio de Víctor y Fernando se hace referencia a otro estudio en el que se realiza un análisis de los checkins realizados por la gente en el servicio Foursquare en un área de New York, mediante mapas de calor y diferentes gráficos. Resulta curioso ver los movimientos de la gente y su evolución a lo largo de la semana, todo un reflejo de los hábitos de la sociedad de aquella zona, y otra manera de obtener información que puede ayudar a modelar o comprender un negocio.

Múltiples fuentes de información disponibles

Si uno se para a pensar, en realidad hay unas cuantas fuentes de información disponibles en Internet que puede ser de utilidad en algunos sectores. Para cada uno de ellos, hay que pensar cuales son sus “ecosistemas naturales” en la red e irse a ellos a ver qué datos están disponibles. La asociación de servicio de alojamiento de imágenes más red social con los turistas, muchos cargados en sus viajes con sus cámaras de fotos, es bastante directa.

A continuación, algunos ejemplos de fuentes que se podrían exlotar:

  • Redes sociales como Facebook o Twitter, en donde se pueden analizar los términos más relevantes mencionados por los usuarios (por ejemplo a través de los hastags).
  • Herramientas de tendencias en las búsquedas, como Google Trends, que permiten analizar las preferencias de las peticiones de información que hacen los usuarios a lo largo del tiempo.
  • Aplicaciones que usan geolocalización: Ya comentamos el caso de Foursqare, pero bien podrían ser otras de las múltiples que en hay disponibles en las diferentes plataformas y que usan la posición del usuario para transmitir información.

Por ejemplo, si entras en Google Trends y buscas “aire acondicionado”, seleccionando el período de tiempo de los últimos 12 meses, se ve que hay un pico de actividad en los meses de verano. Se puede jugar con el gráfico y con diferentes términos de búsqueda (“calefacción”, “climatizador”,…) para obtener diferentes visualizaciones e ir extrayendo conclusiones.

Si bien, si no se encuentra una opción en el mercado, si los recursos lo permiten, se puede desarrollar una aplicación propia que permita capturar la información deseada. La clave estará en convencer a los usuarios para que la utilicen y nos cedan los datos requeridos ¿Alguien se lee los contratos de servicio que aceptamos cuando instalamos algún software?

Recientemente un desarrollador publicó los resultados de un estudio sobre contraseñas de usuarios, hecho a partir de datos obtenidos de una aplicación para smartphones que nada tenía que ver con el tema pero recopilaba la de cada usuario y se la enviaba de forma anónima. No gustó mucho la idea, pero las conclusiones fueron reveladoras. La aplicación fue eliminada por Apple de manera fulminante.

Conclusiones

Resulta una manera ingeniosa de tratar información agregada y aplicar minería de datos a partir de información disponible, de manera gratuita, en la red. Interesante discusión la de si los resultados de este tipo de estudios son más fiables o no que los métodos tradicionales, basados en encuestas y análisis de grupos de población. Todos hemos participado en alguna de ellas y ya sabemos que el método tradicional depende del encuestador, encuestado y modelo de encuesta empleado, entre otros.

Quizá demasiados factores como para que a veces resulten creíbles los resultados. Usar información generada por los usuarios y disponible en internet, aunque contiene un importante sesgo por el factor de la web y el servicio (hay gente que no sube imágenes a internet, hay gente que no usa Flickr sino otros sitios de fotografías), la información puede ser de mucha utilidad en determinados contextos.

Enlace | Video en Youtube
En Blog Sage | Otra publicidad es posible

Pablo Herrero

Pablo Herrero es Ingeniero Industrial en la especialidad de Organización Industrial, relacionado con la Ingeniería de Organización de empresas. Escribe habitualmente en el blog Fuera de Límites y ha colaborado en Pymes y Autónomos.

Puedes seguirlo en Twitter en @pabloherrero