Qué es el Big Data, cuáles son sus aplicaciones en el mundo de la publicidad o cómo puede el Big Data mejorar un negocio son algunas de las cuestiones a las que da respuesta en este artículo Diego Duchowney, Advertising Technology Manager en Schibsted Classified Media Spain (SCM Spain), la compañía de anuncios clasificados más grande y diversificada del país a la que pertenecen los portales segundamano.es, fotocasa.es, coches.net, InfoJobs.net y Milanuncios.com.
El Big Data abre grandes posibilidades para el sector publicitario, ya que “partiendo de la premisa de que los datos pueden alterar las cadenas de valor, se generan oportunidades para desarrollar nuevos servicios y negocios, y los anunciantes tienen la posibilidad de conectar no sólo con grupos, sino también con cada consumidor de forma individual”, explica Duchowney.
¿Qué es el Big Data?
Big Data representa un cambio de rumbo en la sociedad actual, relacionado con el crecimiento exponencial de la producción de datos a partir de fuentes diversas. Estos datos además, son accesibles en tiempo real. Es un fenómeno conocido del que se habla hace algún tiempo, pero… ¿Por qué ocurre? ¿Qué es lo que lo impulsa?
Creo que una respuesta es que hoy, gracias a la tecnología, hemos creado un círculo retroalimentado de producción de datos, que genera a su vez un crecimiento de la «data». Big Data es entonces este conjunto de datos gigantesco, accesible en tiempo real, que incluye datos descriptivos, declarativos y actitudinales.
Como ejemplo de este tipo de datos, tenemos información de login de usuarios, ubicación GPS, búsquedas asociadas, último acceso, cliente/no-cliente, etc.
¿Cuál es el objetivo del Big Data?
El Big Data es el resultado de una situación de producción de datos, que no tiene una finalidad en sí misma. El uso que hacemos de esta data sí tiene una finalidad, que viene definida por los objetivos que se quieren alcanzar. Hay que estar muy atento y respetar la privacidad e integridad del propietario del dato, que cede su uso para diversas finalidades.
Si hubiera un objetivo en el Big Data, éste debería ser el de mejorar la vida de las personas.
¿Para qué sirve el Big Data?
Esa es la gran pregunta de hoy. Desde mi punto de vista, hay dos niveles: el Big Data se puede utilizar para responder preguntas o para reaccionar a una tipología. Respecto al primer nivel («responder preguntas»), éstas tienen que ser buenas preguntas, porque en un dataset de varios Terabytes es muy peligroso establecer relaciones entre variables. Se pueden inferir conclusiones sobre casi cualquier cosa. Una pregunta inadecuada lleva a conclusiones erróneas y por lo tanto, a soluciones erróneas. Es fundamental dedicar tiempo y recursos a la formulación de éstas preguntas.
Para no perderse en la maraña hay que establecer hipótesis, testearlas contra una muestra, analizar los resultados, y finalmente, realizar la pregunta: ¿Cómo son mis visitantes? ¿Cómo es un usuario recurrente? ¿Cuáles son sus intereses?
En lo que se refiere al segundo nivel («reaccionar a una tipología»), se trata sobre todo de adaptar el entorno al usuario: ¿Qué intereses podría tener un usuario en particular? ¿Qué contenidos prefiere? Esto -que sucede automáticamente- se resume en adaptar el site al usuario en función de, por ejemplo, el histórico de datos de éste.
¿Cómo puedo utilizar el Big Data para mejorar mi negocio?
Se dice que una métrica es buena cuando ésta modifica un comportamiento, permite accionar en el entorno. Ese mismo criterio es válido para las métricas de negocio. Si tienes que consultar un dataset de negocio que incluye datos de marketing online y offline, CRM, tienda física, tienda online, emailing, etc., hay que buscar hipótesis de cambio de comportamiento y luego seleccionar las métricas que los representan.
A partir de modelos estadísticos se pueden extrapolar tipos de usuarios a todo el universo de datos, buscando «look-alikes» (segmentos afines), que con sus reacciones, van realimentando y mejorando el sistema. Esto permite adecuar la oferta al tipo de cliente, consiguiendo un mejor impacto en ventas.
¿En qué me beneficia el Big Data en una campaña publicitaria?
Básicamente, hay que saber aprovechar la capa de datos en tiempo real. La relación entre campañas publicitarias y Big Data ofrece dos beneficios inmediatos: la posibilidad de adaptar el mensaje al usuario y/o a su entorno, y la posibilidad de realimentar mi propio sistema con más data útil. Como ejemplo de adaptación tenemos las creatividades dinámicas y el retargeting. Para la realimentación de datos podemos poner como ejemplo los datos de entorno de impresiones o impactos sin interacción versus datos de interacciones que pueden llegar hasta la conversión. Esta relación permitirá generar un modelo predictivo para la modelización de look-alikes. Varios DMP’s (Data Management Platform) ya utilizan esto de manera estándar.
¿Cuál es el valor de los proyectos de Big Data?
Como decía antes, la consulta de grandes datasets requiere muchos recursos y, si los datos son muy heterogéneos, esto puede representar mucho dinero. Cuanto más homogénea y normalizada sea la capa de datos, más barato será realizar las preguntas. Igualmente, tengamos en cuenta que tanto los sistemas de Analytics como el almacenamiento en Cloud son a día de hoy muy baratos y esto hace más accesible la viabilidad de proyectos de Big Data.
Hay que intentar evitar utilizar Big Data para todo, ya que muchas veces, los datos necesarios pueden estar en fuentes de datos más pequeñas, como un CRM, o incluso un punto de venta.
El valor de negocio de un proyecto de Big Data reside en que el acceso a más insights de negocio genera más oportunidades de negocio, que a su vez generan la necesidad de más datos, cerrando así el ciclo de realimentación tan utilizado actualmente.
¿Cuál es la diferencia entre las aplicaciones analíticas y de gestión y el Big Data?
Las aplicaciones analíticas y de gestión son básicamente productoras de datos. Éstas pueden realizar un análisis «local», con la propia herramienta como foco. Por ejemplo, con un analytics se puede analizar el origen de cada visita, y en algunos casos, hasta se puede incluir varios orígenes si se mide off-site.
Una matriz de datos (llamémosla «Big Data») incluye esta información, y agrega otras fuentes, que pueden contener datos del entorno, por ejemplo el contexto del origen de esas visitas, qué contenidos estaba visitando ese usuario, si es recurrente del site de origen, si accede a éste con varios dispositivos… En resumen, las aplicaciones analíticas y de gestión son parte del entorno del Big Data. Incluso, se podría decir que el crecimiento y desarrollo de los sistemas de analítica y gestión han hecho florecer el fenómeno Big Data.
¿Qué es lo que tenemos que tener en cuenta a la hora de implementar el Big Data?
Como siempre, en Data la primera preocupación es la normalización de los datos. Por ejemplo, que el campo «edad» siempre se llame igual, y que éste contenga un número entre 0 y 120… Luego es la coherencia interna, o sea, que este campo «edad» contenga el mismo valor en todos los entornos para un mismo usuario. En resumen, se trata de tener implementada una capa que permita recopilar data a todos los niveles, responda a preguntas de negocio y mejore la experiencia del cliente o visitante.
El diseño de la matriz de datos es otro tema recurrente que se relaciona directamente con la velocidad de acceso al dato. Esto hay que tenerlo muy en cuenta ya que parte del mundo del Big Data es el acceso en tiempo real o casi tiempo real, digamos entre 1 y 100 milisegundos. Y si no es así, tampoco sirve de nada un dataset que ocupa 24 ó 48 horas de procesamiento. No olvidemos el tema de la realimentación de datos, si estos resultados no sirven para realimentar el sistema, quizás no estemos hablando de Big Data sino del procesamiento de datos del siglo pasado, que aún es válido en muchísimas circunstancias, por ejemplo, en sistemas tradicionales de facturación.