Ciencia de datos: así usa Netflix su gran arma secreta para dominar el mercado del streaming
Netflix se ha convertido en la gran mancha de aceite cultural de esta década siendo no sólo una plataforma de streaming, sino también uno de los proyectos donde más y mejor se ha apostado por la ciencia de datos aplicada.
El secreto de Starbucks: A Reed Hastings le hemos oído decir que si el secreto de Starbucks es la sonrisa con la que te dan tu café, el de Netflix es cómo se adaptan a los gustos individuales del usuario. No hay un Netflix para todos: cada portada de entrada es diferente para intentar que te decidas a ver algo que encaje con tus gustos.
Más fácil de decir que de hacer: Además del perfil demográfico de quienes usan su plataforma (edad, género, ubicación…), Netflix recoge datos de cada interacción del usuario con su plataforma. No basta con usar los muy amplios metadatos que hay en torno a obras audiovisuales, sino que Netflix necesita entender hasta dónde has llegado en un producto, por qué lo elegiste y si te está gustando. Todo ello sin preguntártelo directamente.
Saber qué es lo siguiente que vas a ver antes de que acabes la película o serie actual: “Todas las personas con un teléfono tienen una pantalla y acceso a internet. Nosotros queremos conseguir el gusto de ese mundo, y su tiempo”, dice Reed Hastings. Los datos que acumulan para lograr ese cliente cautivo son muchos:
Qué día ves contenido.
A qué hora.
El dispositivo en el que lo consumes cuando lo estás viendo.
La naturaleza del contenido.
Qué búsquedas haces.
Qué fragmentos del contenido vuelves a ver.
Cuándo pausas, rebobinas o saltas hacia delante.
Tu ubicación cuando estás consumiendo un contenido en concreto.
Cuando dejas de verlo
Las notas de los usuarios.
Todo el comportamiento de scroll y navegación que haces por los menús.
¿En qué se convierten esos datos?: con todo ello, Netflix es capaz de generar diferentes herramientas:
Un motor de recomendación en tiempo casi real: diferente para cada usuario y capaz de proponerte, mediante machine learning y tras haber cruzado tus datos con los de los demás usuarios, tu próxima propuesta.
Miniaturas y carátulas personalizadas: mediante una herramienta llamada AVA (Aesthetics Visual Analysis), Netflix elige qué carátula o fragmento de la serie te debería mostrar para que quieras verla. Incluye un análisis de las expresiones faciales de los actores, de tus áreas de interés, de la iluminación de la escena y de las posiciones de los personajes en la pantalla.
Planes de producción: En Netflix la ciencia de datos no sólo indica “deberíamos hacer una película interracial sobre orcos policías del futuro para llegar a este nicho concreto de usuarios”, sino que da orientaciones de dónde debería rodarse, en qué horas y en qué días del año y cómo reducir costes en la producción sin alejarse de su target.
Un framework para ayudar a crear modelos de datos que resuelvan sus problemas: Es lo que la compañía llama Metaflow.
Y otras herramientas más concretas para optimizar el uso de datos: Polynote (para una mejor integración de las plataformas de machine learning JVM con Python, una de las herramientas más queridas por la compañía, cuyo uso es inmenso); Metacat (para conseguir interacciones más sencillas entre el inmenso número de datos que almacena la compañía)
La tiranía del algoritmo: Netflix aprovecha todos los datos recogidos no sólo para sugerirte lo siguiente, sino también para crear contenido. Se puede ver muy claramente en los últimos días de noviembre, cuando en Netflix comienzan a aparecer películas navideñas producidas por la propia compañía que son clónicas hasta en su imagen de portada (y que han creado su propio universo cinematográfico). Por supuesto, numerosos críticos y filósofos culturales han avisado ya del peligro que supone un panorama en el que las producciones las rige, de manera tan estricta, el algoritmo.