"Un viaje de miles de kilómetros debe empezar por un sólo paso"
Lao-Tsé.
Un tema del que se está hablando mucho estos días es la disciplina del Data Science: qué hacer y cómo sacar provecho a la gran cantidad de información que las empresas almacenan en sus sistemas.
Los llamados “data science" (o científicos de datos) son los profesionales responsables de su explotación, y se encuentran con barreras que son comunes en empresas de distintos sectores.
Por ejemplo, no es fácil que los mundos del analista y del negocio convivan. Es habitual que el analista disponga de cierto bagaje tecnológico porque necesita tener conocimiento de técnicas complejas, pero no debe perder el foco de que con su trabajo, ha de solucionar un problema de negocio. El objetivo no es el dato, es solucionar un problema de la empresa.
También sucede que existen proyectos en los que a pesar de haber llegado a una solución, se quedan guardados en el cajón porque no hay interés en los destinatarios, los responsables de su explotación. La no comprensión, el miedo o rechazo a lo desconocido..etc son barreras que frenan el desarrollo cuando en realidad, lo que permite es adquirir una ventaja competitiva frente al resto.
Además, es habitual que no haya mucha comunicación entre las áreas de negocio y tecnología, porque hablan lenguajes diferentes. Es ahí cuando el data science pasa a desempeñar un rol de “traductor” e intermediario, ayudado por un carácter didáctico. Se trata de profesiones con un perfil híbrido que suponen muchas veces un quebradero de cabeza para las empresas porque no se saben en qué departamentos ubicarlos.
Eliminar el binomio negocio vs tecnología, que vayan de la mano y hablen un mismo idioma, ayudaría en gran medida a que las dos grandes patas trabajen conjuntamente en armonía. Sin embargo, tal y como están planificadas las carreras en la universidad en España, no ayuda a lograr ese ideal. Por ejemplo, en las carreras técnicas como informática, matemáticas y estadística en ningún momento se enriquecen con enseñanzas sobre posibles aplicaciones técnicas al negocio. También es cierto que cada vez va habiendo más perfiles de tipo mixto; personas que estudiaron arte o arquitectura, se han reciclado al mundo técnico y son capaces de aportar una visión más innovadora.
Otra característica del data science es que en él ha de predominar la inquietud. Debe ser alguien que quiera explorar nuevos sectores o segmentos que le interese. Es un profesional que no le debe ser difícil salir de su zona de confort para enfrentarse a conocer otros mundos.
Respecto al comienzo de un proyecto, se debe comenzar por tener claro el problema de negocio que se quiere solucionar y cómo se quiere hacer. Es fundamental tener clara la perspectiva que se le quiera dar al problema, ya que uno mismo puede tener varias.
Por ejemplo, si una empresa quiere atacar el problema del abandono de sus clientes, su preguntas pueden ser:
- Quiero saber quién ha dejado de comprar
- Quiero saber por qué ha dejado de comprar
- Quiero saber quién va a dejar de comprar
- Quiero saber cuáles son los incentivos que han llevado a algunos clientes a abandonar
Ante tan diversas opciones, es importante centrar la idea además de tener claro cómo se va a accionar la solución. Una vez definido el resultado al que se quiere llegar, el proyecto continúa por identificar la información que me gustaría disponer y ver de la que se dispone, porque igual hay datos que no se están recogiendo, pasando este a ser el primer punto sobre el que actuar.
Tampoco hay que olvidar empaparse del contexto: el data science debe hablar con la gente de negocio, percibir sus impresiones, conocer las opiniones de los profesionales expertos, como por ejemplo los comerciales; estas acciones permiten comprender la esencia de la situación y enriquecer los datos con información cualitativa.
Una vez superadas las fases anteriores, es importante optimizar recursos, tiempo y esfuerzo de tal forma, que el proyecto no pase a ser un “gran proyecto de 3 meses”, cuyo resultado final no sea el esperado. La metodología “agile” está a la orden del día y es habitual en el campo de la investigación: consiste en hacer una aproximación rápida al problema, por ejemplo, dedicando un día laboral (8 horas) en caso de que ya se conozca la tecnología con la que se trabaja. El objetivo es obtener el mínimo producto viable (MVP) para ir evolucionándolo. Es un cambio de filosofía: nunca va a ser el trabajo final, la solución va a evolucionar conforme los datos y el entorno cambien.
En resumen, se trata de crear un proyecto inicial e irlo desarrollando con iteraciones cortas. Cambiar la idea de que un proyecto es algo que se empieza y termina. Disponer de un modelo inicial que arroja un resultado con el que se puede trabajar desde un primer día, sin olvidar mejorarlo constantemente en los días siguientes. La prioridad inicial no debe ser la exactitud, sino mejorar lo que hay, o llegar a un modelo que permita abrir una línea de exploración por muchos más canales. Aquí tanto el data science como el resto del equipo deben ir a la par.
En conclusión, el proyecto debe partir de un conocimiento de la situación actual para medir lo que se tiene. Es decir, disponer de datos con los que comparar los resultados de un modelo “ultra-sencillo”. Si se compara y se ha mejorado, entonces el esfuerzo habrá merecido la pena.
No te pierdas nuestro podcast al respecto, grabado en colaboración con Antonio Pita: