La ciencia de datos, ampliamente definida, ha estado entre nosotros durante mucho tiempo. Sin embargo, las tasas de fracaso de los proyectos de datos masivos en general y de inteligencia artificial en particular permanecen elevadas. Además, a pesar de la expectativa, las compañías todavía no citan las contribuciones de la ciencia de datos en sus resultados finales. ¿Qué está pasando?
Recientemente, Ron Kenett, un científico de datos con base en Israel, y yo, comparamos notas sobre nuestros propios éxitos y fracasos –al igual que los de nuestros colegas– al ayudar a las compañías con ciencia de datos.
Quedó inmediatamente claro que los mayores éxitos no solo se derivaron de excelencia técnica, sino también de factores más suaves, como el entender los problemas del negocio, construir confianza con los tomadores de decisiones, explicar claramente los resultados y atender las preocupaciones de las personas impactadas por los datos. Por el contrario, un trabajo técnico excelente no logró progresar cuando no conectamos con las personas correctas, en el momento o en las formas apropiadas.
En muchas compañías, los científicos de datos no están involucrándose lo suficiente en este trabajo más suave, pero más difícil. Hay dos razones subyacentes. Primero, muchos científicos de datos están más interesados en hacer su oficio –léase, encontrar información interesante enterrada en los datos– que en resolver problemas empresariales. En algunos aspectos, esto es natural. Después de todo, se les orienta hacia un angosto enfoque en datos y en las herramientas necesarias para explorarlos, y hacerlo los ayuda a ganar el reconocimiento de sus pares.
Además, aplicar técnicas avanzadas es más divertido que lidiar con las desorganizadas realidades de la vida corporativa.
La segunda razón es que, desde la perspectiva de la compañía, los científicos de datos talentosos son escasos y el protegerlos del caos del trabajo cotidiano tiene sentido. Sin embargo, al hacerlo incrementan la distancia entre los científicos de datos y los problemas u oportunidades más importantes de la compañía. Esto se exacerba por el hecho de que la ciencia de datos es nueva, y la mayoría de las organizaciones siguen aprendiendo cómo gerenciar a los científicos de datos.
Definición de tareas
Entonces, ¿qué deberían hacer los gerentes para obtener más de sus programas de ciencia de datos?
Primero, clarifique sus objetivos empresariales y mida su avance hacia ellos. Aunque la ciencia de datos requiere inversión inicial, usted debería esperar resultados reales –en términos de ahorro de costos, nuevos ingresos, mayor satisfacción de los clientes o reducción de riesgos– en un par de años. Por obvio que suene, las implicaciones son profundas. Para la mayoría, significa reconocer que no está listo para tecnologías como las del aprendizaje de las máquinas. En lugar de ello, debería enfocarse en oportunidades más básicas, como las de poner bajo control los procesos operativos, mejorar la calidad de los datos y desarrollar una comprensión más profunda de sus consumidores.
Segundo, debería contratar a los científicos de datos que estén mejor adaptados a los problemas que enfrenta e inmiscuirlos en el trabajo cotidiano de su organización. La habilidad técnica importa, por supuesto, pero también debería buscar aquellos que están curiosos acerca de su empresa y tengan pasión por ayudarlo a mejorarla.
Tercero, exija que los científicos de datos sean responsables de su trabajo. Aquí es importante la labor de análisis para entender el problema antes de que inicie un proyecto. Sin una declaración de problema claramente articulada, el trabajo subsecuente carecerá de dirección. Definir la declaración de problema puede ser complicado debido a las agendas en competencia y el pensamiento desordenado de quienes controlan el tema. Requerirá habilidad y paciencia que los nuevos científicos de datos puedan crear. Un problema claramente definido puede eliminar la neblina política, y proponer soluciones claras que quizá ni siquiera requieran ciencia de datos.
El trabajo posterior al análisis es similarmente importante, ya que las perspectivas y algoritmos deben sostenerse ante los rigores del mundo real. Temas políticos aparentemente pequeños pueden ser muy preocupantes y poner a prueba la paciencia de los jóvenes o inexperimentados científicos de datos.
Finalmente, insista en que los científicos de datos les enseñen a otros, tanto al interior de sus departamentos como a lo largo de la compañía. Todos se benefician cuando usan un poco más de ciencia de datos en sus trabajos, pero la mayoría de las personas no tienen las habilidades necesarias. Entrenamiento bien ubicado y un poco de aliento pueden influir mucho para ayudar a las personas a completar proyectos simples. Sus científicos de datos están singularmente posicionados para brindar ese entrenamiento. Esto también ayudará a los científicos de datos a aprender más sobre la empresa.
La confianza es un hilo conductor a lo largo de estas recomendaciones; los directivos deben insistir en que los científicos de datos trabajen para ganarse esa confianza, y deben darles una oportunidad adecuada para hacerlo.
Considere a un científico de datos que fue empleado por una nueva división dentro de una compañía de alta tecnología y asignado a la tarea de hacer la planificación de capacidad para la red de trabajo en su división (yo fungí como su consejero informal). El network planning es notoriamente complejo. Una red que funcione “casi todo el tiempo” suele llevar a retrasos durante tiempos de alta demanda, lo que enoja a los consumidores y daña reputaciones. Los costos de mejorar el desempeño durante estos interludios pueden multiplicarse rápidamente, de modo que es esencial que los líderes empresariales entiendan la relación de costo-beneficio.
Así es como el científico de datos presentó esos costos y beneficios a los altos líderes de la división: “Primero tenemos que decidir qué clase de red queremos. En términos generales, podemos tener una ‘red de papá oso’, una ‘red de mamá osa’ o una ‘red de bebé oso’, y estas son las implicaciones de cada una.” Su analogía ayudó a aterrizar a los tomadores de decisiones, los hizo pensar de nuevas formas acerca de las implicaciones para el negocio y los ayudó a entender por qué necesitaban entender gráficas de “costo vs disponibilidad”. Inmediatamente se ganó algo de confianza de los altos líderes. Además, ya que el científico de datos pudo participar en las discusiones, desarrolló un aprecio más profundo de las metas de largo plazo de la compañía.
Thomas C. Redman es presidente de Data Quality Solutions.