Cómo crecer como científico de datos

¿Qué habilidades necesitas para pasar de Jr. a desarrollador sr.

por Ben Rogojan

Foto de Austin Distel en Unsplash

El papel de un científico de datos todavía varía de una compañía a otra e incluso de un equipo a otro. Esto hace que sea mucho más difícil para las empresas crear un plan de crecimiento estandarizado para sus científicos de datos.

Sin tener un plan de crecimiento claro, existe el riesgo de que estos talentosos asistentes informáticos se atasquen. Pueden proporcionar buenas ideas, pero nunca crecerán realmente y proporcionarán el verdadero ROI que tienen para ofrecer a un negocio o, lo que es más importante, a sí mismos.

Con esto en mente, nuestro equipo habló con los gerentes de Seattle que trabajaban en las compañías tecnológicas de primer nivel para averiguar qué querían y esperaban de sus científicos de datos senior. Queríamos compartir la información que aprendimos tanto para ayudar a los científicos de datos a crecer, como para ayudar a los gerentes que intentan desafiar a sus nuevos científicos de datos a crecer.

En base a nuestras discusiones, descubrimos que no se trataba de programar o diseñar algoritmos (esa era la base para un científico de datos de Jr.). Cuando les preguntamos a estos gerentes qué querían ver de sus científicos de datos más importantes, nos informaron que querían personas motivadas que pudieran comunicarse de manera concisa, que pudieran pensar por sí mismas, que tuvieran una sólida comprensión del negocio y que capaz de manejar

Para que un científico de datos crezca, deben ser desafiados más allá de los aspectos técnicos de sus trabajos. Los científicos de datos tienen la oportunidad de influir en las decisiones de la compañía. Tienen mucha responsabilidad sobre sus hombros. Eso significa que deben apropiarse del trabajo que realizan. Deben cuestionar sus fuentes de datos, ser concisos en sus ideas, conocer su negocio y ayudar a guiar a sus líderes.

No solo cuestione sus hallazgos, cuestione sus datos

Los científicos de datos de alto nivel no solo confiarán en sus datos después de recibirlos. Lo pincharán y lo pincharán por cosas como sesgo, datos faltantes, datos duplicados, etc.

Los datos están destinados a tener peculiaridades. Para aquellos que pasan horas y horas en datos, ya sabes lo que estoy diciendo. Mientras se desplaza o grafica datos, ve esos patrones extraños que le hacen detenerse y decir "Me pregunto por qué x se parece a z". Los científicos de datos más jóvenes a menudo estarán demasiado concentrados en terminar el proyecto. No han aprendido cómo detenerse y analizar realmente estos patrones extraños. Estos patrones pueden ser causados ​​por sistemas que predeterminan salidas de datos específicas como -1 o 1, o incluso datos sesgados causados ​​por la compra de bots que podrían sesgar lo que los clientes realmente están comprando en un sitio de comercio electrónico, y miles de otras causas plausibles de engaño datos.

Estos patrones no son necesariamente datos incorrectos o incorrectos. Incluso cuando los datos son precisos, siempre habrá peculiaridades operativas. Al diseñar informes, algoritmos y métricas, estos deben tenerse en cuenta. Un científico de datos experimentado no solo buscará estas peculiaridades de datos, sino que las esperará.

El término fuente de la verdad se usa mucho en los equipos de datos. Se refiere a la fuente de datos original que varios equipos han decidido que es correcta. Era muy ingenuo cuando comencé como científico de datos. En uno de mis primeros proyectos, me informaron sobre una fuente de datos que nuestro equipo había etiquetado como la fuente de la verdad. Durante meses trabajé en nuestra "Fuente de la verdad" desarrollando análisis y aplicaciones para ayudar a más de 200 gerentes y directores a tener acceso a esos datos. Por supuesto, no pasó mucho tiempo hasta que hubo problemas de coherencia con otras métricas. Fue entonces cuando me di cuenta de que había estado trabajando en una fuente de datos de varios ETL de la fuente de la verdad.

Hablando con gerentes de tecnología en Seattle, este es un problema común. Los jóvenes analistas, científicos de datos y desarrolladores confían demasiado en sus fuentes de datos. Por lo general, los empleados más jóvenes y menos experimentados estarán muy ansiosos por hacer el trabajo. Sin darse cuenta, esto conducirá a una menor comprensión de lo que realmente son los datos. En lugar de preguntar por qué, pasan más tiempo asegurándose de que el producto "funciona". Por lo tanto, se pierden de notar las peculiaridades de los datos.

Para crecer como científico de datos, debe dejar de asegurarse de que un producto o algoritmo "cumpla con los requisitos" y tomar posesión. Debe asumir la responsabilidad de comprender los datos y sus peculiaridades. De esa manera, puede comunicar completamente a su gerente o director cualquier suposición que haya hecho. Un científico de datos no puede crecer realmente si culpa a los datos incorrectos de los datos.

Ser capaz de establecer de manera concisa el valor de sus hallazgos.

Para crecer como científico de datos, debe expandirse más allá de ser un programador / estadístico. Debe aprender a ser un comunicador y debe tener la capacidad de expresar de manera concisa el valor de sus hallazgos y también lo que su director debe hacer con la información.

Puede ser tentador proporcionar a los directores y gerentes todos los gráficos, todos los datos y toda la información técnica que se recopiló durante nuestra investigación para demostrar que realmente estábamos haciendo el trabajo. Especialmente en ciencia de datos, donde a veces lleva algunos meses avanzar valiosamente en un solo problema (por una buena razón). Sin embargo, al final de todo, los directores no quieren un exceso de información.

Todo lo que un director quiere son los puntos importantes, y quieren saber qué deben hacer basándose en esos puntos. Seguir hablando sobre ROC y por qué usó un algoritmo versus otro no será muy útil para un gerente o director con otros 8 equipos para administrar. La mayoría de las veces, encontramos que los gerentes realmente solo quieren 2-3 puntos breves. A veces, incluso "Sí" o "No" es mejor que "Quizás, en estas condiciones ... bla, bla ... la posibilidad uno tiene estos riesgos, la posibilidad dos tiene estos riesgos ..."

Un científico de datos con experiencia sabe cómo ayudar a su gerente al proporcionar ideas pulidas, con elementos de acción destilados. Si el gerente quiere saber más, preguntará (y un buen científico de datos tendrá una respuesta). Al final, los gerentes no quieren estar empantanados con información adicional que no los ayudará a tomar buenas decisiones.

Conoce tu negocio

Cada vez que un científico de datos comienza un nuevo trabajo, es comprensible que no entiendan todo sobre el nuevo día hábil. Hay mucho que aprender además de las fuentes de datos, las bases de códigos y otros sistemas específicos de la compañía. Necesitan aprender sobre el día a día operativo de los datos con los que trabajarán. También necesitan comprender los problemas que enfrenta la empresa. Sin embargo, los científicos de datos con experiencia deberían ser capaces de comprender rápidamente un negocio.

No se concentre tanto en perfeccionar sus habilidades técnicas que no aprenda el negocio. Aprenda a trabajar con diferentes equipos, participe en proyectos y permítase ser un mentor diligente. Los científicos de datos pueden participar en un proyecto tras otro en múltiples tipos diferentes de temas y deben poder adaptarse rápidamente.

Los desarrolladores de Jr. a menudo estarán mucho más enfocados en perfeccionar sus habilidades técnicas en comparación con su comprensión comercial. Similar a muchos otros oficios donde el trabajo gruñido (en este caso, codificación, limpieza de datos, etc.) se lleva a cabo en niveles más bajos. Esto no les deja tiempo para obtener una comprensión profunda de cómo pueden ayudar al negocio.

Sin embargo, esta es una fase importante en los primeros años de un científico de datos para garantizar que desarrolle un amplio conjunto de habilidades técnicas. Los científicos de datos más experimentados deben centrarse más en el por qué de sus proyectos. Si un gerente no desafía a los miembros más experimentados de su equipo de ciencia de datos para que crezcan y aprendan el negocio, entonces es culpa suya por la falta de crecimiento. Cada año o cada pocos meses, los gerentes deben ayudar a desafiar a los científicos de datos más experimentados para asegurarse de que realmente estén creciendo. De lo contrario, una empresa está perdiendo el ROI máximo.

Administrar

Administrar es difícil en cualquier disciplina. En disciplinas técnicas, a veces puede ser difícil dependiendo de los antecedentes técnicos de los gerentes. Los gerentes enfocados en el negocio pueden no tener experiencia guiando equipos técnicos. Esto hace que sea crucial para los científicos de datos con experiencia tener las habilidades para gestionar.

Un científico de datos que es bueno en la gestión comprende a las personas. Administrar requiere que los científicos de datos (o cualquier persona de cualquier empresa) se tomen el tiempo para comprender las necesidades de los jefes. No solo la empresa necesita. ¿Qué quiere el jefe de ti y de ellos mismos? Una vez que entiendes eso, entiendes lo que los está impulsando. Eso permitirá que un científico de datos anticipe las necesidades de sus jefes antes de que se le pregunte. Esto ayudará a desarrollar la confianza, así como a una mayor inversión por parte de sus gerentes y directores. Este mundo no se trata solo de tu crecimiento. ¡Los gerentes también quieren crecer! Como experimentado (cualquiera), sabe que ayudar a otros a crecer y alcanzar sus objetivos significa que usted también gana.

Resumen

Se espera que los científicos de datos hagan más que solo crear algoritmos y administrar grandes conjuntos de datos. El valor de los científicos de datos con experiencia proviene no solo de sus habilidades técnicas, sino también de sus habilidades perfeccionadas. La información y los algoritmos que los científicos crean datos impulsarán las decisiones de la gerencia superior. Por lo tanto, cualquier cosa que proporcionen debe ser comprensible para los directores y vicepresidentes que administran millones o miles de millones de dólares de personas, recursos, equipos, proyectos ... y todo lo demás en una empresa. Esto significa que para que un científico de datos crezca en valor para un negocio, debe aprender lo que el negocio encontrará valioso.