23 de Noviembre del 2020 - Jhonatan Montilla
Probablemente la mayoría de ustedes haya oído hablar de la publicación de Harvard Business Review llamada: "Científico de datos: el trabajo más sexy del siglo XXI", hay otros sitios de medios científicos y comerciales que apoyan esta posición y consideran la ciencia de datos como el mejor trabajo de la posmodernidad. La mayoría de la gente cree que el trabajo del profesional de datos solo consiste en construir modelos de aprendizaje automático, sin embargo, esto no es 100% cierto.
Al igual que yo, muchas personas se embarcan en la aventura de encontrar una nueva carrera que se adapte a sus intereses personales, a las condiciones cambiantes del mercado, o simplemente descubrimos una nueva pasión cuando leemos sobre aprendizaje automático, por lo que podemos tener la idea de convertirnos en analistas de datos. científico de datos, arquitecto de datos, ingeniero de datos, etc., sin embargo, durante el viaje de aprendizaje será necesario considerar algunos hechos importantes que nos permitirán confirmar si estamos en la hoja de ruta correcta para ser un buen profesional de datos.
En primer lugar, será necesario adaptar la idea de aprender constantemente sin descanso a lo largo de la carrera porque la ciencia de datos es un término extremadamente amplio, significa muchas cosas diferentes para cada empresa, por lo tanto, empresas de diferentes mercados esperan diferentes habilidades de un profesional de datos. algunas empresas requieren profesionales con conocimientos de aprendizaje automático, otras requieren habilidades de diseño experimental, otras programadores de Python, otros programadores de R, etc. Por lo tanto, muchas habilidades desarrolladas en una empresa o mercado específico no serán necesariamente una guía en una carrera profesional de datos. La ciencia de datos es un trabajo multidisciplinario, y este trabajo requiere tener un buen nivel de programación, estadísticas, matemáticas, comprensión empresarial, etc. Eso significa, un crecimiento constante en cualquiera de estas áreas. Es muy importante tener en cuenta que la ciencia de datos está en constante evolución, lo que significa que las tecnologías actuales creadas y probadas mejoran los procesos y modelos anteriores; por lo tanto, se espera que los profesionales de datos también aprendan esas nuevas tecnologías.
Mucha gente cree que un profesional de datos trabaja constantemente en cosas divertidas, como crear modelos de aprendizaje automático, sin embargo, esta actividad es una pequeña fracción del trabajo, aproximadamente menos del 25% del tiempo, es muy probable que un profesional de datos invierta mucho tiempo intentando comprender los datos, su origen, su manipulación (ETL), su preparación o análisis (EDA), etc. Un profesional de datos habrá evaluado todos los datos necesarios para desarrollar un buen modelo, de lo contrario, habrá establecido y desarrollado los canales necesarios para poder obtener los datos necesarios. El rendimiento del modelo está limitado por la calidad de los datos utilizados para crearlo, por lo tanto, es necesario realizar más actividades para, estas actividades se conocen en la comunidad de ciencia de datos como "trabajos sucios", un profesional de datos debe estar dispuesto a hacer estos trabajos sucios en para crear modelos efectivos de aprendizaje automático, así que tenga esto en cuenta cuando decida aventurarse en la ciencia de datos.
Para ser un buen profesional de datos es necesario tener habilidades de negociación, un profesional de datos es como un representante de ventas, será necesario vender ideas y nuevas iniciativas a las partes interesadas del negocio, es muy probable que los profesionales de datos estén constantemente presionando para obtener recursos adicionales, como nueva tecnología, más mano de obra, más almacenamiento, mejores flujos de trabajo, etc. Además, es muy probable que haya negociado entre la entrega a corto plazo y los modelos mejorados; en algunos casos, llevará más tiempo mejorarlos; a menudo, las partes interesadas del negocio pueden no ver el valor de mejorar la precisión de los modelos. Por lo tanto, la mayoría de las veces un profesional de datos debe ser un buen comunicador, es decir, transferir conocimientos a las partes interesadas que no tienen conocimientos técnicos, es probable que no entiendan los conceptos y el proyecto del profesional de datos en el que está trabajando. Por lo tanto, una actividad verdaderamente importante en el trabajo de un profesional de datos es comunicar, educar y ayudar a los compañeros de trabajo y las partes interesadas a comprender los conceptos y los propósitos del proyecto para ellos.
Un profesional de datos debe considerar dividir los proyectos de datos en varios pasos, a menudo las partes interesadas del negocio están muy preocupadas por el progreso de los proyectos, sienten una gran necesidad de saber cómo mejoran los proyectos de datos con el tiempo en lugar de esperar largos períodos de tiempo para obtener resultados satisfactorios, por lo tanto , es una responsabilidad comunicar los avances y resultados anteriores.
Un profesional de datos no recibe mucha ayuda al principio, por lo tanto, la responsabilidad solo recaerá sobre él o ella para hacer el trabajo al final del día, si por alguna razón se atasca, ya que los profesionales de datos tendrán que hacerlo. Ser lo suficientemente creativo y hábil para encontrar respuestas a preguntas y resolver los inconvenientes, si necesita aprender sobre cómo funciona un dispositivo específico, crear una API, etc., un profesional de datos debe ser hábil buscando en varias fuentes de información como ver videos en YouTube, leer documentación o trabajar en un Bootcamp para solucionar inconvenientes. Además, un profesional de datos debe tomar la iniciativa de programar reuniones con las partes interesadas relevantes para obtener más información sobre los objetivos comerciales, los resultados esperados, las métricas relevantes requeridas y cualquier otro requisito de los modelos de aprendizaje automático.
Un buen profesional de datos debe tener los recursos necesarios para estar en constante aprendizaje, realizar las actividades necesarias para crear modelos con la mayor precisión posible en función del tiempo de entrega disponible, tomar la iniciativa, ser persistente, tener la capacidad de comunicar conceptos e información, por último no menos importante, sea muy creativo e inteligente.