Cómo crear el equipo perfecto de ciencia de datos: PromptCloud

Publicado: 2018-07-10
Mostrar tabla de contenido
Las personas que necesitará en un equipo de ciencia de datos
¿Cómo trabajan las personas en equipo?
Qué buscar en un-
Ingeniero de datos:
Científico de datos:
Administrador de datos:

En caso de que haya decidido hacer crecer su negocio, con el apoyo de los datos, y haya decidido armar un equipo de ciencia de datos de personas con experiencia, es muy importante tener en cuenta que la ciencia de datos es un deporte de equipo y necesita contratar personas que trabajan mejor en equipo, sin importar cuáles sean sus capacidades individuales. Se necesita un gran grupo de personas, que hayan trabajado en diferentes entornos, que se unan y trabajen juntas para resolver proyectos prácticos de ciencia de datos. Entonces, ¿a quién incluiría su equipo ideal de ciencia de datos?

Los científicos de datos, que serán los motores impulsores de la innovación en los proyectos.

Los gerentes de proyecto, para asegurarse de que todos se ciñan a un cronograma y que los proyectos se conviertan en experimentos científicos en caja.

Ingenieros de datos que realizarían y desarrollarían la infraestructura.

Las personas que tienen contactos externos, para ayudar a obtener datos y comentarios, son las principales personas involucradas en los puestos de gestión.

Las personas que necesitará en un equipo de ciencia de datos

Un ingeniero de datos es una persona que tendría que ocuparse de configurar la infraestructura y el entorno necesarios y también convertir algoritmos e ideas teóricos en código y aplicaciones en ejecución. Podría construir una base de datos o extraer datos de esa base de datos para que la gente los analice. También podría tener que convertir ideas en productos de aprendizaje automático a nivel de producción y convertirlos en un modelo cliente-servidor, para que puedan aplicarse a una enorme base de datos de observaciones, o incluso ejecutarse en tiempo real, para que el producto utilice datos, para ser más inteligente con el tiempo.

Entonces, un científico de datos podría ser alguien que sacaría datos de una base de datos, los analizaría, realizaría experimentos en ellos, los visualizaría y comunicaría esos resultados al gerente de ciencia de datos y a otras personas en la organización que luego moverán las cosas. delantero. A menudo, un científico de datos pasará la implementación de cualquier algoritmo de aprendizaje automático o algoritmo de predicción que desarrollen al ingeniero de datos, quien luego se asegurará de que el programa pueda ejecutarse a escala.

La tercera persona clave es el gerente de ciencia de datos, la persona a cargo de mantener el equipo en su lugar y funcionando de manera eficiente. En un mundo ideal, es posible que ni siquiera haya necesitado un administrador de ciencia de datos, pero luego, el administrador de ciencia de datos se asegura de que todos interactúen entre sí y que las cosas sigan avanzando. También reclutan y construyen el equipo de ciencia de datos, interactúan con la alta dirección de la organización y los colaboradores que están al mismo nivel en toda la organización, para asegurarse de que transmiten toda la información.

Anuncian los hallazgos del equipo de ciencia de datos a otras personas y sus capacidades y alientan a las personas a traer sus problemas al equipo.

¿Cómo trabajan las personas en equipo?

Trabajan juntos como una unidad y, a menudo, cada una de estas personas trabaja en proyectos individuales o subproblemas individuales de un problema de ciencia de datos y luego se juntan y tienen reuniones grupales conjuntas y presentaciones conjuntas, donde discuten sus ideas y el retos a los que se enfrentan. También interactúan con personas externas para obtener información y lo que creen que sería atractivo para los clientes. También deben mantener a todos actualizados sobre los costos regulares de infraestructura, así como los costos mensuales como AWS y más.

Qué buscar en un-

Ingeniero de datos:

Así que comienza su búsqueda, encontrando al ingeniero de datos perfecto para su equipo. Pero, ¿quién debería ser esa persona perfecta?

Necesitan tener un gran conocimiento de hardware, tanto en términos de almacenamiento como de computación, junto con conocimientos de software de base de datos. Estarás lidiando con una gran cantidad de datos. Entonces, estas cualidades son muy importantes para ejecutar a escala esos procesos de datos y esos algoritmos de predicción de datos que ha desarrollado, sin ninguna interrupción. También necesitan saber lo suficiente sobre ciencia de datos y algoritmos para interactuar con el resto de los miembros del equipo de ciencia de datos. Aunque los antecedentes de los ingenieros de datos suelen ser la informática y la ingeniería informática, no existe una regla tan estricta y rápida, y también podrían provenir de otros lugares. Pueden provenir de un entorno cuantitativo y pueden haber adquirido algunos conocimientos de informática sobre la marcha, a través de cursos en línea en Coursera o tal vez tomaron algunos cursos en persona. Es posible que también necesiten saber cómo hacer cosas como la implementación y la ejecución de algoritmos complejos utilizando software como Hadoop, que es una infraestructura de procesamiento paralelo. Ahora bien, no es necesariamente cierto que necesitan saber cualquiera de estas últimas palabras de moda. Pero es cierto que necesitan tener la combinación de habilidades que les permita construir una infraestructura de datos que sea mantenible y construida a escala.

Y nuevamente, necesitan poder resolver problemas triviales por sí mismos. De nuevo, se trata de una persona que a menudo será una de las pocas personas que es el único responsable de la infraestructura de datos. Y así, a menudo necesitan poder responder algunas preguntas por sí mismos. Necesitan poder salir y recopilar información diversa de Internet. Necesitan poder hacer preguntas y averiguar cuál es el hardware adecuado, ya sea en línea oa través de foros. Deben conocer las medidas y protocolos de seguridad. El rol no está bien definido en el sentido de que aparecen nuevas funciones y plataformas cada dos días. Entonces, el ingeniero de datos debe saber qué herramienta elegir y qué tecnología integrar, y así sucesivamente.

Científico de datos:

No puede crear un equipo de ciencia de datos que no tenga uno o más científicos de datos, ya que actúan como el motor del automóvil. Un científico de datos debe tener el conjunto de habilidades que le permitan realizar todas las tareas relacionadas con la investigación, el análisis y el descubrimiento que podría necesitar hacer en el día a día. Si se encuentra en una etapa muy temprana y está contratando a su primer equipo de ciencia de datos, es posible que tengan que ser un poco más expertos en todos los oficios. Es posible que necesiten poder hacer partes de ingeniería de datos, así como ciencia de datos. En general, deben poder hacer estadísticas además de codificar. Necesitan saber bastante sobre predicción y aprendizaje automático. Esas son dos tareas diferentes, inferencia y predicción. Es importante saber que algunas personas serán mejores en uno y algunas personas serán mejores en el otro. Todo se reduce a lo que está haciendo su organización. Si está haciendo más, construyendo herramientas predictivas, es posible que deban ser un poco más fuertes en el aprendizaje automático.

Pero si le gustan más los experimentos y necesita formular nuevas hipótesis, es posible que deban ser un poco mejores en estadísticas e inferencias. Al final del juego, deben realizar la inferencia estadística o la predicción que necesitan para procesar los datos y luego comunicar esos resultados. Por lo tanto, las habilidades de comunicación de datos implican poder analizar los datos y crear visualizaciones inteligentes para comunicar esos hallazgos y predicciones de una manera que las personas sin idea de ciencia de datos entiendan cómo los datos están asociados con un problema comercial de la vida real. R y Python son los más populares entre los científicos, e incluso si no saben ambos, uno puede aprender fácilmente sobre la marcha. Saber algún tipo de visualización como angular.js sería una ventaja. Tendrían experiencia con al menos una base de datos: MongoDB, SQL, Cassandra o PostgreSQL, donde realmente interactuaron extrayendo datos de una base de datos.

Administrador de datos:

El último y probablemente el miembro más importante del equipo de ciencia de datos es un administrador de ciencia de datos. Aunque pueda parecer que no hay necesidad de administrar un equipo adulto y experimentado de analistas de datos, científicos e ingenieros, sin un administrador de datos, el equipo podría incluso desmoronarse, debido a choques de ego, una diferencia de opinión. , etc. Funcionan como puentes de comunicación entre los miembros del equipo de ciencia de datos y también son responsables de identificar y reclutar nuevas personas. Ayudan a todos a identificar sus objetivos y prioridades personales, identifican los problemas dentro de una organización que necesitan ser resueltos por la ciencia de datos y colocan a las personas adecuadas en el problema correcto.

Entonces, ¿es hora de ponerse el cinturón de seguridad, crear el equipo adecuado y vencer al mundo en la búsqueda de datos?