Habilidades esenciales de ciencia de datos para entusiastas
Publicado: 2018-06-26Los datos están literalmente creciendo a un ritmo exponencial, ¡hasta el punto de alcanzar los petabytes! ¿Podrías creer que el noventa por ciento de los datos del mundo se ha creado en los últimos dos años solamente? Con este volumen, la gestión de datos ha sido un asunto complicado. No es de extrañar que las habilidades esenciales de ciencia de datos hayan ocupado el asiento delantero.
Las cinco contras de Big Data
Big data a menudo se describe usando cinco vs. A saber: volumen, velocidad, variedad, veracidad y valor.
- 1. Volumen de datos se refiere a la gran cantidad de datos generados cada segundo, de todos los millones de dispositivos móviles en uso en estos días. Todos esos correos electrónicos, mensajes de Twitter, fotos, videoclips, datos de sensores y más que producimos son los datos más valiosos para muchas empresas.
- 2. La velocidad de los datos se refiere a la velocidad a la que se generan nuevos datos y la velocidad a la que se pueden trasladar de un lugar a otro para aumentar la rentabilidad.
- 3. La variedad de datos es con lo que todos podemos identificarnos. Datos, para la mayoría de las organizaciones, significaba bases de datos y hojas de Excel, en el pasado. Sin embargo, hoy en día los datos significan mucho más. El ochenta por ciento de los datos del mundo no están estructurados, piense en las fotos, los videos y las actualizaciones de Twitter que realiza.
- 4. La Veracidad de los datos se refiere al nivel de confiabilidad de los datos. Con los datos creciendo a tamaños magnánimos, es importante que intentemos mantener los datos lo más limpios posible, ya que los datos sucios son un virus que puede infligir dolor como ningún otro.
- 5. El valor de los datos es el verdadero valor de sus datos. Reúne una gran cantidad de datos y decide trabajar en ellos. Todo muy bien. Pero, ¿qué valor aportan los datos a su empresa? ¿Qué beneficio obtienes de invertir en datos es lo importante?
Por lo tanto, en caso de que se sienta atraído por el zumbido de los grandes datos y la ciencia de datos, le sugiero que consulte los cinco recursos que se enumeran a continuación.
1. Campo de datos
Datacamp es mejor para las personas con poca o ninguna experiencia en Python y R. Comienza con lo básico y tiene un enfoque gradual, en el que se presenta un problema tras otro. Es una bendición para los principiantes y tiene un precio dentro del rango económico.
Esté atento a los grandes descuentos que ofrece Datacamp, en caso de que desee suscribirse por un año y acceder al proyecto y las funciones premium. Tiene varias pistas que puedes dominar, que consisten en unos 20-30 cursos cada una. Las pistas populares incluyen:
- una. Científico de datos con Python
- b. Análisis Cuantitativo con R
- C. Manipulación de datos con Python
- d. Importación y limpieza de datos con R
- mi. Visualización de datos con R
Si tienes menos tiempo, también puedes hacer cursos más pequeños como:

- una. Introducción a Python para la ciencia de datos
- b. Introducción a R
- C. Unión de datos en PostgreSQL
- d. Intermedio R
2. Coursera
Coursera es una de las mejores plataformas para aprender cualquier cosa, desde ciencia de datos hasta historia militar, y lo he experimentado de primera mano. Puede optar por auditar los cursos y obtener acceso a los materiales del curso de forma gratuita. Algunos de los mejores cursos de ciencia de datos en Coursera son:
una. Análisis de datos y habilidades de presentación: el enfoque de PwC: esta especialización lo ayudará a obtener una experiencia práctica con el análisis de datos y el conocimiento sobre cómo convertir la inteligencia comercial en resultados del mundo real. Le brindará una mejor comprensión, filtrado y aplicación de datos que, a su vez, lo ayudarán a resolver problemas más rápido. Se volverá experto con Microsoft Excel, PowerPoint y otras herramientas comunes de comunicación y análisis de datos. Lo más importante es que aprenderá a leer datos y presentarlos.
b. Big Data, UCSD: en caso de que necesite comprender Big Data y cómo afectará su negocio, esta especialización es para usted. Podrá obtener experiencia práctica con las herramientas y los sistemas utilizados por los científicos e ingenieros de big data como Hadoop con MapReduce, Spark, Pig y Hive. Aprenderá a realizar modelos predictivos y aprovechar el análisis de gráficos para modelar problemas. En caso de que se esfuerce hasta el final, podrá completar un Proyecto final, desarrollado en colaboración con la empresa de software de datos Splunk, en el que podrá aplicar los conceptos básicos que aprendió.
C. Especialización en ciencia de datos de la Universidad Johns Hopkins: esta especialización cubre los conceptos y las herramientas que necesitará a lo largo de toda la ruta de datos, desde hacer el conjunto correcto de preguntas hasta hacer inferencias y publicar resultados en un formato que es simple pero poderoso. .
d. SQL para ciencia de datos, UC Davis: este curso está diseñado para brindarle una introducción a los fundamentos de SQL junto con el trabajo con datos que lo ayudarán a migrar a las necesidades de base de datos del mundo de la ciencia de datos. El curso comienza con los conceptos básicos y asume cero conocimientos de SQL. La complejidad crece constantemente y gradualmente tendrá que escribir consultas simples y complejas para ayudarlo a seleccionar datos de las tablas.
3. Banco de datos
Consulte Datastock en caso de que necesite conjuntos de datos web completos, limpios y listos para usar de diferentes industrias en todo el mundo. La solución es ideal para aquellos que buscan conjuntos de datos listos para usar para realizar análisis y obtener información y adquirir habilidades de ciencia de datos.
Lo bueno es que obtienes un conjunto de datos de muestra gratis antes de realizar la compra. Puede probar la calidad de los datos por sí mismo y luego decidir.
4. Kaggle
Kaggle es el lugar para realizar proyectos de ciencia de datos y uno de los sitios web más populares entre los científicos de datos en ciernes. Da varias opciones como:
- una. Comenzando su propio nuevo proyecto
- b. Explorar proyectos creados por otros
- C. Unirse a una de sus competiciones patrocinadas
5. Búsqueda de datos
Su método práctico le enseña todas las habilidades que necesita para convertirse en científico de datos, analista de datos o ingeniero de datos. Puedes aprender de varias maneras:
- una. Escribir código
- b. Trabajar con datos
- C. Proyectos de construcción
