Los mejores cursos online de data science, big data y machine learning

Los mejores cursos online de data science, big data y machine learning

15 junio 2020 6 Por Alvaro

La cuarta revolución industrial ya está aquí. Se trata de la revolución de los datos. Cada vez se generan cantidades más ingentes de datos, de las que se puede obtener información y, como consecuencia de ello, conocimiento. Por todos es conocido la frase «la información es poder» y el conocimiento empresarial no es otra cosa que información contextualizada y entendida. Los datos en resumidas cuentas dan mucho dinero a cualquier empresa que sepa tratarlos, es por ello por lo que los profesionales que sepan tratar con estos datos, extrayendo el máximo de su valor, están muy cotizados a día de hoy.

Pero los trabajos relativos a datos no son triviales de realizar, siendo necesaria mucha formación en ellos. Existen muchas barreras de entrada y mucho gurú que vende cursos sin tener experiencia real importante y, por tanto, con cursos que cuanto menos son entretenidos pero poco útiles en el sentido práctico empresarial. Y es que la educación debe estar ligada a la empresa, ser por y para la empresa.

Los cursos de formación online son una forma muy útil de aprender data science (ciencia de datos), big data y machine learning (aprendizaje automático). Nos posibilita aprender con una gran flexibilidad y a nuestro ritmo. En este post intento hacer un compendio de cursos de formación online que son orientados a la empresa, con prestigio y de la mano de personas que realmente entienden lo que están haciendo.

Nivel básico

Esta serie de cursos están destinados a las personas que quieran aprender ciencia de datos, big data o machine learning desde cero. Parten de los conceptos fundamentales.

  • Fundamentos de aprendizaje automático: Un enfoque basado en estudio de casos. Curso de la Universidad de Washington. Se debe dedicar un tiempo aproximado de entre 30 y 48 horas. Enseña casos prácticos para muchos de los problemas de machine learning, como regresiones o clasificaciones. Disponible en Coursera de forma gratuita. Idioma: Inglés.
  • Especialización en ciencia de datos. Esta es una especialización compuesta de diez cursos. Se cubre todo el roadmap, empezando con conceptos de programación en R. Pretende ser un compendio de conceptos desde un nivel principiante. También disponible en Coursera de forma gratuita. Idioma: Inglés.
  • Introducción al Big Data: Curso de la UC San Diego. Trata la problemática del Big Data y cómo se resuelve con algoritmos distribuidos. Es una buena introducción para conocer los conceptos del Big Data, donde tenemos muchísimos datos, intratables sin este tipo de tecnologías.

Nivel intermedio

En estos cursos el grado de especialización es algo mayor, teniendo más carga matemática y técnica. Algunos son teóricos y otros más técnicos pero todos requieren tener conocimientos previos.

  • Machine Learning. Curso por antonomasia sobre aprendizaje automático. Se estructura en un total de once semanas y trata los fundamentos teóricos del aprendizaje automático desde un punto de vista aplicado y explicados de manera sencilla. Es impartido por Andrew Ng, al que muchos consideramos algo así como el premio Nobel del aprendizaje automático. Está disponible en Coursera de manera gratuita. Idioma: Inglés.
  • Especialización en minería de datos. En concreto son de bastante interés los cursos  «Recuperación de textos y motores de búsqueda» y «Minería de textos y análisis». Estos cursos constituyen una introducción a las técnicas clásicas de NLP, analítica de texto, buscadores y sistemas de recomendación. Idioma: Inglés.
  • Modelización y gestión de Big Data. Curso de la UC San Diego. Está orientado a perfiles de ingeniería de datos, donde es necesaria una gestión y una modelización de las bases de datos. Ojo, no modelización estadística ni aprendizaje automático.
  • Integración y procesamiento en Big Data. Un curso un poco al estilo del anterior. Orientado para ingenieros de datos.
  • Machine Learning en Big Data. De la UC San Diego. Curso que trata cómo realizar modelos de aprendizaje automático sobre infraestructuras Big Data. No está especializado en Machine Learning ni data science, sino que es un curso de cómo aplicar data science y machine learning sobre un entorno de Big Data.
  • Ingeniería de datos en Google Cloud Platform. Curso creado por Google para preparar el certificado de ingeniería de datos en Google Cloud. Trata temas como la construcción de pipelines de datos o sistemas en streaming.

Nivel avanzado

En este punto ya se debe haber realizado los de nivel intermedio o, al menos, tener unas bases teóricas.

  • Especialización en modelos de grafos probabilísticos. Es una especialización formada por un conjunto de tres cursos: «Representación», «Inferencia» y «Aprendizaje». Trata modelos probabilísticos como son las redes bayesianas (Bayesian Networks) y las redes de Markov (Markov Networks). Los ejercicios prácticos son muy al detalle, lo que posibilita interiorizar los conceptos. Creado por la universidad de Stanford. Están disponibles en Coursera de manera gratuita. Idioma: Inglés.
  • Especialización en Deep Learning (aprendizaje profundo). Esta especialización cubre un total de cinco cursos. Cuatro de ellos son sobre Deep Learning y redes neuronales y uno sobre cómo estructurar un proyecto de aprendizaje automático. Impartido por Andrew Ng, el gurú del aprendizaje automático. Requiere conocimientos en cursos previos. Están disponibles en Coursera de manera gratuita. Idioma: Inglés.

Iré poniendo poco a poco actualizando con más cursos.

Espero que os sea útil el artículo.

Saludos 🙂

¿Te ha parecido útil este artículo?

¡Comparte!