Los mejores cursos online de data science, big data y machine learning
15 junio 2020La cuarta revolución industrial ya está aquí. Se trata de la revolución de los datos. Cada vez se generan cantidades más ingentes de datos, de las que se puede obtener información y, como consecuencia de ello, conocimiento. Por todos es conocido la frase «la información es poder» y el conocimiento empresarial no es otra cosa que información contextualizada y entendida. Los datos en resumidas cuentas dan mucho dinero a cualquier empresa que sepa tratarlos, es por ello por lo que los profesionales que sepan tratar con estos datos, extrayendo el máximo de su valor, están muy cotizados a día de hoy.
Pero los trabajos relativos a datos no son triviales de realizar, siendo necesaria mucha formación en ellos. Existen muchas barreras de entrada y mucho gurú que vende cursos sin tener experiencia real importante y, por tanto, con cursos que cuanto menos son entretenidos pero poco útiles en el sentido práctico empresarial. Y es que la educación debe estar ligada a la empresa, ser por y para la empresa.
Los cursos de formación online son una forma muy útil de aprender data science (ciencia de datos), big data y machine learning (aprendizaje automático). Nos posibilita aprender con una gran flexibilidad y a nuestro ritmo. En este post intento hacer un compendio de cursos de formación online que son orientados a la empresa, con prestigio y de la mano de personas que realmente entienden lo que están haciendo.
Nivel básico
Esta serie de cursos están destinados a las personas que quieran aprender ciencia de datos, big data o machine learning desde cero. Parten de los conceptos fundamentales.
- Fundamentos de aprendizaje automático: Un enfoque basado en estudio de casos. Curso de la Universidad de Washington. Se debe dedicar un tiempo aproximado de entre 30 y 48 horas. Enseña casos prácticos para muchos de los problemas de machine learning, como regresiones o clasificaciones. Disponible en Coursera de forma gratuita. Idioma: Inglés.
- Especialización en ciencia de datos. Esta es una especialización compuesta de diez cursos. Se cubre todo el roadmap, empezando con conceptos de programación en R. Pretende ser un compendio de conceptos desde un nivel principiante. También disponible en Coursera de forma gratuita. Idioma: Inglés.
- Introducción al Big Data: Curso de la UC San Diego. Trata la problemática del Big Data y cómo se resuelve con algoritmos distribuidos. Es una buena introducción para conocer los conceptos del Big Data, donde tenemos muchísimos datos, intratables sin este tipo de tecnologías.
Nivel intermedio
En estos cursos el grado de especialización es algo mayor, teniendo más carga matemática y técnica. Algunos son teóricos y otros más técnicos pero todos requieren tener conocimientos previos.
- Machine Learning. Curso por antonomasia sobre aprendizaje automático. Se estructura en un total de once semanas y trata los fundamentos teóricos del aprendizaje automático desde un punto de vista aplicado y explicados de manera sencilla. Es impartido por Andrew Ng, al que muchos consideramos algo así como el premio Nobel del aprendizaje automático. Está disponible en Coursera de manera gratuita. Idioma: Inglés.
- Especialización en minería de datos. En concreto son de bastante interés los cursos «Recuperación de textos y motores de búsqueda» y «Minería de textos y análisis». Estos cursos constituyen una introducción a las técnicas clásicas de NLP, analítica de texto, buscadores y sistemas de recomendación. Idioma: Inglés.
- Modelización y gestión de Big Data. Curso de la UC San Diego. Está orientado a perfiles de ingeniería de datos, donde es necesaria una gestión y una modelización de las bases de datos. Ojo, no modelización estadística ni aprendizaje automático.
- Integración y procesamiento en Big Data. Un curso un poco al estilo del anterior. Orientado para ingenieros de datos.
- Machine Learning en Big Data. De la UC San Diego. Curso que trata cómo realizar modelos de aprendizaje automático sobre infraestructuras Big Data. No está especializado en Machine Learning ni data science, sino que es un curso de cómo aplicar data science y machine learning sobre un entorno de Big Data.
- Ingeniería de datos en Google Cloud Platform. Curso creado por Google para preparar el certificado de ingeniería de datos en Google Cloud. Trata temas como la construcción de pipelines de datos o sistemas en streaming.
Nivel avanzado
En este punto ya se debe haber realizado los de nivel intermedio o, al menos, tener unas bases teóricas.
- Especialización en modelos de grafos probabilísticos. Es una especialización formada por un conjunto de tres cursos: «Representación», «Inferencia» y «Aprendizaje». Trata modelos probabilísticos como son las redes bayesianas (Bayesian Networks) y las redes de Markov (Markov Networks). Los ejercicios prácticos son muy al detalle, lo que posibilita interiorizar los conceptos. Creado por la universidad de Stanford. Están disponibles en Coursera de manera gratuita. Idioma: Inglés.
- Especialización en Deep Learning (aprendizaje profundo). Esta especialización cubre un total de cinco cursos. Cuatro de ellos son sobre Deep Learning y redes neuronales y uno sobre cómo estructurar un proyecto de aprendizaje automático. Impartido por Andrew Ng, el gurú del aprendizaje automático. Requiere conocimientos en cursos previos. Están disponibles en Coursera de manera gratuita. Idioma: Inglés.
Iré poniendo poco a poco actualizando con más cursos.
Espero que os sea útil el artículo.
Saludos 🙂
Si te ha sido de utilidad este post, te agradecería que me apoyases en Patreon (donando una cantidad aunque sea poca ya sea una vez, o apoyándome mensualmente). Tener una web, dominio, hosting, no es gratis y me apoyas a seguir ayudando con la difusión de educación libre. Apóyame en Patreon! Mil gracias!!
¿Te ha parecido útil este artículo?
Hola Álvaro, gran artículo, gracias. Éste año acabaré el grado de Relaciones Internacionales y me gusta la investigación y narrativa con datos, tuvimos unas asignatura con «R» básico. ¿Hay algún master de datos para las Ciencias Sociales? saludos,
Hola, me ha gustado mucho el artículo y el contenido de tu blog. Quisiera conocer tu opinión acerca de dos especializaciones que he visto en Coursera aprovechando el período de certificaciones gratis:
– Ciencias de los Datos Aplicada con Python – Michigan
– Ciencia de Datos (en R) – Johns Hopkins
Me encuentro en un brete, como ingeniero industrial creo que el contenido de la segunda me será de más utilidad, sin embargo; me veo ahora mismo más inclinado por Python.
Muchas gracias de antemano.
A mi me gusta más Python porque es de propósito general y multiparadigma. Puedes hacer casi cualquier proyecto end-to-end con Python. Yo cogería el de Python. Por otro lado, me haría también los que recomiendo en el post, que son más teóricos.
Álvaro
Un articulo muy interesante! Yo acabo de empezar con la especialicación en ciencia de datos y de momento tiene muy buena pinta. Lo unico que me he quedado con ganas de saber es que lenguaje/s se usan en cada curso!
Muchas gracias por tu comentario José Daniel! En cuanto pueda pongo los lenguajes de cada curso, aunque lo más importante son los conceptos ya sabes 🙂
Estupendas recomendaciones! Muy útil, claro que sí!Gracias!
Muchas gracias Adriana!