15 junio 2020 7

Los mejores cursos online de data science, big data y machine learning

Por Alvaro

La cuarta revolución industrial ya está aquí. Se trata de la revolución de los datos. Cada vez se generan cantidades más ingentes de datos, de las que se puede obtener información y, como consecuencia de ello, conocimiento. Por todos es conocido la frase «la información es poder» y el conocimiento empresarial no es otra cosa…

25 mayo 2020 2

¿Qué es el sobreajuste u overfitting y por qué debemos evitarlo?

Por Alvaro

En este post voy a tratar el tema del sobreajuste (en inglés overfitting) en los modelos de aprendizaje automático. Es muy común que los científicos de datos, sobre todo los que están empezando y no tienen mucha experiencia, entrenen modelos y obtengan una métrica en entrenamiento que ellos creen que es muy buena. Luego, a…

24 febrero 2020 2

¿Cuál es la diferencia entre los métodos de bagging y los de boosting?

Por Alvaro

Los algoritmos consistentes en la combinación de algoritmos simples usando bagging y boosting son muy populares en Machine Learning. En competiciones online como Kaggle son de los que han demostrado ofrecer mejores resultados. Entre los métodos de aprendizaje automático más usados se encuentran el XGBoost, el Random Forest o el AdaBoost. Todos estos algoritmos de aprendizaje…

30 enero 2020 0

Mi opinión sobre el sector del data science y el big data

Por Alvaro

Este post va a ser un poco distinto a los que suelo escribir. No va a tratar sobre algoritmos, ni sobre cómo aprender ciencia de datos. Mi intención es compartir lo que pienso sobre el sector de la ciencia de datos (data science) y el big data, por lo que conozco de primera mano o por mis…

20 enero 2020 1

Tratamiento de clases desbalanceadas

Por Alvaro

La presencia de clases desbalanceadas es el día a día de la mayoría de científicos de datos. Este hecho es algo que ocurre muy a menudo en problemas de clasificación donde hay una diferencia muy grande entre el número de elementos de cada clase. El desbalanceo de clases aparece en entornos variados como pueden ser…

4 enero 2020 2

¿A qué se dedican los científicos, ingenieros y arquitectos de datos?

Por Alvaro

Científicos, ingenieros y arquitectos de datos (data scientists, data engineers y data architects en inglés) son tres profesiones o roles que a menudo se confunden. Las tareas que llevan a cabo son bastante diferentes aunque, sobre todo en el caso de los ingenieros de datos y los científicos de datos, es bastante habitual solaparlas. Digamos…

16 septiembre 2019 2

Comparando CPUs y GPUs para inteligencia artificial

Por Alvaro

En el mundo de la inteligencia artificial se habla mucho sobre coches autónomos, drones que persiguen un objetivo común (créditos a mi compañero Ricardo García Pinel) o robots que dan volteretas procesando los datos que obtienen de su entorno. Una de las cosas que tienen en común es la forma de procesar los datos que…

25 julio 2019 Desactivado

Mejores másteres de España para aprender data science y Big Data

Por Alvaro

En mi experiencia como científico de datos me han preguntado muchas veces «¿Qué másteres me recomendarías para aprender data science?». La respuesta que doy a esa pregunta suele ser siempre «Depende de lo que busques». En España hay másteres de distintos precios y tipos, por lo que creo que lo primero es saber cuál es…

8 abril 2019 16

Aprender ciencia de datos por tu cuenta

Por Alvaro

Hola a todos de nuevo! Varias personas me han preguntado últimamente «¿cómo puedo aprender ciencia de datos y aprendizaje automático?», «¿recomiendas algún libro o máster?», «si no sé programar, ¿qué debería hacer para aprender ciencia de datos?»… en este post intentaré dar mi visión de cómo aprender ciencia de datos por tu cuenta, ya que…

8 marzo 2019 5

Segmentación utilizando K-means en Python

Por Alvaro

La segmentación con técnicas estadísticas es muy usada en diversos problemas. En marketing son útiles los modelos estadísticos para segmentar o dividir poblaciones en grupos distintos. Esto permite realizar campañas diferentes a cada uno de los grupos. Los modelos estadísticos de segmentación también son empleados en procesamiento de imágenes así como en algoritmos de compresión de…