24 febrero 2020 0

¿Cuál es la diferencia entre los métodos de bagging y los de boosting?

Por Alvaro

Los algoritmos consistentes en la combinación de algoritmos simples usando bagging y boosting son muy populares en Machine Learning. En competiciones online como Kaggle son de los que han demostrado ofrecer mejores resultados. Entre los métodos de aprendizaje automático más usados se encuentran el XGBoost, el Random Forest o el AdaBoost. Todos estos algoritmos de aprendizaje…

30 enero 2020 0

Mi opinión sobre el sector del data science y el big data

Por Alvaro

Este post va a ser un poco distinto a los que suelo escribir. No va a tratar sobre algoritmos, ni sobre cómo aprender ciencia de datos. Mi intención es compartir lo que pienso sobre el sector de la ciencia de datos (data science) y el big data, por lo que conozco de primera mano o por mis…

20 enero 2020 0

Tratamiento de clases desbalanceadas

Por Alvaro

La presencia de clases desbalanceadas es el día a día de la mayoría de científicos de datos. Este hecho es algo que ocurre muy a menudo en problemas de clasificación donde hay una diferencia muy grande entre el número de elementos de cada clase. El desbalanceo de clases aparece en entornos variados como pueden ser…

16 septiembre 2019 0

Comparando CPUs y GPUs para inteligencia artificial

Por Alvaro

En el mundo de la inteligencia artificial se habla mucho sobre coches autónomos, drones que persiguen un objetivo común (créditos a mi compañero Ricardo García Pinel) o robots que dan volteretas procesando los datos que obtienen de su entorno. Una de las cosas que tienen en común es la forma de procesar los datos que…

25 julio 2019 8

Mejores másteres de España para aprender data science y Big Data

Por Alvaro

En mi experiencia como científico de datos me han preguntado muchas veces “¿Qué másteres me recomendarías para aprender data science?”. La respuesta que doy a esa pregunta suele ser siempre “Depende de lo que busques”. En España hay másteres de distintos precios y tipos, por lo que creo que lo primero es saber cuál es…

8 abril 2019 2

Aprender ciencia de datos por tu cuenta

Por Alvaro

Hola a todos de nuevo! Varias personas me han preguntado últimamente “¿cómo puedo aprender ciencia de datos y aprendizaje automático?”, “¿recomiendas algún libro o máster?”, “si no sé programar, ¿qué debería hacer para aprender ciencia de datos?”… en este post intentaré dar mi visión de cómo aprender ciencia de datos por tu cuenta, ya que…

8 marzo 2019 0

Segmentación utilizando K-means en Python

Por Alvaro

La segmentación con técnicas estadísticas es muy usada en diversos problemas. En marketing son útiles los modelos estadísticos para segmentar o dividir poblaciones en grupos distintos. Esto permite realizar campañas diferentes a cada uno de los grupos. Los modelos estadísticos de segmentación también son empleados en procesamiento de imágenes así como en algoritmos de compresión de…

15 junio 2018 0

Regresión lineal en Python

Por Alvaro

En este artículo hablaré sobre la regresión lineal, seguramente el algoritmo más sencillo de aprendizaje supervisado dentro del paradigma del machine learning. Como ya comentamos en un post anterior, hay cuatro tipos de aprendizaje: supervisado, no supervisado, semi-supervisado y aprendizaje por refuerzo. Dentro de los supervisados se encuentra la regresión lineal, que es una herramienta…

26 mayo 2018 0

Tipos de aprendizaje automático

Por Alvaro

Como vimos en el primer post, el aprendizaje automático o machine learning consiste en un conjunto de algoritmos que aprenden y resuelven problemas gracias a la experiencia. Hay diversos tipos de problemas que se abordan con técnicas de machine learning, entre ellos se encuentran los problemas de clasificación (donde queremos predecir una clase), los de…