20 enero 2020 2

Tratamiento de clases desbalanceadas

Por Alvaro

La presencia de clases desbalanceadas es el día a día de la mayoría de científicos de datos. Este hecho es algo que ocurre muy a menudo en problemas de clasificación donde hay una diferencia muy grande entre el número de elementos de cada clase. El desbalanceo de clases aparece en entornos variados como pueden ser…

4 enero 2020 2

¿A qué se dedican los científicos, ingenieros y arquitectos de datos?

Por Alvaro

Científicos, ingenieros y arquitectos de datos (data scientists, data engineers y data architects en inglés) son tres profesiones o roles que a menudo se confunden. Las tareas que llevan a cabo son bastante diferentes aunque, sobre todo en el caso de los ingenieros de datos y los científicos de datos, es bastante habitual solaparlas. Digamos…

16 septiembre 2019 3

Comparando CPUs y GPUs para inteligencia artificial

Por Alvaro

En el mundo de la inteligencia artificial se habla mucho sobre coches autónomos, drones que persiguen un objetivo común (créditos a mi compañero Ricardo García Pinel) o robots que dan volteretas procesando los datos que obtienen de su entorno. Una de las cosas que tienen en común es la forma de procesar los datos que…

25 julio 2019 Desactivado

Mejores másteres de España para aprender data science y Big Data

Por Alvaro

En mi experiencia como científico de datos me han preguntado muchas veces «¿Qué másteres me recomendarías para aprender data science?». La respuesta que doy a esa pregunta suele ser siempre «Depende de lo que busques». En España hay másteres de distintos precios y tipos, por lo que creo que lo primero es saber cuál es…

8 abril 2019 25

Aprender ciencia de datos por tu cuenta

Por Alvaro

Hola a todos de nuevo! Varias personas me han preguntado últimamente «¿cómo puedo aprender ciencia de datos y aprendizaje automático?», «¿recomiendas algún libro o máster?», «si no sé programar, ¿qué debería hacer para aprender ciencia de datos?»… en este post intentaré dar mi visión de cómo aprender ciencia de datos por tu cuenta, ya que…

8 marzo 2019 6

Segmentación utilizando K-means en Python

Por Alvaro

La segmentación con técnicas estadísticas es muy usada en diversos problemas. En marketing son útiles los modelos estadísticos para segmentar o dividir poblaciones en grupos distintos. Esto permite realizar campañas diferentes a cada uno de los grupos. Los modelos estadísticos de segmentación también son empleados en procesamiento de imágenes así como en algoritmos de compresión de…

15 junio 2018 5

Regresión lineal en Python

Por Alvaro

En este artículo hablaré sobre la regresión lineal, seguramente el algoritmo más sencillo de aprendizaje supervisado dentro del paradigma del machine learning. Como ya comentamos en un post anterior, hay cuatro tipos de aprendizaje: supervisado, no supervisado, semi-supervisado y aprendizaje por refuerzo. Dentro de los supervisados se encuentra la regresión lineal, que es una herramienta…

26 mayo 2018 2

Tipos de aprendizaje automático

Por Alvaro

Como vimos en el primer post, el aprendizaje automático o machine learning consiste en un conjunto de algoritmos que aprenden y resuelven problemas gracias a la experiencia. Hay diversos tipos de problemas que se abordan con técnicas de machine learning, entre ellos se encuentran los problemas de clasificación (donde queremos predecir una clase), los de…

10 mayo 2018 0

Problemas comunes en aprendizaje automático

Por Alvaro

Después de hablar de qué es el aprendizaje automático, es bueno hacerse una idea de los tipos de problemas más típicos que se presentan en el campo de la ciencia de datos. Saber identificar nuestro problema es ciertamente útil ya que de esa forma podremos saber cómo abordarlo y qué técnicas y algoritmos usar para…

30 abril 2018 41

¿Qué es el aprendizaje automático o machine learning?

Por Alvaro

Palabras como aprendizaje automático, machine learning, big data, data science… están en la boca de todos. De hecho, la profesión de data scientist ha sido calificada como la más sexy del siglo XXI. Mucha gente habla de la revolución de los datos y la inteligencia artificial, pero, ¿qué es realmente el machine learning y por…