Categoría: machine learning

16 octubre 2020 8

¿Cómo saber si una variable sigue una distribución normal en Python?

Por Alvaro

Saber si una variable sigue una distribución normal o no es muy importante en ciertos problemas de ciencia de datos y aprendizaje automático. Existen ciertos tests que nos permiten comprobar si una distribución sigue una forma normal o Gaussiana. Funciones de distribución Primero de todo quiero definir lo que es una función de distribución, para…

25 mayo 2020 3

¿Qué es el sobreajuste u overfitting y por qué debemos evitarlo?

Por Alvaro

En este post voy a tratar el tema del sobreajuste (en inglés overfitting) en los modelos de aprendizaje automático. Es muy común que los científicos de datos, sobre todo los que están empezando y no tienen mucha experiencia, entrenen modelos y obtengan una métrica en entrenamiento que ellos creen que es muy buena. Luego, a…

20 enero 2020 2

Tratamiento de clases desbalanceadas

Por Alvaro

La presencia de clases desbalanceadas es el día a día de la mayoría de científicos de datos. Este hecho es algo que ocurre muy a menudo en problemas de clasificación donde hay una diferencia muy grande entre el número de elementos de cada clase. El desbalanceo de clases aparece en entornos variados como pueden ser…

8 abril 2019 25

Aprender ciencia de datos por tu cuenta

Por Alvaro

Hola a todos de nuevo! Varias personas me han preguntado últimamente «¿cómo puedo aprender ciencia de datos y aprendizaje automático?», «¿recomiendas algún libro o máster?», «si no sé programar, ¿qué debería hacer para aprender ciencia de datos?»… en este post intentaré dar mi visión de cómo aprender ciencia de datos por tu cuenta, ya que…

8 marzo 2019 6

Segmentación utilizando K-means en Python

Por Alvaro

La segmentación con técnicas estadísticas es muy usada en diversos problemas. En marketing son útiles los modelos estadísticos para segmentar o dividir poblaciones en grupos distintos. Esto permite realizar campañas diferentes a cada uno de los grupos. Los modelos estadísticos de segmentación también son empleados en procesamiento de imágenes así como en algoritmos de compresión de…

15 junio 2018 5

Regresión lineal en Python

Por Alvaro

En este artículo hablaré sobre la regresión lineal, seguramente el algoritmo más sencillo de aprendizaje supervisado dentro del paradigma del machine learning. Como ya comentamos en un post anterior, hay cuatro tipos de aprendizaje: supervisado, no supervisado, semi-supervisado y aprendizaje por refuerzo. Dentro de los supervisados se encuentra la regresión lineal, que es una herramienta…

26 mayo 2018 2

Tipos de aprendizaje automático

Por Alvaro

Como vimos en el primer post, el aprendizaje automático o machine learning consiste en un conjunto de algoritmos que aprenden y resuelven problemas gracias a la experiencia. Hay diversos tipos de problemas que se abordan con técnicas de machine learning, entre ellos se encuentran los problemas de clasificación (donde queremos predecir una clase), los de…

10 mayo 2018 0

Problemas comunes en aprendizaje automático

Por Alvaro

Después de hablar de qué es el aprendizaje automático, es bueno hacerse una idea de los tipos de problemas más típicos que se presentan en el campo de la ciencia de datos. Saber identificar nuestro problema es ciertamente útil ya que de esa forma podremos saber cómo abordarlo y qué técnicas y algoritmos usar para…

30 abril 2018 41

¿Qué es el aprendizaje automático o machine learning?

Por Alvaro

Palabras como aprendizaje automático, machine learning, big data, data science… están en la boca de todos. De hecho, la profesión de data scientist ha sido calificada como la más sexy del siglo XXI. Mucha gente habla de la revolución de los datos y la inteligencia artificial, pero, ¿qué es realmente el machine learning y por…