ARTÍCULOS VARIOS

  • ¿Qué es el sobreajuste u overfitting y por qué debemos evitarlo?¿Qué es el sobreajuste u overfitting y por qué debemos evitarlo?
    En este post voy a tratar el tema del sobreajuste (en inglés overfitting) en los modelos de aprendizaje automático. Es muy común que los científicos de datos, sobre todo los que están empezando y no tienen mucha experiencia, entrenen modelos y obtengan una métrica en entrenamiento que ellos creen que es muy buena. Luego, a… Leer más
    Alvaro  2020/05/25

  • Tratamiento de clases desbalanceadasTratamiento de clases desbalanceadas
    La presencia de clases desbalanceadas es el día a día de la mayoría de científicos de datos. Este hecho es algo que ocurre muy a menudo en problemas de clasificación donde hay una diferencia muy grande entre el número de elementos de cada clase. El desbalanceo de clases aparece en entornos variados como pueden ser… Leer más
    Alvaro  2020/01/20

  • Segmentación utilizando K-means en PythonSegmentación utilizando K-means en Python
    La segmentación con técnicas estadísticas es muy usada en diversos problemas. En marketing son útiles los modelos estadísticos para segmentar o dividir poblaciones en grupos distintos. Esto permite realizar campañas diferentes a cada uno de los grupos. Los modelos estadísticos de segmentación también son empleados en procesamiento de imágenes así como en algoritmos de compresión de… Leer más
    Alvaro  2019/03/08

  • Aprender ciencia de datos por tu cuentaAprender ciencia de datos por tu cuenta
    Hola a todos de nuevo! Varias personas me han preguntado últimamente «¿cómo puedo aprender ciencia de datos y aprendizaje automático?», «¿recomiendas algún libro o máster?», «si no sé programar, ¿qué debería hacer para aprender ciencia de datos?»… en este post intentaré dar mi visión de cómo aprender ciencia de datos por tu cuenta, ya que… Leer más
    Alvaro  2019/04/08