ARTÍCULOS VARIOS

  • Segmentación utilizando K-means en PythonSegmentación utilizando K-means en Python
    La segmentación con técnicas estadísticas es muy usada en diversos problemas. En marketing son útiles los modelos estadísticos para segmentar o dividir poblaciones en grupos distintos. Esto permite realizar campañas diferentes a cada uno de los grupos. Los modelos estadísticos de segmentación también son empleados en procesamiento de imágenes así como en algoritmos de compresión de… Leer más
    Alvaro  2019/03/08

  • El ciclo de vida de la ciencia de datosEl ciclo de vida de la ciencia de datos
    En este post voy a tratar un tema del que no se suele hablar tanto como de los algoritmos, pero que es muy importante en el desarrollo de un proyecto de ciencia de datos o de big data. Este tema es el ciclo de vida de los proyectos. Creo que no sólo es necesario conocer… Leer más
    Alvaro  2020/06/27

  • ¿Qué es SQL y para qué se utiliza?¿Qué es SQL y para qué se utiliza?
    SQL, o Structured Query Language (Lenguaje de Consulta Estructurado), es un lenguaje de programación fundamental en el ámbito de la gestión de bases de datos relacionales. En este artículo, exploraremos qué es SQL y cómo se utiliza en el mundo del machine learning y el análisis de datos. El SQL fue desarrollado por IBM en… Leer más
    Alvaro  2023/06/26

  • ¿Qué es el sobreajuste u overfitting y por qué debemos evitarlo?¿Qué es el sobreajuste u overfitting y por qué debemos evitarlo?
    En este post voy a tratar el tema del sobreajuste (en inglés overfitting) en los modelos de aprendizaje automático. Es muy común que los científicos de datos, sobre todo los que están empezando y no tienen mucha experiencia, entrenen modelos y obtengan una métrica en entrenamiento que ellos creen que es muy buena. Luego, a… Leer más
    Alvaro  2020/05/25