ARTÍCULOS VARIOS

  • ¿Cuál es la diferencia entre los métodos de bagging y los de boosting?¿Cuál es la diferencia entre los métodos de bagging y los de boosting?
    Los algoritmos consistentes en la combinación de algoritmos simples usando bagging y boosting son muy populares en Machine Learning. En competiciones online como Kaggle son de los que han demostrado ofrecer mejores resultados. Entre los métodos de aprendizaje automático más usados se encuentran el XGBoost, el Random Forest o el AdaBoost. Todos estos algoritmos de aprendizaje… Leer más
    Alvaro  2020/02/24

  • ¿A qué se dedican los científicos, ingenieros y arquitectos de datos?¿A qué se dedican los científicos, ingenieros y arquitectos de datos?
    Científicos, ingenieros y arquitectos de datos (data scientists, data engineers y data architects en inglés) son tres profesiones o roles que a menudo se confunden. Las tareas que llevan a cabo son bastante diferentes aunque, sobre todo en el caso de los ingenieros de datos y los científicos de datos, es bastante habitual solaparlas. Digamos… Leer más
    Alvaro  2020/01/04

  • ¿Cómo saber si una variable sigue una distribución normal en Python?¿Cómo saber si una variable sigue una distribución normal en Python?
    Saber si una variable sigue una distribución normal o no es muy importante en ciertos problemas de ciencia de datos y aprendizaje automático. Existen ciertos tests que nos permiten comprobar si una distribución sigue una forma normal o Gaussiana. Funciones de distribución Primero de todo quiero definir lo que es una función de distribución, para… Leer más
    Alvaro  2020/10/16

  • Tratamiento de clases desbalanceadasTratamiento de clases desbalanceadas
    La presencia de clases desbalanceadas es el día a día de la mayoría de científicos de datos. Este hecho es algo que ocurre muy a menudo en problemas de clasificación donde hay una diferencia muy grande entre el número de elementos de cada clase. El desbalanceo de clases aparece en entornos variados como pueden ser… Leer más
    Alvaro  2020/01/20