ARTÍCULOS VARIOS

  • Big Data, ¿qué es y cómo funciona?Big Data, ¿qué es y cómo funciona?
    El término «Big Data» ha ganado gran relevancia en los últimos años a medida que nuestra capacidad para generar y almacenar datos ha aumentado exponencialmente. Pero, ¿qué es realmente el Big Data y cómo funciona? En este artículo, exploraremos este fascinante campo de estudio y su impacto en diversas industrias. ¿Qué es el Big Data?… Leer más
    Alvaro  2023/07/17

  • ¿Cuál es la diferencia entre los métodos de bagging y los de boosting?¿Cuál es la diferencia entre los métodos de bagging y los de boosting?
    Los algoritmos consistentes en la combinación de algoritmos simples usando bagging y boosting son muy populares en Machine Learning. En competiciones online como Kaggle son de los que han demostrado ofrecer mejores resultados. Entre los métodos de aprendizaje automático más usados se encuentran el XGBoost, el Random Forest o el AdaBoost. Todos estos algoritmos de aprendizaje… Leer más
    Alvaro  2020/02/24

  • Tratamiento de clases desbalanceadasTratamiento de clases desbalanceadas
    La presencia de clases desbalanceadas es el día a día de la mayoría de científicos de datos. Este hecho es algo que ocurre muy a menudo en problemas de clasificación donde hay una diferencia muy grande entre el número de elementos de cada clase. El desbalanceo de clases aparece en entornos variados como pueden ser… Leer más
    Alvaro  2020/01/20

  • ¿Cómo saber si una variable sigue una distribución normal en Python?¿Cómo saber si una variable sigue una distribución normal en Python?
    Saber si una variable sigue una distribución normal o no es muy importante en ciertos problemas de ciencia de datos y aprendizaje automático. Existen ciertos tests que nos permiten comprobar si una distribución sigue una forma normal o Gaussiana. Funciones de distribución Primero de todo quiero definir lo que es una función de distribución, para… Leer más
    Alvaro  2020/10/16