6 julio 2020 0

Inteligencia artificial para la detección del cáncer

Por Alvaro

El objetivo de este artículo es el de dar algo de visibilidad y agradecimiento a los creadores de aplicaciones de inteligencia artificial para la detección del cáncer. La inteligencia artificial no sólo se está utilizando en el diagnóstico y tratamiento del cáncer, sino que también está siendo usada en muchísimas enfermedades gracias al auge del…

27 junio 2020 0

El ciclo de vida de la ciencia de datos

Por Alvaro

En este post voy a tratar un tema del que no se suele hablar tanto como de los algoritmos, pero que es muy importante en el desarrollo de un proyecto de ciencia de datos o de big data. Este tema es el ciclo de vida de los proyectos. Creo que no sólo es necesario conocer…

19 junio 2020 0

La ciencia de datos y el machine learning contra el COVID-19

Por Alvaro

Hace unos días tuve la ocasión de dar un webinar gracias a la asociación Women in Big Data. Primero de todo me gustaría agradecer el papel que tiene la asociación en la ayuda para dotar de más diversidad al sector de la ciencia de datos y el big data. El objetivo de la charla fue…

15 junio 2020 6

Los mejores cursos online de data science, big data y machine learning

Por Alvaro

La cuarta revolución industrial ya está aquí. Se trata de la revolución de los datos. Cada vez se generan cantidades más ingentes de datos, de las que se puede obtener información y, como consecuencia de ello, conocimiento. Por todos es conocido la frase «la información es poder» y el conocimiento empresarial no es otra cosa…

25 mayo 2020 2

¿Qué es el sobreajuste u overfitting y por qué debemos evitarlo?

Por Alvaro

En este post voy a tratar el tema del sobreajuste (en inglés overfitting) en los modelos de aprendizaje automático. Es muy común que los científicos de datos, sobre todo los que están empezando y no tienen mucha experiencia, entrenen modelos y obtengan una métrica en entrenamiento que ellos creen que es muy buena. Luego, a…

24 febrero 2020 0

¿Cuál es la diferencia entre los métodos de bagging y los de boosting?

Por Alvaro

Los algoritmos consistentes en la combinación de algoritmos simples usando bagging y boosting son muy populares en Machine Learning. En competiciones online como Kaggle son de los que han demostrado ofrecer mejores resultados. Entre los métodos de aprendizaje automático más usados se encuentran el XGBoost, el Random Forest o el AdaBoost. Todos estos algoritmos de aprendizaje…

30 enero 2020 0

Mi opinión sobre el sector del data science y el big data

Por Alvaro

Este post va a ser un poco distinto a los que suelo escribir. No va a tratar sobre algoritmos, ni sobre cómo aprender ciencia de datos. Mi intención es compartir lo que pienso sobre el sector de la ciencia de datos (data science) y el big data, por lo que conozco de primera mano o por mis…

20 enero 2020 0

Tratamiento de clases desbalanceadas

Por Alvaro

La presencia de clases desbalanceadas es el día a día de la mayoría de científicos de datos. Este hecho es algo que ocurre muy a menudo en problemas de clasificación donde hay una diferencia muy grande entre el número de elementos de cada clase. El desbalanceo de clases aparece en entornos variados como pueden ser…