My thoughts

My thoughts are personal, and I am not sure the world wants to hear them, but who knows, maybe one day I'll write them.

Some not so useless places on the net

Para no olvidar

A veces me cuesta creer que haya gente que siga negando que esto pasó. Por este motivo no puedo no compartirlo y dejarlo aquí fijado.

Malas practicas

Llevo un tiempo que cada vez que leo un paper sobre IA en industria me quiero llevar las manos a la cabeza. Las practicas que se aplican a los datos me preocupan, el test se aplica sobre los mismos datos de entrenamiento, cosa ok, pero en casos industriales, una medida y la siguiente lo más problable es que sean iguales. Del mismo modo no se suele usar un test de validación obtenido independientemente del test de entrenamiento/validación, haciendo que solo se aprendan sesgos y cualquier deriva en los datos no se pueda captar. Luego las matrices de confusión salen magnificas, baia.

Esto es de gran importancia entre la academia y la industria. Una explicación buena sobre errores típicos está en How to ensure model obsolescence (part 1): Fitting your test set and other terrible practices in ML y How to ensure model obsolescence (part 2): Data dredging .