Presentaciones
Libretas
La librerías para Aprendizaje automático que vamos a usar
- Sci-Kit Learn, la librería más utilizada (por mucho).
- Para grandes cantidades de datos pyspark incluye el módulo
MLlib
para flujos de aprendizaje automático. - Y por último, el nuevo muchacho en el barrio: pycaret, que ha tenido un crecimiento importante recientemente.
Lecturas y enlaces recomendados
-
El sitio del curso Learning for Data de Yaser S.Abu-Mostafa de CalTech, es probablemente el mejor curso (no edulcorado) que conozco sobre aprendizaje supervisado. Le da un énfasis especial a entender los principios básicos antes de pasar a las técnicas particulares. El sitio incluye
-
Lecturas en youtube
-
Las presentaciones en pdf
-
Una liga al libro homónimo del curso
-
Tareas y proyecto
-
-
El curso de Machine Learning en Coursera de Andrew Ng es posiblemente el curso en linea más popular en Aprendizaje Automático. El profesor es magistral y explica los métodos sin requerir conocimientos en matemáticas, lo que hace que el curso sea a un nivel bastante superficial, pero muy recomendable.
-
The Elements of Statistical Learning el cual se encuentra en la biblioteca de la DCEN y la biblioteca digital. Muy teórico, para quien quiera profundizar mas en las bases del Aprendizaje Automñatico.
-
An Introduction to Statistical Learning de los mismos autores del libro de Elements pero a un nivel mas undergraduate, está la versión del libro con ejemplos en R y la versión con ejemplos en python.
-
Hands-On machine learning with scikit-learn and tensorflow : concepts, tools, and techniques to build intelligent systems es un texto muy aplicado, con mucho código y poca teoría. Es mi recomendación para buscar como hacer prácticamente cosas y no te gusta buscarlas en internet. Aquí dejo una liga con libretas jupyter con los ejemplos del libro
-
Los Tópicos de ML en Medium es un buen lugar para buscar artículos de divulgación y/o tutoriales bastante claros sobre diferentes técnicas de ML. Me parece que sin subscripción, tiene uno limitado el número de artículos a leer por día en Medium.
Repositorios de datos con problemas de aprendizaje automático
-
Kaggle es la puerta de entrada a básicamente la mayor parte de las habilidades en ML que se requieren. El sitio incluye:
-
Datos reales y sintéticos para practicar y aprender
-
Datos reales en competencias de aprendizaje automático (con premios en efectivo algunas veces)
-
Un sistema de libretas de jupyter en linea
-
Cursos sobre diferentes temas interesantes
-
Ejemplos de libretas útiles
-
-
UCI database repository Es el sitio más clásico (venerable y feo, por cierto) de conjuntos de datos para tareas de Aprendizaje Automático. Es un poco complicada la navegación y entender la organización de los datos, pero es realmente un muy buen sitio para escoger problemas a resolver.