Introducción

Curso Reconocimiento de Patrones LCC/UNISON

Presentaciones

  1. ¿Qué es el aprendizaje automático?

Libretas

  1. Introducción a pandas

  2. Preprocesamiento de características con Scikit-learn

La librerías para Aprendizaje automático que vamos a usar

  1. Sci-Kit Learn, la librería más utilizada (por mucho).
  2. Para grandes cantidades de datos pyspark incluye el módulo MLlib para flujos de aprendizaje automático.
  3. Y por último, el nuevo muchacho en el barrio: pycaret, que ha tenido un crecimiento importante recientemente.

Lecturas y enlaces recomendados

  1. El sitio del curso Learning for Data de Yaser S.Abu-Mostafa de CalTech, es probablemente el mejor curso (no edulcorado) que conozco sobre aprendizaje supervisado. Le da un énfasis especial a entender los principios básicos antes de pasar a las técnicas particulares. El sitio incluye

    1. Lecturas en youtube

    2. Las presentaciones en pdf

    3. Una liga al libro homónimo del curso

    4. Tareas y proyecto

  2. El curso de Machine Learning en Coursera de Andrew Ng es posiblemente el curso en linea más popular en Aprendizaje Automático. El profesor es magistral y explica los métodos sin requerir conocimientos en matemáticas, lo que hace que el curso sea a un nivel bastante superficial, pero muy recomendable.

  3. The Elements of Statistical Learning el cual se encuentra en la biblioteca de la DCEN y la biblioteca digital. Muy teórico, para quien quiera profundizar mas en las bases del Aprendizaje Automñatico.

  4. An Introduction to Statistical Learning de los mismos autores del libro de Elements pero a un nivel mas undergraduate, está la versión del libro con ejemplos en R y la versión con ejemplos en python.

  5. Hands-On machine learning with scikit-learn and tensorflow : concepts, tools, and techniques to build intelligent systems es un texto muy aplicado, con mucho código y poca teoría. Es mi recomendación para buscar como hacer prácticamente cosas y no te gusta buscarlas en internet. Aquí dejo una liga con libretas jupyter con los ejemplos del libro

  6. Los Tópicos de ML en Medium es un buen lugar para buscar artículos de divulgación y/o tutoriales bastante claros sobre diferentes técnicas de ML. Me parece que sin subscripción, tiene uno limitado el número de artículos a leer por día en Medium.

Repositorios de datos con problemas de aprendizaje automático

  1. Kaggle es la puerta de entrada a básicamente la mayor parte de las habilidades en ML que se requieren. El sitio incluye:

    1. Datos reales y sintéticos para practicar y aprender

    2. Datos reales en competencias de aprendizaje automático (con premios en efectivo algunas veces)

    3. Un sistema de libretas de jupyter en linea

    4. Cursos sobre diferentes temas interesantes

    5. Ejemplos de libretas útiles

  2. UCI database repository Es el sitio más clásico (venerable y feo, por cierto) de conjuntos de datos para tareas de Aprendizaje Automático. Es un poco complicada la navegación y entender la organización de los datos, pero es realmente un muy buen sitio para escoger problemas a resolver.