Objectif
L’intelligence artificielle est aujourd’hui un sujet incontournable : nous la rencontrons au quotidien, et elle permet un nombre de nouvelles applications phénoménal. L’objectif de cette formation est de vous apprendre à comprendre les principaux enjeux de l’intelligence artificielle, et plus précisément du machine learning. Il aborde notamment l’implémentation de concepts d’IA en Python.
Prérequis
- Une maîtrise des bases de Python, des notions en mathématiques (algèbre, probabilités, statistiques) et un intérêt pour l'intelligence artificielle
À qui s'adresse la formation ?
Cette formation est destinée aux :
- Informaticiens
Programme
Section 1
Présentation du cours
Section 2
Introduction au Machine Learning
- Objectifs du module
- Les domaines de l’intelligence artificielle
- Définir le Machine Learning
- Les métiers du Machine Learning
- Les ingrédients du Machine Learning
- Exemples de tâches d’apprentissage
- La méthodologie CRISP-DM
- Conclusion
Section 3
L’environnement technique du Machine Learning
- Objectifs du module
- Les catégories d’outils
- Les langages du Machine Learning
- Anaconda
- Jupyter Notebook
- Démonstration – Anaconda
- TP à réaliser
- Conclusion
Section 4
Les librairies Python pour le Machine Learning
- Objectifs du module
- Panorama des librairies existantes
- Présentation de Numpy
- Création d’un tableau avec Numpy
- Accéder aux données avec Numpy
- Présentation de Pandas
- Les structures de données Pandas
- Manipuler les données avec Pandas
- Explorer les données avec Pandas
- Présentation de Matplotlib
- L’organisation des figures de Matplotlib
- Générer une figure avec Matplotlib
- Les types de graphes de Matplotlib
- Présentation de Seaborn
- Seaborn et Matplotlib
- Présentation de Scikit-learn
- Conclusion
- TP à réaliser
Section 5
Le travail sur les données
- Objectifs du module
- Le vocabulaire de la donnée
- Caractériser les données
- Statistiques
- Corrélation
- Etudier les visualisations
- Nettoyer les données
- Les problèmes de qualité
- Gérer les anomalies
- Gérer les données manquantes
- Préparer les données
- Encoder une image
- Encoder un texte
- Gérer les données catégorielles
- Normaliser les données
- Discrétiser les données
- Combiner les données
- Conclusion
- TP à réaliser
Section 6
L’apprentissage supervisé
- Objectifs du module
- Les formes d’apprentissage
- Présentation de l’apprentissage supervisé
- Classification et régression
- Les ingrédients de l’apprentissage supervisé
- Évaluer l’apprentissage supervisé
- Le surapprentissage
- Entraînement et test
- Validation croisée
- Implémentation avec Scikit-learn
- Métriques de classification
- Métriques de régression
- Implémentation avec Scikit-learn
- Arbre de décision : présentation
- Arbre de décision : algorithme
- Les mesures d’impureté
- Arbre de décision avec Scikit-learn
- Régression linéaire : présentation
- Régression polynomiale
- Régression avec Scikit-learn
- Régression et normalisation
- Conclusion
- TP à réaliser
Section 7
Les algorithmes de classification
- Objectifs du module
- Naive Bayes : présentation
- Probabilité et classification
- Théorème de Bayes
- Application aux variables continues
- Implémentation de Naive Bayes avec Scikit-learn
- La méthode des plus proches voisins : KNN
- Calculer les distances
- Principe de KNN
- Choisir la valeur de k
- Implémentation de KNN avec Scikit-learn
- Les machines à vecteurs de support : SVM
- Implémentation de SVM avec Scikit-learn
- Les réseaux de neurones : présentation
- Le perceptron
- Les calculs derrière le perceptron
- Les réseaux de neurones : les couches
- Les fonctions d’activation
- La rétropropagation
- Architecture d’un réseau
- Deep Learning
- Implémentation d’un réseau de neurones avec Scikit-learn
- Conclusion
- TP à réaliser
Section 8
L’apprentissage non supervisé
- Objectifs du module
- Le principe de l’apprentissage non supervisé
- Le clustering : présentation
- Les différents clusters possibles
- Les types de clustering
- K-means : algorithme
- K-means : les problématiques
- Méthode du coude
- Méthode silhouette
- Initialisation de k-means
- Implémentation de k-means avec Scikit-learn
- Clustering hiérarchique : présentation
- Clustering hiérarchique agglomératif
- Calculer la proximité entre les clusters
- Utiliser le dendrogramme
- Implémentation du clustering hiérarchique avec Scikit-learn
- Itemsets et associations : présentation
- Association : cas d’usage
- Association : vocabulaire
- Rechercher des règles d’association : algorithme Apriori
- Conclusion
- TP à réaliser
Section 9
Concepts avancés sur l’apprentissage
- Objectifs du module
- Principe de l’analyse en composantes principales
- Implémentation de l’ACP avec Scikit-learn
- Les méthodes ensemblistes : présentation
- Les méthodes ensemblistes : bagging
- Les méthodes ensemblistes : boosting
- Les forêts d’arbres aléatoires
- Le problème des données déséquilibrées
- Gérer des données déséquilibrées
- L’apprentissage semi-supervisé
- L’apprentissage par renforcement
- Conclusion
Section 10
Enjeux et risques de l’IA
- Objectifs du module
- Les risques de l’IA
- Les biais de l’IA
- Les utilisations malveillantes
- Les limites de l’IA
- Le cadre juridique
- Conclusion
Eligibilité CPF
💡 À noter : Cette formation est intégrée dans notre parcours certifiant, éligible au CPF.
RNCP37873BC02
RNCP37873BC02
Tarif - OPCO
2100 €
Modalités
Présentiel / Distanciel
Cours
5h22
TP
16h