Cursus Data scientist
Suivez notre cursus Data scientist
et boostez votre carrière !
Eligible CPF et à plusieurs financements jusqu'à 100%
Être rappelé Accéder au programmeDémarche 3P
Notre centre de formation vous guide dans l’identification de la formation idéale, en vous aidant à maximiser les opportunités de financement.
Nous mettons toutes les clés en main pour un démarrage en toute confiance.
Vivez une expérience de formation immersive et intensive, conçue pour vous plonger dans des ateliers pratiques et des études de cas réels.
Apprenez en faisant, et développez des compétences concrètes directement applicables à vos futurs projets.
À la fin de votre parcours, nous évaluons vos compétences acquises, vous délivrons une certification attestant de votre expertise, et vous accompagnons pour assurer votre réussite dans vos projets professionnels.
Vous êtes désormais prêt à exceller !
Description de la formation
formation intensive pour acquérir les compétences fondamentales de la science des données, couvrant la collecte et le nettoyage des données, la visualisation, l'analyse exploratoire, ainsi que le machine learning et les outils adaptés.
Objectifs de la formation
À l’issue de cette formation, les participants seront capables de :
- Bloc 1 : Bases de la Data Science - Comprendre les bases de la data science et l'écosystème Python. Appliquer des concepts statistiques et débuter en machine learning supervisé.
- Bloc 2 : Techniques avancées en Machine Learning - Maîtriser les algorithmes non supervisés et le traitement des données textuelles et temporelles. Optimiser les modèles et introduire le Deep Learning.
- Bloc 3 : Projets avancés et industrialisation - Appliquer le Deep Learning à la vision par ordinateur et au NLP. Déployer des modèles et les superviser en production.
- Bloc 4 : Projet final et préparation professionnelle - Concevoir et implémenter un projet complet. Valider les compétences et se préparer aux certifications professionnelles.
A qui s'adresse cette formation ?
La formation est destinée à un large public, notamment :
La formation est destinée à un large public, notamment :
- Développeurs et ingénieurs logiciels souhaitant se spécialiser en data science.
- Analystes de données voulant renforcer leurs compétences en machine learning.
- Ingénieurs data intéressés par la gestion et le déploiement de pipelines de données.
- Chefs de projets techniques désirant comprendre la data science pour mieux gérer des projets IA.
- Chercheurs et étudiants en reconversion ou préparant des certifications professionnelles.
Pré-requis
Aucun pré-requis spécifique n'est nécessaire.
Programme de la formation
Bloc 1 : Bases de la Data Science (5 jours)
- Objectif : Comprendre les fondamentaux de la data science et l'écosystème Python.
- Contenu : Introduction à la data science, outils principaux (Python, Jupyter), manipulation de données avec pandas.
- Objectif : Explorer les structures et types de données.
- Contenu : Analyse exploratoire, gestion des données manquantes, visualisation avec Matplotlib et Seaborn.
- Objectif : Appliquer les bases mathématiques à l'analyse de données.
- Contenu : Statistiques descriptives, tests d'hypothèses, distributions, introduction aux probabilités.
- Objectif : Découvrir les techniques de machine learning supervisé.
- Contenu : Régression linéaire, régression logistique, évaluation des modèles (métriques, surapprentissage).
- Objectif : Maîtriser les algorithmes non supervisés.
- Contenu : Clustering (k-means, DBSCAN), réduction de dimensionnalité (ACP, t-SNE).
- Objectif : Manipuler les données spécifiques aux séries temporelles et au NLP.
- Contenu : Séries temporelles avec pandas, introduction au NLP avec spaCy et NLTK.
- Objectif : Optimiser les performances des modèles.
- Contenu : Méthodes d'ensemble (random forests, gradient boosting), tuning hyperparamètres avec GridSearchCV.
- Objectif : Comprendre les bases des réseaux neuronaux.
- Contenu : Perceptron, backpropagation, mise en place d’un modèle avec TensorFlow.
- Objectif : Appliquer le deep learning à la vision par ordinateur.
- Contenu : Réseaux convolutifs, applications à la classification d’images.
- Objectif : Exploiter les outils de NLP.
- Contenu : Techniques avancées : embeddings, transformers (BERT).
- Objectif : Mettre en œuvre un pipeline de déploiement.
- Contenu : API avec Flask, intégration cloud (AWS Sagemaker, Azure ML).
- Objectif : Superviser les modèles en production.
- Contenu : Introduction à MLflow, gestion de la dérive des données.
- Objectif : Concevoir un projet end-to-end.
- Contenu : Définition du problème, exploration des données, mise en place du pipeline de traitement.
- Objectif : Implémenter une solution performante.
- Contenu : Entraînement du modèle, tests et ajustements.
- Objectif : Valider les compétences.
- Contenu : Soutenance du projet, préparation aux certifications (AWS, Azure, GCP).
Atouts de la formation
- Approche pédagogique et modulaire: Alternance entre théorie et pratique pour une meilleure assimilation des concepts.
- Intégration Cloud: Forte orientation vers les solutions cloud et distribuées.
- Intervenants qualifiés: Formateurs spécialisés ayant une expérience concrète dans le domaine.
- Outils et supports pédagogiques: Accès à des ressources en ligne, des démonstrations en direct et des études de cas réelles.
- Accessibilité: Formation ouverte à tous, sans pré-requis techniques avancés.
- Mise en Pratique: Projet complet dès la fin des modules pour consolider les acquis.
- Préparation à l’Industrie: Focus sur les certifications et outils standards utilisés dans le milieu professionnel.
Méthodes pédagogiques et outils utilisés
- Démonstrations en direct avec des services de data science.
- Ateliers pratiques et études de cas réels dans des secteurs variés (industrie, commerce, santé).
- Retour d'expérience : Partage des meilleures pratiques et des erreurs courantes en entreprise.
- Simulations et outils : Utilisation de simulateurs pour des ateliers interactifs.
Evaluation
- QCM de fin de formation pour tester la compréhension des concepts abordés.
- Études de cas pratiques ou discussions de groupe pour mettre en application les connaissances acquises.
- Évaluation continue pendant les sessions pratiques.
- Mise en Pratique : Projet complet dès la fin des modules pour consolider les acquis.
Références Normatives
- Well-Architected cloud Framework.
- RGPD (Règlement Général sur la Protection des Données).
- ISO 27001, SOC 2 (Service Organization Control).
- NIST Cybersecurity Framework.
Modalités
Intra entreprise
La durée et le programme peuvent être personnalisés selon les besoins spécifiques de votre entreprise
Plus de détails Contactez-nousNext Generation Academy