DU Data scientist

Acc¨¦der aux sections de la fiche

Call to actions

Contact Formation Continue: F¨¦lix VAZ
033 4 73 40 70 08
felix.vaz@uca.fr

Contact Formation Initiale: Dominique BRUGIERE
+33 4 73 40 70 04
Dominique.BRUGIERE@uca.fr

D¨¦tails

Publi¨¦ le 17 novembre 2020

Pr¨¦sentation

Le Dipl?me Universitaire Data Scientist propose depuis son ouverture en Septembre 2018 des enseignements dans le domaine des Data Sciences ¨¤ des professionnels et ¨¤ des ¨¦tudiants. La formation dure un an et repose sur 8 Unit¨¦s d'Enseignement (UE) compl¨¦mentaires:
  • UE 1: Analyse de donn¨¦es avec Python: 25h (11-15 Septembre 2023)
  • UE 2: Statistiques avanc¨¦es: 20h (9-13 Octobre 2023)
  • UE 3: Machine Learning: 20h (11-15 D¨¦cembre 2023)
  • UE 4: Fouille de donn¨¦es et Big data: 20h (13-17 Novembre 2023)
  • UE 5: Data engineering: 30h (18-22 Mars 2024)
  • UE 6: Outils statistiques - logiciel R: 20h (8-12 Avril 2024)
  • UE 7: S¨¦ries temporelles: 20h (13-17 Mai 2024)
  • UE 8: Deep Learning: 20h (29 Janvier - 2 F¨¦vrier 2024)
Chaque UE laisse une place significative aux exercices et sessions pratiques sur machine r¨¦alis¨¦s ¨¤ l¡¯aide de l¡¯environnement interactif open-source Jupyter Notebook et du service web de gestion et d¡¯h¨¦bergement de logiciels github.
La formation a lieu ¨¤ l'UCA, campus des C¨¦zeaux, Aubi¨¨re, sauf pour L¡¯UE 5 ? Data Engineering ? qui se d¨¦roule au Centre de Calcul du CNRS, ¨¤ Villeurbanne. Les UE de la formation se d¨¦roulent chacune sur une semaine au cours de l'ann¨¦e. Les UE 1-4 ont lieu de Septembre ¨¤ Janvier, les UE 5-8 ont lieu de Janvier ¨¤ Mai.  Le dipl?me universitaire est d¨¦livr¨¦ si au moins 5 UE (choisies parmi les 8) sont valid¨¦es. Les UE forment un ensemble auto-coh¨¦rent et peuvent aussi ¨ºtre propos¨¦es individuellement ¨¤ la Formation Continue.
Les enseignements sont dispens¨¦s par des chercheurs et enseignants-chercheurs du Laboratoire de Physique de Clermont (LPC), du Laboratoire d¡¯Informatique, de Mod¨¦lisation et d¡¯Optimisation des Syst¨¨mes (LIMOS), du Laboratoire de Math¨¦matiques (LMBP) et de l'Institut Pascal (IP). La formation s'appuie sur les recherches conduites dans ces laboratoires, en particulier elle b¨¦n¨¦ficie de l¡¯implication de ses intervenants dans de nombreuses exp¨¦riences scientifiques (certaines de dimension internationale comme le CERN) et de leur expertise dans le domaine des Data Science: analyse de grande masses de donn¨¦es, traitement d¡¯image, robotique, machine learning, m¨¦thodes et algorithmes statistiques, informatique, calcul et intelligence artificielle.

Enjeux

Le terme Data Science recouvre un ensemble de connaissances et de comp¨¦tences permettant d¡¯exploiter de (grandes) quantit¨¦s de donn¨¦es ¨¤ l¡¯aide d¡¯outils d¡¯analyse statistiques modernes. L¡¯ensemble des m¨¦thodes employ¨¦es, connues parfois sous les d¨¦nominations d¡¯intelligence artificielle, fouille de donn¨¦es ou bien encore ? big data ? vise ¨¤ extraire de syst¨¨mes complexes des informations permettant, entre autres, la visualisation, la classification et la mod¨¦lisation des donn¨¦es. Des m¨¦tiers sp¨¦cifiques sont apparus au cours des derni¨¨res ann¨¦es autour de ces th¨¦matiques, et la demande d¡¯experts en traitement de donn¨¦es, les ? Data Scientists ?, est en pleine croissance dans de nombreux domaines scientifiques et socio-¨¦conomiques.Les comp¨¦tences globales propos¨¦es par la formation sont les suivantes : ma?triser des concepts statistiques avanc¨¦s, utiliser des techniques modernes de calcul et de traitement des donn¨¦es, pratiquer des m¨¦thodes d¡¯analyse pr¨¦dictive et d¡¯optimisation, impl¨¦menter des algorithmes d¡¯apprentissage supervis¨¦ et non supervis¨¦.L¡¯ensemble de ces comp¨¦tences est mis en ?uvre dans les champs disciplinaires des chercheurs et enseignants-chercheurs qui portent cette formation.

Sp¨¦cificit¨¦s

Le Centre de Calcul de l¡¯Institut National de Physique Nucl¨¦aire et de Physique des Particules (CC-IN2P3 ¨¤ Villeurbanne, https://cc.in2p3.fr/) est un partenaire sur lequel s¡¯adosse la formation. Ce grand centre de calcul du CNRS dispose d¡¯une expertise et d¡¯un savoir-faire technologique de renomm¨¦e internationale, en particulier dans le domaine du calcul intensif sur grille informatique (grid computing). L'UE ? Data engineering ? (UE5) a ¨¦t¨¦ con?ue en partenariat avec les ing¨¦nieurs du CC-IN2P3 et se d¨¦roule dans les locaux du centre.

Lieux

Aubi¨¨re

Centre de Calcul de l¡¯Institut National de Physique Nucl¨¦aire et de Physique des Particules, Villeurbanne.

Responsable(s) de la formation

DONINI Julien
Email: Julien.DONINI@uca.fr

Admission

  • Formation(s) requise(s)

    Des connaissances de base en informatique (notions de programmation) et math¨¦matiques (notions de probabilit¨¦s et statistiques) sont requises pour profiter au mieux des enseignements avanc¨¦s propos¨¦s. Les enseignements sont donn¨¦s en anglais et un bonne ma?trise de la langue anglaise est requise (niveau B2).
  • Conditions d'admission / Modalit¨¦s de s¨¦lection

    L¡¯admission, pour la Formation Initiale (FI) et Continue (FC), repose sur un dossier de candidature : CV, lettre de motivation, relev¨¦ de notes des ann¨¦es pr¨¦c¨¦dentes pour la FI, descriptif des comp¨¦tences en informatique et math¨¦matiques pour la FC. Des entretiens individuels pourront ¨¦galement ¨ºtre mis en place si n¨¦cessaire.Pour les ¨¦tudiants inscrits en formation initiale un niveau Bac+4 dans un cursus scientifique est requis.

    Dossier de candidature: /medias/fichier/dossier-candidature-du-ds-2023-2024_1683011634667-docx

     

Programme

Les informations ci-dessous sont donn¨¦es ¨¤ titre indicatif et peuvent faire l'objet de mises ¨¤ jour.
 / 1
  • Le DU ne comporte pas de stage. N¨¦anmoins les ¨¦tudiants en formation initiale n¡¯¨¦tant pas inscrits en Master doivent r¨¦aliser un projet tutor¨¦ avec immersion en entreprise d¡¯une dur¨¦e de 50h. Les projets seront suivis par l¡¯¨¦quipe enseignante du DU.

Et apr¨¨s ?

Comp¨¦tences vis¨¦es

Activit¨¦s vis¨¦es / comp¨¦tences attest¨¦es

Comp¨¦tences acquises pendant la formation:
Ma?triser des concepts statistiques avanc¨¦s
Programmer avec des logiciels d'analyse statistique (R, Python)
Appliquer des m¨¦thodes d¡¯analyse pr¨¦dictive
Construire des mod¨¨les statistiques
Appliquer des m¨¦thodes de classification et de r¨¦gression
Utiliser des librairies de Machine Learning (scikit-learn, Pytorch)
Impl¨¦menter des algorithmes d¡¯apprentissage supervis¨¦ (r¨¦seaux de neurones)
Comprendre les probl¨¦matiques du "Big Data"
Utiliser des techniques de fouille de donn¨¦es
Conna?tre les probl¨¦matiques li¨¦es au calcul
Savoir choisir le stockage le plus adapt¨¦ (cloud, bases de donn¨¦es SQL et NoSQL)
Utiliser un Notebook de type Jupyter pour mener une analyse de donn¨¦es

Insertion professionnelle

Le Dipl?me Universitaire offre des d¨¦bouch¨¦s vari¨¦s dans plusieurs secteurs, tels que :
M¨¦tiers de Data Scientist (data analyst, data miner,...)
Charg¨¦ d¡¯¨¦tudes statistiques
Charg¨¦ d¡¯¨¦tudes prospectives et d¡¯optimisation
Analyste en intelligence socio-¨¦conomique
Responsable gestion et analyse de donn¨¦es
M¨¦tiers de la Recherche

Inscriptions

Co?t de la formation

Co?t indicatif de la formation (le co?t personnalis¨¦ fait l¡¯objet d¡¯un devis).
  • Formation continue (salari¨¦, demandeur d¡¯emploi, ¡­)
    • UE Analyse de donn¨¦es : 625 € (25€ / heure)
    • UE Statistiques avanc¨¦es : 500 € (25€ / heure)
    • UE Data Mining : 500 € (25€ / heure)
    • UE Machine Learning : 500 € (25€ / heure)
    • UE Deep Learning : 500 € (25€ / heure)
    • UE Data Engineering : 750 € (25€ / heure)
    • UE Langage R : 500 € (25€ / heure)
    • UE Time series : 500 € (25€ / heure)
    • Ensemble de la formation : 4375 € (25€ / heure)
  • Tarif ¨¦tudiant UCA (tarif r¨¦duit) : 450 €

Modalit¨¦s d'inscription