Le cours Fondamentaux pour le Big Data permet d'acquérir efficacement le niveau prérequis en informatique et en statistiques pour suivre des formations dans le domaine du big data et data science.

Le big data offre de nouvelles opportunités d’emplois au sein des entreprises et des administrations. De nombreuses formations préparant à ces opportunités de métiers existent.

Le suivi de ces formations nécessite des connaissances de base en statistiques et en informatique que ce cours vous propose d’acquérir dans les domaines de l’analyse, algèbre, probabilités, statistiques, programmation Python et bases de données.

Plan du cours

Semaine 0 : Introduction - Les enjeux du Big Data et de ce cours

Semaine 1 : Python Partie 1 / Algèbre Partie 1

Semaine 2 : Limites des bases de données relationnelles / Python Partie 2 / Algèbre Partie 2

Semaine 3 : Probabilités Partie 1 / Analyse Partie 1

Semaine 4 : Probabilités Partie 2 / Analyse Partie 2

Semaine 5 : Statistique

Semaine 6 : Le classifieur Perceptron

Objectifs pédagogiques

Ce cours permet d’acquérir efficacement le niveau prérequis en informatique et en statistiques pour suivre des formations dans le domaine du big data.

A l'issue de ce cours, vous devriez être savoir :

  • Pourquoi les bases de données relationnelles ne sont pas toujours adaptées aux systèmes de données massives qui sont déployées dans les contextes big data.
  • Pourquoi le langage Python est un langage très utilisé dans le domaine du traitement des masses de données. Ce cours vous initie à la programmation avec ce langage, particulièrement en utilisant la bibliothèque Numpy.
  • Quelles analyses statistiques nécessitent le traitement des données massives et la prédiction.

Cette formation vous fournit les concepts élémentaires en statistiques tels que :

  • les variables aléatoires,
  • le calcul différentiel,
  • les fonctions convexes,
  • les problèmes d'optimisation,
  • les modèles de régression.

Ces bases sont appliquées sur un algorithme de classification le Perceptron.

Modalités d'évaluation

Chaque semaine comporte un quiz d'apprentissage composé de 8 questions qui vous permet de vérifier que vous avez acquis les notions exposées. Pour ces quiz, vous ne disposez que de 2 tentatives.

En dernière semaine, un mini-projet vous est proposé. Pour évaluer celui-ci, vus devrez répondre à un quiz pour lequel vous ne disposez que de 4 tentatives.

Pour ces exercices, chaque question vaut 1 point et le score total est ramené sur 100. Pour les question à choix multiple, les points sont répartis sur l’ensemble des réponses correctes et une pénalité totale de -100% des points est répartie sur l’ensemble des mauvaises réponses (le nombre de points minimal pour une question est de 0).

Un badge de suivi avec succès est attribué aux étudiants obtenant une note supérieure ou égale à 70%. Dans le cas contraire, un badge de suivi vous sera remis. Ce badge sera disponible dans votre profil.

  • L'ensemble des quiz d'apprentissage compte pour 60% de la note finale.
  • Le mini-projet compte pour 40% de la note finale.

Contacts et accompagnement

Questions d'ordre technique

Si vous rencontrez un problème ou pour toute question d'ordre technique, vous pouvez contacter referents-pedagotheque@imt.fr. Nous mettrons tout en œuvre pour vous répondre sous 2 jours ouvrés.

Auditeurs libres

Si vous suivez ce cours en auditeur libre, les forums ne seront pas actifs et vous n'y obtiendrez pas de réponse de l'équipe pédagogique. Vous pouvez néanmoins y discuter avec d'autres auditeurs libres.
Également, si vous rencontrez un problème ou pour toute question d'ordre technique, vous pouvez contacter referents-pedagotheque@imt.fr. Nous mettrons tout en œuvre pour vous répondre sous 2 jours ouvrés.

Utilisation en classe (avec votre enseignant)

Si vous suivez ce cours sous la supervision de l'un de vos enseignants, ce dernier est libre d'utiliser les forums du cours ou tout autre canal de communication qui lui conviendrait mieux. Suivez les indications qu'il vous aura données pour lui poser vos questions.
Également, si vous rencontrez un problème ou pour toute question d'ordre technique, vous pouvez contacter referents-pedagotheque@imt.fr. Nous mettrons tout en œuvre pour vous répondre sous 2 jours ouvrés.

Mots-clés:

fondamentaux big date bases données relationnelles langage python traitement Numpy statistiques statistique donnée donnee analyse analyses variables aléatoires variable aleatoire aléatoire aleatoire calcul différentiel fonctions convexes fonction convexe optimisation modèle modele régression algorithme de classification perceptron

Fondamentaux pour le Big Data

Cours ouverts aux extérieurs sur demande à christophe.boutrou@imt.fr: Yes
Etablissement porteur: Télécom Paris
Thématique(s): Informatique, Mathématiques et statistique, Programmation, Sciences des données
Niveau(x) des étudiants: Bac+3, Bac+4, Bac+5
Membre(s) de l'équipe pédagogique: Stéphan Clémençon, Pierre Senellart, Anne Sabourin, Joseph Salmon, Alexandre Gramfort, Ons Jelassi
Conditions d'utilisation du cours: CC BY-NC-ND
Langue: Français
Durée du cours: 6 semaines
Accroche: Acquérir efficacement le niveau prérequis en informatique et en statistiques pour suivre des formations dans le domaine du big data et data science.
Partenaires:

Logo Institut Mines-Télécom