SCI 1017 - Traitement des données massives - Cours en ligne | Université TÉLUQ

Professeur responsable

Belkacem Chikhaoui

Préalable

INF 1220

Objectifs

Identifier les concepts fondamentaux propres au traitement des données massives.
Appliquer les techniques de stockage et de traitement des données massives.
Appliquer les fonctions de base des librairies Python destinées à la manipulation et au traitement des données massives.

Contenu

Le cours est organisé en cinq modules, qui traitent de :

1. Définition des données massives : volume, variété, vélocité. Les différentes méthodes de traitement des données massives, traitement par lots (batch processing), traitement en continu (stream processing).

2. Architecture de l'écosystème HADOOP. Représentation de données dans HADOOP : le système HDFS, exemples d'applications. Principe de Map Reduce.

3. Ensembles de données distribués résilients (RDD : resilient distributed datasets) : créer et utiliser des RDD, transformations sur des RDD. SPARK SQL, SPARK Graph X, SPARK MLLIB : exemples d'applications en Jupyter Notebook..

4. Introduction aux données non structurées. Stockage des données non structurées : MongoDB. Requêtes sur des données non structurées.

5. Stockage et traitement des données en infonuagique (exemple de Google Cloud). Requêtes sur des données stockées en infonuagique : introduction à Big Query. Exemples d'application sur Google Cloud.

Matériel didactique

Site Web du cours

Matériel expédié

Renseignements technologiques

Consultez l'information sur le matériel informatique recommandé.

Encadrement

L'encadrement est individualisé et assuré par le professeur responsable du cours ou par une personne tutrice. Les communications se font par téléphone ou par courriel.

Évaluation

L'évaluation repose sur cinq travaux en ligne (10 %, 20 %, 20 %, 10 % et 10 %) et un projet final (30 %).

Échelle de conversion

Notation	Valeur numérique	Valeur en pourcentage
A+	4,3	96 à 100 %
A	4	92 à 95 %
A-	3,7	88 à 91 %
B+	3,3	84 à 87 %
B	3	80 à 83 %
B-	2,7	76 à 79 %
C+	2,3	72 à 75 %
C	2	68 à 71 %
C-	1,7	64 à 67 %
D+	1,3	60 à 63 %
D	1	50 à 59 %
E	0	0 à 49 %

* Échelle de conversion actuellement en vigueur pour ce cours.

Particularités d'inscription

Ce cours présuppose la connaissance des mathématiques de niveau collégial et des bases en programmation.

Liste des programmes dont ce cours fait partie

Facebook Twitter