Web sémantique et infrastructures pour le big data (ASR 7)

Catalogue des cours de Télécom SudParis

Code

IGFF CSC 5003

Niveau

M2

Graduate

Graduate

Semestre

Fall

Domaine

Informatique

Programme

Programme Ingénieur

Langue

Français/French

Crédits ECTS

4

Heures programmées

45

Charge de travail

90

Coordonnateur(s)

Département

  • Informatique

Equipe pédagogique

Organisation

Cours/TD/TP/projet/examen : 21/0/24/0

Acquis d'apprentissage

A la fin de ce module les étudiants devront
- Comprendre le Web sémantique et le Web de données (Linked data)
- Savoir définir et exploiter une ontologie
- Maitriser les langages du Web sémantique
- Apprendre et expérimenter les technologies du Big Data (Hadoop, MapReduce, des solutions de stockage NoSQL)

Compétences CDIO

  • 2.1.2 - Modélisation
  • 2.1.4 - Analyse en contexte non parfaitement défini
  • 2.4.1 - Sens de l'initiative et capacité à prendre des décisions en contexte incertain
  • 2.4.4 - Esprit critique
  • 4.5.3 - Processus de réalisation logicielle

Prérequis

SQL (notions), XML (notions), Java (notions)

Mots-clés

Web sémantique, ontologies, RDF/RDFS, OWL, Linked data, Machine Learning, Hadoop, MapReduce, NoSQL, SPARK

Contenu

- Introduction au Web sémantique
- La représentation des connaissances (logiques, ontologies, raisonnement)
- Notion d’ontologie (Création, représentation, exploitation)
- Outils et inférence (protégé, jena, ontobroker…)
- Les langages du Web sémantique (RDF et RDF-Schema, OWL, SPARQL)
- Introduction au Big Data
- Introduction à l'apprentissage statistique et à la fouille de données
- Infrastructures pour le Big Data (Hadoop, MapReduce, des solutions de stockage NoSQL, SPARK)
- Apprentissage statistique scalable avec SPARK
- Conférences

Evaluation

La validation de cette UV est basée sur un TP noté et une synthèse d’articles donnant lieu à une soutenance orale.
Note finale = Moyenne (TP noté, rapport de synthèse d’articles)

Formule de l'évaluation

Note finale = Moyenne (TP noté, soutenance orale)

Bibliographie

Support de cours :
- « Web sémantique et applications » (transparents)
Bibliographie :
- P. Laublet, J. Charlet et C. Reynaud, “Introduction au web sémantique”, Information Interaction Intelligence, N° hors-série de la revue I3, Ed.: Cépaduès (juin 2005)
- A. Sheth, “Changing Focus on Interoperability in Information Systems: From System, Syntax, Structure to Semantics”, in Interoperating Geographic Information Systems. M. F. Goodchild, M. J. Egenhofer, R. Fegeas, and C. A. Kottman (eds.), Kluwer, Academic Publishers, 1998, pp. 5-30.
- Tim Berners-Lee, James Hendler and Ora Lassila, “The Semantic Web, A new form of Web content that is meaningful to computers will unleash a revolution of new possibilities”, Scientific American, May 2001.
- http://www.w3.org/RDF/
- OWL Web Ontology Language, W3C Recommendation 10 February 2004, http://www.w3.org/TR/2004/REC-owl-features-20040210/
- Ontology Development Tutorial by Natasha Noy, http://protege.stanford.edu/publications/ontology_development/ontology101.shtml
- Principles and best practices of scalable realtime data systems, Nathan Marz and James Warren, 2012 MANNING
- Serge Abiteboul et al, Web Data Management http://webdam.inria.fr/Jorge/
- Le livre blanc de Smile sur NoSQL : http://www.smile.fr/Livres-blancs/Culture-du-web/NoSQL

Approches pédagogiques

Cette UV comprend 21h de cours et 24h de TP. Certains cours sont dispensés par des conférenciers invités. Les travaux pratiques se décomposent en 21h de manipulations réalisées en binôme et en 3h de manipulations notées réalisées en binôme.