Web sémantique et infrastructures pour le big data (ASR 7)

Catalog of Télécom SudParis courses

Code

IGFF CSC 5003

Level

M2

Graduate

Graduate

Semester

Fall

Domain

Informatique

Program

Programme Ingénieur

Language

Français/French

ECTS Credits

4

Class hours

45

Workload

90

Program Manager(s)

Department

  • Direction de la Recherche et des Formations Doctorales
  • Informatique

Educational team

Organisation

Cours/TD/TP/projet/examen : 21/0/24/0

Learning objectives

- Understand Semantic Web and Linked Data
- Master definition and management of an ontology
- Master Web Semantic Languages
- Learn and Experiment Big Data technlologies (Hadoop, MapReduce, storage solutions: NoSQL)

CDIO Skills

  • 2.1.2 - Modeling
  • 2.1.4 - Analysis With Uncertainty
  • 2.4.1 - Initiative and the Willingness to Make Decisions in the Face of Uncertainty
  • 2.4.4 - Critical Thinking
  • 4.5.3 - Software Implementing Process

Prerequisites

SQL (notions), XML (notions), Java (notions)

Keywords

Web sémantique, ontologies, RDF/RDFS, OWL, Linked data, Machine Learning, Hadoop, MapReduce, NoSQL, SPARK

Content

- Introduction au Web sémantique
- La représentation des connaissances (logiques, ontologies, raisonnement)
- Notion d’ontologie (Création, représentation, exploitation)
- Outils et inférence (protégé, jena, ontobroker…)
- Les langages du Web sémantique (RDF et RDF-Schema, OWL, SPARQL)
- Introduction au Big Data
- Introduction à l'apprentissage statistique et à la fouille de données
- Infrastructures pour le Big Data (Hadoop, MapReduce, des solutions de stockage NoSQL, SPARK)
- Apprentissage statistique scalable avec SPARK
- Conférences

Evaluation

The validation of this teaching unit is based on a graded lab and a synthesis of research articles which gives rise to a report.

Final score = Average (graded lab, presentation)

Assessment formula

Note finale = Moyenne (TP noté, soutenance orale)

References

Support de cours :
- « Web sémantique et applications » (transparents)
Bibliographie :
- P. Laublet, J. Charlet et C. Reynaud, “Introduction au web sémantique”, Information Interaction Intelligence, N° hors-série de la revue I3, Ed.: Cépaduès (juin 2005)
- A. Sheth, “Changing Focus on Interoperability in Information Systems: From System, Syntax, Structure to Semantics”, in Interoperating Geographic Information Systems. M. F. Goodchild, M. J. Egenhofer, R. Fegeas, and C. A. Kottman (eds.), Kluwer, Academic Publishers, 1998, pp. 5-30.
- Tim Berners-Lee, James Hendler and Ora Lassila, “The Semantic Web, A new form of Web content that is meaningful to computers will unleash a revolution of new possibilities”, Scientific American, May 2001.
- http://www.w3.org/RDF/
- OWL Web Ontology Language, W3C Recommendation 10 February 2004, http://www.w3.org/TR/2004/REC-owl-features-20040210/
- Ontology Development Tutorial by Natasha Noy, http://protege.stanford.edu/publications/ontology_development/ontology101.shtml
- Principles and best practices of scalable realtime data systems, Nathan Marz and James Warren, 2012 MANNING
- Serge Abiteboul et al, Web Data Management http://webdam.inria.fr/Jorge/
- Le livre blanc de Smile sur NoSQL : http://www.smile.fr/Livres-blancs/Culture-du-web/NoSQL

Pedagogical methods

Cette UV comprend 21h de cours et 24h de TP. Certains cours sont dispensés par des conférenciers invités. Les travaux pratiques se décomposent en 21h de manipulations réalisées en binôme et en 3h de manipulations notées réalisées en binôme.