|
{revue}
Le Web sémantique désigne un ensemble de technologies visant à rendre le contenu des ressources du World Wide Web accessible et utilisable par les programmes et agents logiciels, grâce à un système de métadonnées formelles, utilisant notamment la famille de langages développés par le W3C1.
HistoriqueLa notion de métadonnées utilisables par les machines fut proposée assez tôt dans l'histoire du Web, dès 1994 par son inventeur Tim Berners-Lee2, lors de la conférence WWW 94 où fut annoncée la création du W3C. Ces métadonnées formelles sont alors présentées comme une nécessaire représentation utilisable par les machines de l'information contenue dans les documents, par exemple le fait qu'une personne X est employée par une organisation Y. Le développement de cette idée aboutit à la publication en 1999 de la première version de RDF (Resource Description Framework)3, langage qui définit un cadre général pour la standardisation des métadonnées des ressources Web. Sur la base de RDF se sont ensuite développés des vocabulaires spécifiques destinés à des applications particulières, comme FOAF destiné à décrire les relations entre personnes, puis des langages destinés à structurer ces vocabulaires, comme RDFS et le langage d'ontologie OWL, publiés dans leur forme finale en février 2004. Au cours de cette évolution, la notion de ressource s'étend de son sens original de « document publié sur le Web » à des sens plus généraux et plus abstraits. Dans les langages d'ontologie ou le langage SKOS, en cours de développement, les ressources décrites sont des concepts comme des classes, des propriétés, ou des concepts utilisés pour l'indexation. À ce titre, les langages et technologies du Web sémantique sont parfois présentés comme des outils de représentation des connaissances adaptés à l'environnement Web, permettant de transformer automatiquement les données en information, et les informations en savoir4. Principe généralLe Web sémantique est entièrement fondé sur le Web et ne remet pas en cause ce dernier. Le Web sémantique s'appuie donc sur la fonction primaire du Web « classique » : un moyen de publier et consulter des documents. Mais les documents traités par le Web sémantique contiennent non pas des textes en langage naturel (français, espagnol, chinois, etc.) mais des informations formalisées pour être traitées automatiquement. Ces documents sont générés, traités, échangés par des logiciels. Ces logiciels permettent souvent, sans connaissance informatique, de :
Cadre de référenceLe Web sémantique est fondé sur les protocoles et langages standards du Web :
À ces standards s'ajoutent ceux qui sont propres au Web sémantique :
Ces quatre standards sont ouverts et issus du W3C. Ils forment l'ossature du Web sémantique. CritiquesL'architecture, les outils et les concepts mêmes du Web sémantique ont été souvent critiqués. Certains analystes pensent que les principes d'organisation sur lesquels ils reposent sont applicables à l'échelle d'un système d'information fermé, comme une entreprise ou une bibliothèque, mais ne fonctionneront pas ou mal à l'échelle plus grande du Web, pour des raisons autant techniques que sociales5,6. D'autres critiques ont reproché au W3C de consacrer trop de moyens au développement du Web sémantique, au détriment d'autres technologies comme les services Web7. Applications pratiquesCes nouveaux protocoles de communication et langages standards permettent le développement de nouveaux usages qui rendent concrète la notion d'intelligence collective. C'est notamment le cas du « social bookmarking », de la recherche sociale (voir par exemple Lycos IQ [1]). Les wiki sémantiques permettent de créer des contenus en précisant leur sens et en caractérisant leurs relations via une syntaxe de type wiki. Systèmes de question réponseLa recherche de données par requêtes en langage naturel et systèmes de question réponses est l'un des enjeux du web sémantique. La plupart des algorithmes des systèmes de questions-réponse reposent en effet sur l'usage intensif des étiquetages sémantiques (ou étiquetages par entités nommées). Comme illustré par le système de question-réponse EAGLi [2], appliqué aux sciences de la vie et de la santé. Avec ces systèmes, l'utilisateur ne saisit plus dans un moteur de recherche une requête composée de terme décrivant l'objet de sa recherche (exemple « logiciel freeware traduction ») mais une question en clair, susceptible de produire un résultat de recherche construit et fruit d'un assemblage d'informations (exemple, « qui sont les auteurs classiques du XIXe »). Les expériences menées actuellement, comme par exemple celle de DBpedia, en construisant des bases d'informations relationnelles décrivant le contenu sémantique de Wikipédia, permettent d'envisager la mise au point rapide de tels moteurs. On visitera par exemple Berlin SNORQL [3] pour imaginer ce que pourraient être ces applications. Avancement en EuropeL'avancement du Web sémantique dans le monde est suivi par le W3C dans le cadre d'un projet Semantic Web Advanced Deployment (SWAD). Le projet SWAD-Europe s'est déroulé de mai 2002 à octobre 2004. Voir : SWAD-Europe L'organisme européen hôte des projets W3C et qui suit l'avancement du Web sémantique est ERCIM (European Research Consortium for Informatics and Mathematics). Voir : Site officiel de l'ERCIM C'est l'INRIA qui représente la France dans ERCIM. Voir aussiLiens internesLiens externes
Notes et références
Le Texte ci-dessus est disponible sous GNU Free Documentation License. La source est wikipedia http://fr.wikipedia.org/wiki/{title} |