{"id":1143,"date":"2014-10-19T19:10:40","date_gmt":"2014-10-19T19:10:40","guid":{"rendered":"http:\/\/lewebpedagogique.com\/presencesenligne\/?p=1143"},"modified":"2014-10-19T19:10:40","modified_gmt":"2014-10-19T19:10:40","slug":"organisationmetadonnees","status":"publish","type":"post","link":"https:\/\/fonderie-infocom.net\/blognumerique\/index.php\/2014\/10\/19\/organisationmetadonnees\/","title":{"rendered":"L\u2019organisation des m\u00e9tadonn\u00e9es."},"content":{"rendered":"<p><img loading=\"lazy\" class=\"alignright\" src=\"http:\/\/www.fabula.org\/actualites\/documents\/62004.jpg\" alt=\"\" width=\"145\" height=\"218\" \/><\/p>\n<p style=\"text-align: left\">Vous trouverez ci-dessous un compte-rendu du dixi\u00e8me chapitre intitul\u00e9 &#8220;L&#8217;organisation des m\u00e9tadonn\u00e9es&#8221; de\u00a0Gr\u00e9gory Fabre et Sophie Marcotte, issu du livre Pratiques de l&#8217;\u00e9dition num\u00e9rique.<\/p>\n<p style=\"text-align: left\">Afin de synth\u00e9tiser j&#8217;ai fais le choix de structurer le compte rendu sous formes de questions\/r\u00e9ponses et de r\u00e9sumer les caract\u00e9ristiques des diff\u00e9rents outils pour organiser les m\u00e9tadonn\u00e9es.<\/p>\n<hr \/>\n<h2 id=\"meta\" style=\"text-align: center\">Les m\u00e9tadonn\u00e9es.<\/h2>\n<p><em>Les m\u00e9tadonn\u00e9es qu\u2019est-ce que c\u2019est\u00a0?<\/em><\/p>\n<p>Ce sont des informations, qui d\u00e9crivent un contenu et \u00e9galement des tags, qui permettent de retrouver des donn\u00e9es gr\u00e2ce \u00e0 une ontologie commune.<\/p>\n<p>&nbsp;<\/p>\n<p><em>A quoi servent les m\u00e9tadonn\u00e9es\u00a0?<\/em><\/p>\n<p>Elles permettent de caract\u00e9riser et structurer des ressources num\u00e9riques. Gr\u00e2ce \u00e0 elles nous pouvons r\u00e9aliser une taxinomie (classification) du monde, et faire circuler des connaissances. Notamment en facilitant la recherche d&#8217;information gr\u00e2ce \u00e0 la description de contenu et leurs classes, avec le r\u00e9f\u00e9rencement. Les m\u00e9tadonn\u00e9es facilitent \u00e9galement l\u2019archivage et l\u2019interop\u00e9rabilit\u00e9. Elles servent aussi \u00e0 g\u00e9rer des droits d\u2019acc\u00e8s \u00e0 des pages web, et encoder une signature \u00e9lectronique pour certifier et authentifier un contenu.<\/p>\n<p>&nbsp;<\/p>\n<p><em>Quel est le but principal des m\u00e9tadonn\u00e9es\u00a0?<\/em><\/p>\n<p>Son but premier est de permettre aux machines d&#8217;exploiter automatiquement les contenus de sources d&#8217;information, accessibles par le Web, pour r\u00e9aliser des t\u00e2ches vari\u00e9es. La r\u00e9alisation de cet objectif repose sur l&#8217;existence de donn\u00e9es structur\u00e9es. Par exemple elles participent \u00e0 l&#8217;optimisation des moteurs de recherches gr\u00e2ce aux SEO (Search Engine Optimatization) , pour en quelques sortes indexer les sites web.<\/p>\n<p>&nbsp;<\/p>\n<hr \/>\n<p>&nbsp;<\/p>\n<h2 id=\"meta\" style=\"text-align: center\">Les formats s\u00e9mantiques<\/h2>\n<h2 id=\"meta\" style=\"text-align: center\">La structuration de donn\u00e9es<\/h2>\n<p><strong>Microformats ou entit\u00e9s<\/strong> servent \u00e0 d\u00e9crire de mani\u00e8re pr\u00e9cise un contenu num\u00e9riques qui poss\u00e8dent des propri\u00e9t\u00e9s propres. Un \u00e9v\u00e9nement sera d\u00e9fini par les propri\u00e9t\u00e9s \u00ab date \u00bb, \u00ab lieu \u00bb, \u00ab type d\u2019\u00e9v\u00e9nement \u00bb, \u00ab heure \u00bb, \u00ab contact \u00bb. Son utilisation est utilis\u00e9e pour concevoir des annuaires.<\/p>\n<p><strong>Microdata<\/strong> permet de cr\u00e9er des liens s\u00e9mantiques entre les contenus d\u00e9j\u00e0 pr\u00e9sents sur le web en ajoutant des balises \u00e0 la structure HTLM. C\u2019est-\u00e0-dire qu\u2019ils permettent aux moteurs de recherche de comprendre le contenu des pages gr\u00e2ce \u00e0 une hi\u00e9rarchisation et d\u2019extraire les contenus microdata pour r\u00e9aliser un r\u00e9f\u00e9rencement.<\/p>\n<p><strong>RDF<\/strong> (Ressource Description Framework) structure le contenu gr\u00e2ce \u00e0 un ensemble de triplets: <em>le sujet <\/em>qui est la ressource \u00e0 d\u00e9crire, <em>le pr\u00e9dicat<\/em> qui est le type de propri\u00e9t\u00e9 applicable au sujet et <em>l\u2019objet<\/em> qui est la valeur de la propri\u00e9t\u00e9. Ce format doit \u00eatre traduit par les agents logiciels qui \u00e9changent de l\u2019information entre eux pour \u00eatre utilis\u00e9.<\/p>\n<p><strong>OWL<\/strong> (Web Ontology Language) est un prolongement de RDF. Il s\u2019agit d\u2019un format qui permet de clarifier ce qui ne peut pas \u00eatre compris d\u2019embl\u00e9e par la machine en fournissant un langage propice \u00e0 l\u2019\u00e9laboration d\u2019une ontologie (l&#8217;\u00e9tude de l\u2019\u00eatre).<\/p>\n<p><strong>FOAF<\/strong> (Friend of a Friend) est un vocabulaire qui repose sur du RDF et OWL, il permet de d\u00e9crire des personnes et les corr\u00e9lations qu\u2019elles entretiennent entre elles ou avec des objets. Il permet aussi de crypter des adresses mails.<\/p>\n<p><strong>OAI-PMH<\/strong> (Open Archives Initiative Protocol for Metadata Harvesting) est un m\u00e9canisme favorisant l\u2019interop\u00e9rabilit\u00e9 entre diff\u00e9rentes sources de r\u00e9f\u00e9rence. C\u2019est-\u00e0-dire qu\u2019il d\u00e9termine les conditions du transfert des m\u00e9tadonn\u00e9es produites par un fournisseur de donn\u00e9es, vers le serveur d\u2019un fournisseur de services. Il permet d\u2019\u00e9changer des m\u00e9tadonn\u00e9es entre plusieurs institutions, accro\u00eetre la visibilit\u00e9 des collections num\u00e9riques sur Internet et d\u2019indiquer des ressources non accessibles aux moteurs de recherche.<\/p>\n<p><strong>Dublin Core<\/strong> \u00e9quivaut \u00e0 une liste de m\u00e9tadonn\u00e9es li\u00e9es aux sites web. Il permet de normaliser les balises qui d\u00e9crivent les r\u00e9f\u00e9rences bibliographiques et d\u2019\u00e9tablir des relations entre elles et d\u2019autres ressources. Il comporte 15 propri\u00e9t\u00e9s balis\u00e9s qui permettent de d\u00e9signer commun\u00e9ment l\u2019agr\u00e9gat de contenu de bases diff\u00e9rentes.<a href=\"http:\/\/fonderie-infocom.net\/blognumerique\/wp-content\/uploads\/2014\/10\/dublin.jpg\"><img loading=\"lazy\" class=\"aligncenter wp-image-1144\" src=\"http:\/\/fonderie-infocom.net\/blognumerique\/wp-content\/uploads\/2014\/10\/dublin.jpg\" alt=\"Les 15 propri\u00e9t\u00e9s balis\u00e9s de Dublin Core\" width=\"327\" height=\"105\" srcset=\"https:\/\/fonderie-infocom.net\/blognumerique\/wp-content\/uploads\/2014\/10\/dublin.jpg 678w, https:\/\/fonderie-infocom.net\/blognumerique\/wp-content\/uploads\/2014\/10\/dublin-300x96.jpg 300w\" sizes=\"(max-width: 327px) 100vw, 327px\" \/><\/a><\/p>\n<p><strong>Drupal<\/strong> est un syst\u00e8me de gestion de contenu (CMS) gratuit et Open Source c&#8217;est \u00e0 dire accessible sans payer une licence et que tout le monde peut participer \u00e0 son am\u00e9lioration. Il permet de produire, g\u00e9rer, et diffuser du contenu. Gr\u00e2ce \u00e0 ce syst\u00e8me de contenu les programmeurs \u00e9vite les processus de saisi et de gestion des m\u00e9tadonn\u00e9es.<\/p>\n<p><strong>SPARQL<\/strong>\u00a0(Sparql Protocol and RDF Query Language) est un langage qui enregistre et fusionne les donn\u00e9es qui viennent de sources diff\u00e9rentes. Il permet de rechercher et g\u00e9rer des donn\u00e9es RDF.<\/p>\n<p><strong>Apache Solar<\/strong> permet de r\u00e9aliser des recherches avanc\u00e9e au sein d\u2019une base de donn\u00e9es complexe gr\u00e2ce \u00e0 son interface HTML et son filtrage de donn\u00e9es. L\u2019objectif est de pouvoir efficacement rechercher de mani\u00e8re transversale sur l\u2019ensemble des sites.<\/p>\n<p><strong>TEI<\/strong> (Text Encoding Initiative) est employ\u00e9 avec les balises XML il sert \u00e0 faciliter la cr\u00e9ation, l\u2019\u00e9change, et l\u2019int\u00e9gration des donn\u00e9es textuelles informatis\u00e9es. Il permet de d\u00e9crire la mani\u00e8re dont un document a \u00e9t\u00e9 cr\u00e9\u00e9 et structur\u00e9 (lignes, chapitres, paragraphes, dialogues, ratures\u2026). Accompagn\u00e9 du RDF il permet de mettre en relation des sources. Il est surtout adopt\u00e9 pour des projets \u00e9ditoriaux anciens, de manuscrits et permet de reconstituer le processus menant \u00e0 la version d\u00e9finitive d\u2019un texte.<\/p>\n<p>&nbsp;<\/p>\n<p>&nbsp;<\/p>\n<p>L&#8217;organisation des m\u00e9tadonn\u00e9es peut \u00eatre complexe, c&#8217;est pour cela qu&#8217;il est n\u00e9cessaire de conna\u00eetre les diff\u00e9rents formats propos\u00e9s et les langages utiles pour r\u00e9pondre aux diff\u00e9rents besoins. Besoins qui peuvent \u00eatre professionnels, \u00e9ditoriaux, scientifiques ou documentaires. Sachez que l\u2019ELO (Electronic Literature Organization) a lanc\u00e9 le projet CELL (Consortium of Electronic Literature) afin de r\u00e9unir les informations des bases de donn\u00e9es r\u00e9parties dans les laboratoires de recherche qui \u00e9tudient la cr\u00e9ation et l\u2019\u00e9tude des hyperm\u00e9dias. Il permettra \u00e0 terme la normalisation et la densification de donn\u00e9es partag\u00e9es.<\/p>\n<p><span id=\"p135\">\u00a0<\/span><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Vous trouverez ci-dessous un compte-rendu du dixi\u00e8me chapitre intitul\u00e9 &#8220;L&#8217;organisation des m\u00e9tadonn\u00e9es&#8221; de\u00a0Gr\u00e9gory Fabre et Sophie Marcotte, issu du livre Pratiques de l&#8217;\u00e9dition num\u00e9rique. Afin de synth\u00e9tiser j&#8217;ai fais le&#8230;<\/p>\n","protected":false},"author":26,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":[],"categories":[3,4,8],"tags":[124,191,233,333,342,383],"_links":{"self":[{"href":"https:\/\/fonderie-infocom.net\/blognumerique\/index.php\/wp-json\/wp\/v2\/posts\/1143"}],"collection":[{"href":"https:\/\/fonderie-infocom.net\/blognumerique\/index.php\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/fonderie-infocom.net\/blognumerique\/index.php\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/fonderie-infocom.net\/blognumerique\/index.php\/wp-json\/wp\/v2\/users\/26"}],"replies":[{"embeddable":true,"href":"https:\/\/fonderie-infocom.net\/blognumerique\/index.php\/wp-json\/wp\/v2\/comments?post=1143"}],"version-history":[{"count":0,"href":"https:\/\/fonderie-infocom.net\/blognumerique\/index.php\/wp-json\/wp\/v2\/posts\/1143\/revisions"}],"wp:attachment":[{"href":"https:\/\/fonderie-infocom.net\/blognumerique\/index.php\/wp-json\/wp\/v2\/media?parent=1143"}],"wp:term":[{"attributes":{"taxonomy":"category","embeddable":true},"href":"https:\/\/fonderie-infocom.net\/blognumerique\/index.php\/wp-json\/wp\/v2\/categories?post=1143"},{"attributes":{"taxonomy":"post_tag","embeddable":true},"href":"https:\/\/fonderie-infocom.net\/blognumerique\/index.php\/wp-json\/wp\/v2\/tags?post=1143"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}