{"id":2312,"date":"2015-01-14T10:56:27","date_gmt":"2015-01-14T10:56:27","guid":{"rendered":"http:\/\/lewebpedagogique.com\/presencesenligne\/?p=2312"},"modified":"2015-01-14T10:56:27","modified_gmt":"2015-01-14T10:56:27","slug":"les-potentialites-du-texte-numerique","status":"publish","type":"post","link":"https:\/\/fonderie-infocom.net\/blognumerique\/index.php\/2015\/01\/14\/les-potentialites-du-texte-numerique\/","title":{"rendered":"Les potentialit\u00e9s du texte num\u00e9rique."},"content":{"rendered":"<p>Les usages du texte num\u00e9rique, la mani\u00e8re de l\u2019exploiter, mieux comprendre les outils analytiques dans ce domaine, autant de bonnes questions pos\u00e9es concernant la bonne pratique de production des contenus dits num\u00e9riques. Pour mener cette am\u00e9lioration de la production, il est indispensable de prendre en consid\u00e9ration l\u2019entier potentiel offert par le texte num\u00e9rique.<\/p>\n<p>La contradiction que l\u2019on peut relever dans ce chapitre concernant la recherche de texte informatis\u00e9e, \u00e0 quoi bon une machine peut elle porter un sens critique concernant les textes litt\u00e9raires dans la mesure o\u00f9 elle n\u2019est pas humaine.\u00a0?<\/p>\n<p>Ce chapitre remet \u00e9galement en cause l\u2019id\u00e9e que la soci\u00e9t\u00e9 de l\u2019information est g\u00e9n\u00e9ratrice de donn\u00e9es que l\u2019on ne peut remettre en cause, comme infaillibles et supr\u00eame dans la hi\u00e9rarchie globale des donn\u00e9es. Or l\u2019ordinateur peut se r\u00e9v\u00e9l\u00e9 tr\u00e8s efficace, gr\u00e2ce \u00e0 sa nature m\u00eame, dite \u00ab\u00a0num\u00e9rique\u00a0\u00bb contrainte uniquement par son utilisateur et aux possibilit\u00e9s hors de notre imagination.<\/p>\n<p>Ce chapitre aborde certaines caract\u00e9ristiques en premier lieu et certains concepts de base concernant la lecture informatis\u00e9e.<\/p>\n<p>&nbsp;<\/p>\n<p><strong>Le texte num\u00e9rique\u00a0: <\/strong><\/p>\n<p>&nbsp;<\/p>\n<p>Passant de 1% en 2008 \u00e0 23% en 2014 la croissance des livres num\u00e9riques aux USA semble \u00eatre en stabilisation, la consommation de contenus num\u00e9rique s\u2019installe et se normalise. L\u2019exp\u00e9rience entre le livre num\u00e9rique et papier ne sont pas les m\u00eames, cependant les concepteurs cherchent \u00e0 rassurer les lecteurs en reproduisant au maximum possible les caract\u00e9ristiques de la version imprim\u00e9e et ce, m\u00eame si la version num\u00e9rique propose d\u2019autres fonctions exclusives, tel que les notes publiques.<\/p>\n<p>La vraie question que l\u2019on va se poser est plut\u00f4t\u00a0: Comment \u00ab\u00a0\u00e9tudier\u00a0\u00bb et comment \u00ab\u00a0analyser\u00a0\u00bb un texte en prenant en compte les diff\u00e9rentes habitudes de consommations (web, print, \u00e9cran liseuse, tablette, audio etc). On peut rappeler la nature du mot \u00ab\u00a0analyse\u00a0\u00bb qui signifie \u00ab\u00a0d\u00e9composition\u00a0\u00bb, ce qui est justement dans la nature du num\u00e9rique, traitant chaque lettre comme entit\u00e9 ind\u00e9pendante et mobile.<\/p>\n<p>&nbsp;<\/p>\n<p>Dans un article de 1985 sur le statut \u00e9pist\u00e9mologique du texte \u00e9lectronique\u00a0\u00bb, de\u00a0<a href=\"http:\/\/www.puf.com\/Auteur:Serge_Lusignan\">Serge\u00a0Lusignan<\/a>, il est d\u00e9crit les retomb\u00e9es du texte num\u00e9rique\u00a0:<\/p>\n<p>&nbsp;<\/p>\n<p><em>\u00ab\u00a0Le texte magn\u00e9tique ou \u00e9lectronique poss\u00e8de des caract\u00e8res de flexibilit\u00e9 et de mall\u00e9abilit\u00e9 qu\u2019ignore le texte imprim\u00e9. Les caract\u00e8res et les mots incrust\u00e9s dans le papier ne peuvent \u00eatre ni d\u00e9plac\u00e9s, ni r\u00e9-ordonn\u00e9s, ni modifi\u00e9s, tandis que les caract\u00e8res et les mots magn\u00e9tis\u00e9s sont compl\u00e8tement mobiles. Ce trait propre au texte \u00e9lectronique permet de lui appliquer, gr\u00e2ce \u00e0 l\u2019ordinateur, diff\u00e9rentes proc\u00e9dures algorithmiques de manipulation<\/em>.\u00a0\u00bb<\/p>\n<p>&nbsp;<\/p>\n<p>Il est possible \u00e9galement de d\u00e9couper les textes imprim\u00e9s, puis organiser chaque occurrence d\u2019un mot cl\u00e9 avec un peu de contexte. La nature m\u00eame d\u2019un texte num\u00e9rique en revanche, facilite le d\u00e9coupage et se pr\u00eate \u00e0 l\u2019analyse, on parle alors de \u00ab\u00a0 L\u2019Affordance\u00a0\u00bb du texte num\u00e9rique. Cependant, une compr\u00e9hension de la mati\u00e8re brute du texte semble indispensable pour arriver \u00e0 ses fins dans l\u2019analyse.<\/p>\n<p>&nbsp;<\/p>\n<p>Cet article prend l\u2019exemple de l\u2019alphabet romain, il suffit de 5 bits pour repr\u00e9senter toutes les possibilit\u00e9s (de l\u2019alphabet en lettre majuscule), au fil du temps les jeux de caract\u00e8res ont progress\u00e9 pour passer \u00e0 16 bits Unicode (UTF- 32 ou jusqu\u2019\u00e0 4\u00a0294\u00a0967\u00a0296 possibilit\u00e9s.<\/p>\n<p>Afin de garder une interop\u00e9rabilit\u00e9 des donn\u00e9es entre poste, des standards de caract\u00e8res sont indispensable et des conventions sont mises en place.<\/p>\n<p>Il en va de m\u00eame pour les formats de documents, plus un format est complexe, plus le logiciel de traitement est simple, plus le format durera, surtout pour les formats \u00ab\u00a0propri\u00e9taires\u00a0\u00bb. Le fondateur du Projet Gutenberg, \u00e0 privil\u00e9gier le format texte brut pour sa collection de textes du domaine public qui comprend aujourd\u2019hui quelques 40\u00a0000 titres.\u00a0<a href=\"http:\/\/www.parcoursnumeriques-pum.ca\/le-livrel-et-le-format-epub\">Le format ouvert ePub<\/a>\u00a0(qui utilise en partie le m\u00eame balisage HTML que pour les pages web) s\u2019est \u00e9tabli comme meilleur format pour la diffusion de textes num\u00e9riques, surtout pour la mise en page flexible qui facilite l\u2019affichage multiplateformes sur des \u00e9crans de tailles tr\u00e8s diff\u00e9rentes (Smartphone, tablette, liseuse, ordinateur, etc.) L\u2019ePub encode les caract\u00e8res et la structure de base des textes, mais ne repr\u00e9sente pas de fa\u00e7on standardis\u00e9e d\u2019autres d\u00e9tails textuels et m\u00e9ta textuels. Donc les chercheurs et archivistes soucieux de capter une gamme beaucoup plus large de d\u00e9tails pr\u00e9f\u00e8rent la\u00a0<em>Text Encoding Initiative<\/em>\u00a0(TEI), un langage XML qui permet de d\u00e9crire les caract\u00e9ristiques s\u00e9mantiques d\u2019un texte plut\u00f4t que sa pr\u00e9sentation (qu\u2019une s\u00e9quence de mots exprime un titre de livre, par exemple, et non seulement un bloc quelconque \u00e0 repr\u00e9senter en italique).<\/p>\n<p>&nbsp;<\/p>\n<p><strong>La lecture informatis\u00e9e<\/strong><\/p>\n<p><strong>\u00a0<\/strong><\/p>\n<p>Il<\/p>\n<p>Ce paragraphe traite de la recherche de mots dans un livre ou un document num\u00e9rique, en utilisant la fonction \u00ab\u00a0rechercher\u00a0\u00bb dans un software, une op\u00e9ration que la page imprim\u00e9 ne peut faire. Ces fonctions simple ne sont pas n\u00e9gligeables, elle permettent en effet de mieux comprendre des id\u00e9es communes dans un corpus de texte, les fonctions d\u2019analyse de texte sont accessibles \u00e0 tous, de plus, ces fonctions permette de faire des d\u00e9couvertes, l\u2019un des premier principe de la recherche savante. C\u2019est <a href=\"http:\/\/en.wikipedia.org\/wiki\/John_Unsworth\">John\u00a0Unsworth<\/a>\u00a0qui parle de m\u00e9thodologie dans les sciences humaines. En effet la recherche de mot cl\u00e9 peut s\u2019av\u00e9r\u00e9 \u00e9tonnamment complexe. \u2026\u2026\u2026.<\/p>\n<p>&nbsp;<\/p>\n<p>&nbsp;<\/p>\n<p><a href=\"http:\/\/fonderie-infocom.net\/blognumerique\/wp-content\/uploads\/2015\/01\/Capture-d\u2019\u00e9cran-2015-01-14-\u00e0-11.53.43.png\"><img loading=\"lazy\" class=\"alignnone size-full wp-image-2313\" src=\"http:\/\/fonderie-infocom.net\/blognumerique\/wp-content\/uploads\/2015\/01\/Capture-d\u2019\u00e9cran-2015-01-14-\u00e0-11.53.43.png\" alt=\"Capture d\u2019\u00e9cran 2015-01-14 \u00e0 11.53.43\" width=\"883\" height=\"388\" srcset=\"https:\/\/fonderie-infocom.net\/blognumerique\/wp-content\/uploads\/2015\/01\/Capture-d\u2019\u00e9cran-2015-01-14-\u00e0-11.53.43.png 883w, https:\/\/fonderie-infocom.net\/blognumerique\/wp-content\/uploads\/2015\/01\/Capture-d\u2019\u00e9cran-2015-01-14-\u00e0-11.53.43-300x132.png 300w, https:\/\/fonderie-infocom.net\/blognumerique\/wp-content\/uploads\/2015\/01\/Capture-d\u2019\u00e9cran-2015-01-14-\u00e0-11.53.43-768x337.png 768w\" sizes=\"(max-width: 883px) 100vw, 883px\" \/><\/a><\/p>\n<p>&nbsp;<\/p>\n<p>Les graphiques lin\u00e9aires peuvent \u00eatre tr\u00e8s puissants pour visualiser les donn\u00e9es \u00ab\u00a0comparatives\u00a0\u00bb (comme les fr\u00e9quences relatives), et il en va de m\u00eame pour les donn\u00e9es \u00ab\u00a0associatives\u00a0\u00bb en r\u00e9seau. Si l\u2019on veut examiner la collocation des termes \u2014\u00a0autrement dit la proximit\u00e9 des termes\u00a0\u2014, on peut utiliser les concepts pr\u00e9c\u00e9dents de recherche, comptage et comparaison pour cr\u00e9er une constellation de termes \u00e0 haute fr\u00e9quence qui ont tendance \u00e0 para\u00eetre ensemble. On pourrait vouloir examiner le r\u00e9seau de mots li\u00e9s (par proximit\u00e9) \u00e0 \u00ab\u00a0monsieur\u00a0\u00bb et \u00ab\u00a0madame\u00a0\u00bb\u00a0: quels mots sont les plus associ\u00e9s \u00e0 l\u2019un ou l\u2019autre de nos mots cl\u00e9s\u00a0? Quels mots sont associ\u00e9s aux deux\u00a0? Le graphique nous sugg\u00e8re que \u00ab\u00a0mari\u00a0\u00bb, \u00ab\u00a0dieu\u00a0\u00bb et \u00ab\u00a0fille\u00a0\u00bb sont plus associ\u00e9s \u00e0 \u00ab\u00a0madame\u00a0\u00bb, alors que \u00ab\u00a0ma\u00eetre\u00a0\u00bb, \u00ab\u00a0com\u00e9die\u00a0\u00bb et \u00ab\u00a0philosophie\u00a0\u00bb sont plus associ\u00e9s \u00e0 \u00ab\u00a0monsieur\u00a0\u00bb, et enfin que \u00ab\u00a0comtesse\u00a0\u00bb, \u00ab\u00a0vicomte\u00a0\u00bb et \u00ab\u00a0oui\u00a0\u00bb sont associ\u00e9s aux deux (entre autres). Encore une fois, les associations ne sont pas concluantes en soi, mais le graphique peut nous mener \u00e0 poser des questions qui ne nous seraient pas venues \u00e0 l\u2019esprit autrement.<\/p>\n<p>Plusieurs outils sont disponibles pour la lecture et l\u2019analyse informatis\u00e9es mais, \u00e0 quelques exceptions pr\u00e8s, il s\u2019agit de variantes des proc\u00e9dures \u00e9l\u00e9mentaires pr\u00e9sent\u00e9es ici\u00a0: la recherche, le comptage, la comparaison et l\u2019association. La pr\u00e9paration des donn\u00e9es textuelles peut \u00eatre tr\u00e8s exigeante (et souvent quelques comp\u00e9tences de programmation s\u2019av\u00e8rent indispensables, surtout les langages de script comme Python, Ruby et PHP. Mais des outils comme\u00a0<em>Voyant Tool<\/em>\u00a0d\u00e9montrent qu\u2019il est possible de prendre plusieurs documents dans des formats vari\u00e9s (texte brut, MS Word, PDF, etc.), de les ajouter \u00e0 l\u2019outil et de commencer \u00e0 lire, \u00e0 explorer et \u00e0 analyser. Ces activit\u00e9s diverses repr\u00e9sentent les atouts des textes num\u00e9riques.<\/p>\n<p><strong>\u00a0<\/strong><\/p>\n<p><strong>\u00a0<\/strong><\/p>\n<p><strong>Conclusion<\/strong><\/p>\n<p><strong>\u00a0<\/strong><\/p>\n<p>Les textes num\u00e9riques nous sont omnipr\u00e9sents, mais nous ne les connaissons que tr\u00e8s peu. Ce chapitre d\u00e9peint la nature des textes num\u00e9riques et surtout montre comment la d\u00e9composition de l\u2019information en unit\u00e9s discr\u00e8tes nous permet d\u2019\u00e9largir le sens de la lecture au-del\u00e0 du texte s\u00e9quentiel pour inclure la recherche, le comptage, la comparaison et l\u2019association. Il est alors essentiel de comprendre le r\u00f4le de l\u2019informatique dans l\u2019entreprise litt\u00e9raire\u00a0: elle peut nous aider \u00e0 r\u00e9pondre \u00e0 des questions quantitatives, mais celles-ci ont tendance \u00e0 \u00eatre banales et \u00e0 manquer de contexte. Le vrai potentiel du texte num\u00e9rique r\u00e9side en sa capacit\u00e9 de faire prolif\u00e9rer les repr\u00e9sentations des textes et de nous amener \u00e0 poser de nouvelles questions interpr\u00e9tatives.<\/p>\n<p>&nbsp;<\/p>\n<p>&nbsp;<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Les usages du texte num\u00e9rique, la mani\u00e8re de l\u2019exploiter, mieux comprendre les outils analytiques dans ce domaine, autant de bonnes questions pos\u00e9es concernant la bonne pratique de production des contenus&#8230;<\/p>\n","protected":false},"author":40,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":[],"categories":[1],"tags":[],"_links":{"self":[{"href":"https:\/\/fonderie-infocom.net\/blognumerique\/index.php\/wp-json\/wp\/v2\/posts\/2312"}],"collection":[{"href":"https:\/\/fonderie-infocom.net\/blognumerique\/index.php\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/fonderie-infocom.net\/blognumerique\/index.php\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/fonderie-infocom.net\/blognumerique\/index.php\/wp-json\/wp\/v2\/users\/40"}],"replies":[{"embeddable":true,"href":"https:\/\/fonderie-infocom.net\/blognumerique\/index.php\/wp-json\/wp\/v2\/comments?post=2312"}],"version-history":[{"count":0,"href":"https:\/\/fonderie-infocom.net\/blognumerique\/index.php\/wp-json\/wp\/v2\/posts\/2312\/revisions"}],"wp:attachment":[{"href":"https:\/\/fonderie-infocom.net\/blognumerique\/index.php\/wp-json\/wp\/v2\/media?parent=2312"}],"wp:term":[{"attributes":{"taxonomy":"category","embeddable":true},"href":"https:\/\/fonderie-infocom.net\/blognumerique\/index.php\/wp-json\/wp\/v2\/categories?post=2312"},{"attributes":{"taxonomy":"post_tag","embeddable":true},"href":"https:\/\/fonderie-infocom.net\/blognumerique\/index.php\/wp-json\/wp\/v2\/tags?post=2312"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}