Dans cet article, nous tenterons de résumer le Chapitre 9 du livre Pratiques de l’édition numérique (disponible à ce lien : http://www.parcoursnumeriques-pum.ca/les-formats). Il s’intitule « Les formats » et a été écrit par Viviane Boulétreau et Benoît Habert.
Nous apporterons ainsi une réponse aux questionnements suivants :
Qu’est-ce qu’un format ?
Lequel choisir ?
Pour quel usage et quelle pérennité ?
Qu’est-ce qu’un format ?
Un format permet une mise en forme des données, destinées à représenter du texte, du son, de l’image ou encore de la vidéo. Cette mise en forme doit respecter des standards prédéfinis. On peut alors qualifier le format de « gabarit » : les outils qui le traiteront s’attendront à trouver tel élément à tel endroit.
Donnons l’exemple d’une page HTML. La première ligne du document (« <!DOCTYPE html> ») indique à l’outil, par conséquent au navigateur, qu’il s’agit d’un fichier au format .html. Ce format repose sur une mise en forme stricte : des couples de balises ouvrantes et fermantes attendant chacune un certain type d’information. Si nous venions à commettre une erreur de programmation (une balise « body » contenue dans la balise « head »), le navigateur ne pourrait alors pas décrypter la page.
Pour nous guider dans ce choix format/outils, notre ordinateur utilise un mécanisme de détection qui associe au format de chaque document un outil adapté. Si l’application ne trouve pas d’outil adéquat, alors elle nous demandera de l’installer.
Malgré toutes ces précautions, il se peut que certaines erreurs persistent. Une ancienne version d’un logiciel peut ne pas prendre en compte un nouveau format. Ou inversement, un ancien format peut ne pas être pris en compte par un nouveau logiciel.
Lequel choisir ?
Nous avons deux grandes catégories de format :
- les formats propriétaires : ce sont des formats contrôlés par une entité privée, à usage limité.
- les formats libres (ou ouverts) : ce sont des formats publiques, sans restriction d’accès ou de mise en œuvre.
Il faut savoir que le plus souvent, ce choix de format est fait à notre insu. On parle alors de « formats invisibles ».
Dans le cas d’une prise de décision, si nos objectifs ont été clairement définis, il ne sera pas difficile de choisir une famille de formats. Nous devons nous poser la question de l’Interopérabilité (capacité à fonctionner avec d’autres dispositifs) et de la Pérennité (durée de vie du document).
Pour quel usage et quelle pérennité ?
Les formats textuels :
Le format PDF (.pdf) est un format à privilégier pour l’affichage, l’impression, la conservation de la mise en page ou encore la transmission des données (sur le Web, par courriel ou sur supports physiques (disque, clé USB)).
Ce format offre bon nombre d’avantages. Son outil de lecture est gratuit. Et il permet de sécuriser ses données : un avantage non négligeable à l’ère de la libre circulation de l’information. Aujourd’hui le format .pdf est devenu un « standard de fait » : les outils concurrents sont contraints à lire ce format, devenu leader du marché.
Le format OpenDocument ou .docx rend possible la modification par l’auteur ou par un second utilisateur. De plus, il permet de conserver l’historique du fichier.
Le format PDF/A permet une durée de vie prolongée du document.
Les formats images :
On distingue deux types de formats d’images :
- les formats matriciels (ou bitmap): ce sont des formats qui stockent les informations sur chaque pixel de l’image. On parle alors de matrice de points. Ils sont utilisés dans le cas d’images simples.
- les formats vectoriels : ce sont des formats qui stockent les informations sur les courbes et les lignes qui composent l’image. Ils sont utilisés dans le cas d’images complexes ; pour permettre un changement d’échelle immédiat et une meilleure impression.
Je vous recommande la consultation d’un tableau résumant les formats possibles d’une image, disponible au lien suivant : http://www.parcoursnumeriques-pum.ca/les-formats.
En voici un extrait :
Pour la manipulation d’une image, nous préférerons une version à la qualité optimale (TIF, PNG). Le format JPG ne sera utilisé qu’une fois le traitement fini, pour une mise en ligne ou un envoi par mail.
Les formats vidéo :
Pour une vidéo, on distingue des flux de nature différente (le flux vidéo, le flux audio et des flux textuels tels que les sous-titres). Le codec permet l’encodage et le décodage de chacun de ces flux et ces derniers sont stockés dans un conteneur commun, pour une meilleure synchronisation.
Une vidéo se compose donc d’un conteneur, d’un codec vidéo et d’un codec audio.
Quelques formats conteneur :
- AVI : mis au point par Microsoft, lisible par la plupart des outils;
- FLV : format de la société Adobe, très utilisé sur Youtube.
Quelques formats vidéo :
- WMV : format propriétaire développé par Microsoft;
- DivX : développé par DivxNetworks, format dérivé de MPEG-4.
Quelques formats audio :
- WAVE : format propriétaire développé par IBM et Microsoft;
- MP3 : format de compression avec perte (norme ISO).
À chaque combinaison correspond un format de stockage potentiel. L’utilisateur dispose donc d’une grande souplesse pour coder un fichier multimédia.
Sauf que dans la pratique, le lecteur multimédia (l’outil) restreint cette flexibilité. En effet, il ne supporte qu’un nombre limité de conteneurs et de codecs.