| 1. Le format texte |
| ASCII |
|
| ASCII étendu |
Exemple : Windows en français: Table ANSI (ISO Latin 1) |
Le format ASCII et la préservation :
|
| 2. Les formats structurés |
Pour donner une forme au document, le logiciel procède à une structuration syntaxique. Pour effectuer ce type de structuration, des chaînes de caractères sont ajoutées pour délimiter le début et la fin d’un segment qui correspond à un objet conceptuel: ce sont des balises (visibles comme dans les formats structurés) ou des codes (cachés comme avec Word). Il y a deux types de balisage ou de codage : Le balisage procédural (opérations de mise en page) et le balisage descriptif (logique). |
| SGML : Standard Generalized Markup Langage |
|
| HTML : Hypertext Markup Langage |
|
| XML : Extended Markup Langage |
|
Les formats structurés et la préservation :
|
| 3. Portable document format (.pdf) |
|
Le format PDF et la préservation :
|
| Les formats Word(.doc) et Rich text format (.rtf) |
|
Les formats doc et rtf et la préservation :
|
| Unité de mesure | Mesure | Exemple |
| 1 bit | Unité de base | 0 ou 1 |
| 1 octet | 8 bits | 1 caractère d’imprimerie |
| 1 kilo-octet | 1024 o | 2 Ko équivalent à une page de texte simple |
| 1 mega-octet | 1024 ko | 500 pages de texte simple 2 Mo égalent le poids d’une photo haute résolution |
| 1 giga-octet | 1024 mo | 1 Go équivaut à un film en qualité TV 15-20 Go un disque dur |
| 1 Teraoctet | 1024 go | 10 To, la totalité des volumes de la bibliothèque du Congrès américain |
| 1 Petaoctet | 1024 to | 8 Po, l’ensemble de l’information disponible sur Internet |
| 1 Exaoctet | 1024 po | 5 Eo : l’ensemble des mots prononcés depuis l’aube de l’humanité |
| 1 Zettaoctet | 1024 eo | Pas encore d’exemple… |
| 1 Yottaoctet | 1024 zo |
Dessin : Un type d’image qui utilise de grands blocs d’une seule couleur ou des tons de gris plutôt que des petits points séparés. (Savage)
Image en simili : Un type d’image qui simule les échelles grises en utilisant des points de tailles variées, comme on en utilise communément dans les photos de journal en noir et blanc. (Savage)
Photographie : Un type d’image avec une haute définition, incluant plusieurs tons différents de gris ou de couleurs.<(A HREF="#Savage">Savage)
Animation : Technique cinématographique qui permet par des prises de vues image par image de créer le mouvement d'objets et de personnages animés. (Animation GIF ou Flash…) (OLF, http://www.gouv.qc.ca/)
Vidéo : Ensemble des techniques permettant la formation, l'enregistrement, le traitement, la transmission ou la reproduction d'images (y compris les techniques de reproduction du son associé à ces images) sur un écran de visualisation. (OLF, http://www.gouv.qc.ca/)
Le nombre total d’octets dans une image. Influencé par 4 attributs :
Un format d’image inclut les 3 autres attributs...
À cela peut-être ajouté un taux de compression :
Méthodes employées à l’aide d’algorithmes de compression pour réduire la taille d’un fichier. Il y a la compression à perte (souvent plus efficace) et la compression sans perte. La compression sans perte donne une image identique à celle qui existait avant la décompression.
Quelques algorithmes de compression :
LZW: Gif et PNG
DCT: Jpeg
Format MPEG-4
Format DIVX
A. Formats à trames
Stockent l’information au sujet des pixels individuels.(Shapiro)
Pixel
Élément le plus petit d'une surface d'affichage auquel on puisse associer individuellement une couleur (ou un niveau de gris) et une intensité.
Le pixel étant la plus petite surface homogène d'une image, il est en quelque sorte l'équivalent d'un point. Dans le cas d'un écran monochrome, le pixel s'identifie avec le point et, dans le cas d'un écran couleur, il est constitué de trois points de couleurs différentes (rouge, vert, bleu). En variant l'intensité de chacun des points, on peut faire apparaître des milliers de couleurs différentes.
(Dictionnaire de l’OLF, http://www.gouv.qc.ca/)
B. Formats vectoriels
Stockent l’information au sujet des lignes et des courbes qui composent un dessin. (Shapiro)
Vectorisation
Opération qui consiste à convertir une image en mode point en une image en mode vectoriel à l'aide d'un programme informatique prévu à cet effet.
Dessin Vectoriel
Contrairement au dessin à trames où les objets sont composés de pixels, le dessin vectoriel est composé d'objets qui sont des courbes mathématiques (dites de Bézier, du nom du mathématicien qui les a inventées) ou des droites et segments qui ont une couleur et une taille. Leur principal avantage est de ne pas souffrir du phénomène de pixellisation lorsqu'on cherche à faire un zoom sur une partie de l'image. Automatiquement les courbes composant le dessin sont recalculées pour être mises à l'échelle.
Comme le dessin ne comporte que des cordonnées mathématiques, son poids numérique ne varie pas avec la taille de l'image, mais plutôt avec l'accumulation de tracés différents, contrairement au format à trames qui voit sa taille augmenter avec le nombre de pixels.
Référence : (http://perso.wanadoo.fr/cyberial/webmaster/Photoshop/Tutoriaux/vectorisation.htm)
                                       Exemple :
| La lettre V (à trames) | La lettre V (vectorisée) |
![]() |
![]() |
Quelques formats communs
| Formats à trames | Formats vectoriels |
GIF (Graphics Interchange Format)
|
PDF (Portable Document File) Se référer à la page 2...
|
JPEG (Groupe mixte d'experts en photographie)
|
SVG (Scalable Vector Graphics)
|
Fichiers en mode point (Bitmap)
|
SMIL (Synchonized Multimedia Integration Language)
|
PNG (Portable Network Graphics)
|
Moving Picture Expert Group (.mpeg)
|
TIFF (format d'étiquette de fichier image)
|
Notions de transparence et d'entrelacement
La transparence
Les formats qui supportent la transparence peuvent choisir une couleur comme étant transparente, ce qui signifie que les pixels de cette couleur apparaîtront identiques aux pixels directement "derrière" eux à l'écran. Par exemple, si une page W3 comporte un fond rose et qu'un "transparent GIF" s'affiche sur cette page, les pixels transparents apparaîtront en rose, même s'ils affichent une couleur différente dans un logiciel de dessin.
L'entrelacement
Lors de l'affichage de l'image (processus de décompression), les trames de pixels qui composent l'image ne s'affichent pas par ordre séquentiel de haut en bas. Au lieu de cela, des tranches du graphique s'affichent dans toute l'image, qui se recompose graduellement durant le processus de décompression. L'effet à l'écran se traduit par une image complète, même si elle est au départ très embrouillée, et elle se précise graduellement après une série de passages. Il s'agit du cheminement inverse d'une image non entrelacée qui apparaît comme une trame à définition complète au haut de l'image, puis qui baisse comme un rideau vers le bas. L'avantage de l'entrelacement, c'est qu'il procure rapidement un aperçu de l'image avant qu'elle ne soit représentée en détail.
(Explications empruntées à Shapiro, 1996)
Aussi appelé amplitude des nombres en mémoire : Si la couleur ou le contraste est important, il faut établir le nombre de couleurs ou de nuances de gris à utiliser. Un nombre plus grand de couleurs ou de gris augmente la taille de l'image. L'amplitude des nombres en mémoire est indiquée habituellement en bits, comme 8-bits (256 couleurs) ou 24-bits (16 millions de couleurs).
Plus l'amplitude est grande, plus la taille des fichiers est élevée.
a) L'image bit map
b) L'image 256 niveaux de gris
c) L'image 256 couleurs

C. Boudry, URFIST, 2002
d) L'image 16 millions de couleurs (True Color)

C.Boudry, URFIST, 2002
La concentration de points par pouce dpi (dots per inches) ou ppp (points par pouce).
La résolution d'une image numérique définit le degré de détail qui va être représenté sur cette image.
Plus la résolution est élevée, plus le poids du fichier augmente.
Se calcule en pixels (hauteur X largeur)
                                               Exemple:
La taille d'un écran = 800 X 600 pixels environ
Plus l'image est grande, plus le poids sera élevé
La stratégie doit s’implanter dès le début du processus archivistique…
Rappel des fonctions archivistiques :
Quelques paramètres à considérer au niveau de la description, de la diffusion et de la préservation...
La description: exigences
a) Récupération des informations :
La récupération efficace des informations dépend de la capacité d'accéder à une base de données précise et indexée. L’indexation des images comporte des défis tels que :
b) Conserver le contexte :
Des en-têtes de fichiers d'images sont nécessaires pour que l'on puisse inclure toutes les métadonnées pour préserver le contexte et l’intégrité des images. Or, peu de formats supportent les métadonnées (tiff, jpeg2000).
La diffusion: exigences
a) L’écran ou l’impression : le résultat variera en fonction de plusieurs paramètres. Cette problématique doit être envisagée avant la création ou l’acquisition.
| Sur l’écran | Sur papier |
|
|
(Résumé des articles de Savage et Boudry)
b) La largeur de la bande passante : si la diffusion se fait à travers un réseau.
Il faut réaliser un compromis entre la qualité acceptable d'une image et la taille optimale du fichier en regard à l’utilisation.
La préservation: exigences
Les formats de préservation privilégiés par les institutions ?
                   L’étude du RLG

Résultats : TIFF (80.6%) JPEG (38.9%) PDF et GIF (30.6%), MPEG
|
|
|
|
|