Les métadonnées

Exemples de métadonnées

Cette page se veut une ressource pour élèves de seconde (cours de SNT). Par conséquent, nous ne développerons pas les aspects techniques des métadonnées (sauf un peu pour le HTML) et nous nous contenterons de montrer quelques exemples d’affichages.

 

Les métadonnées

Une métadonnée est une donnée un peu particulière. Elle apporte des informations sur le contenu d’un fichier, en particulier sur sa création, tout en faisant partie de celui-ci. Habituellement, certaines métadonnées sont directement lue par l’utilisateur et d’autres non.

À titre de comparaison, un livre comprend lui aussi des informations en dehors de l'œuvre dont certaines sont toujours lues (l’auteur…) alors que d’autres le sont beaucoup moins souvent (l’adresse de l’éditeur, le numéro d’imprimeur…).

Ces informations diffèrent selon le type de fichier. Par exemple, la localisation précise d’une prise de vue peut décrire une photo mais présente moins d’intérêt pour un morceau de musique (le studio d’enregistrement peut toutefois faire partie des métadonnées).

Il n’y a pas de règle sur la quantité de métadonnées accessibles dans un fichier. Vous pouvez en trouver très peu ou beaucoup, selon les intentions de son auteur. Pour revenir à la localisation, il est évident que vous ne trouverez pas la moindre information sur un fichier image qui provient d’un appareil photo non équipé d’une fonction GPS.

Il existe trois types principaux de métadonnées.

  • Les métadonnées descriptives permettent l'identification. C'est par exemple l'ISBN ou le titre d'un livre.

  • Les métadonnées structurelles définissent la façon dont la donnée est organisée. Exemple : pour un article de presse, la revue dans laquelle il est paru.

  • Les métadonnées administratives fournissent des informations techniques. Le volume d'un fichier, la durée d'exposition d'une photo, l'heure d'envoi d'un courriel en sont quelques exemples.

On considère parfois d'autres types (juridique, statistique...).

Et comme vous souhaitez des exemples plus détaillés, en voici.

numérique

 

Exemple d’une page web

Une page web comprend des balises de description en HTML. La balise de métadonnées se nomme… meta. Son contenu n’est pas souvent lu par les internautes mais il l’est par les moteurs de recherche.

Les balises <meta> sont placées dans le head.

Prenons par exemple deux lignes de code de la page que vous lisez en ce moment.

<meta name = "author" content = "Jean-Yves Baudot" />
<meta name = "Description" content = "Quelques exemples de métadonnées. Niveau classe de seconde (ressources de SNT) " />

La première donne le nom de l’auteur et la seconde indique quel est le contenu de la page afin d'orienter les moteurs de recherche. Vous remarquerez la syntaxe : le type de métadonnée (name) est lié à un contenu (content). Il est recommandé que la « meta description » contienne une phrase allant de 70 à 155 caractères. Un moteur de recherche peut ne pas tout lire si la description est trop longue (plus de 230 caractères).

D’autres types pourraient être ajoutés, par exemple name = "Keywords". Un certain nombre de mots-clés suivrait alors : métadonnées, HTML, photo… Mais en raison d’abus, les moteurs de recherche n’exploitent plus cet attribut tombé en désuétude.

Sans entrer dans les détails, sachez que <meta charset="utf-8"> se trouve sur la quasi-totalité des pages web. L’attribut charset déclare l’encodage de la page.

 

Exemple d’un fichier Word

Sur Windows, le plus simple pour lire les métadonnées d’un fichier Word consiste à ouvrir l’explorateur puis à faire un clic droit sur le nom du fichier. Dans le menu contextuel, cliquez sur Propriétés puis sur Général ou Détails selon les informations cherchées.

Dans le sous-menu Général, vous trouvez l’emplacement du fichier, sa taille, sa date de création, sa date de dernière modification et celle du dernier accès.

Le sous-menu Détail fournit davantage d’informations. En plus les mots clés, vous trouverez des commentaires s’il y en a, le nom de l’auteur, etc. Vous avez aussi des indications sur le contenu, par exemple :

Vous trouvez ensuite la taille du fichier, les dates déjà vues dans le sous-fichier Général, le ou les ordinateurs sur lesquels le fichier a été créé et modifié…

De même, si vous visualisez les métadonnées d’un fichier Powerpoint, vous connaîtrez le nombre de mots, de paragraphes, de diapositives, etc.

 

Exemple d’un fichier image

La même procédure de visualisation s’applique aux fichiers images mais les informations sont évidemment d’une autre nature.

Elles concernent l’image en elle-même (dimensions en pixels, représentation des couleurs…) tandis que d’autres ont été enregistrées par l’appareil photo numérique. Exemple :

Voir la page qui traite plus particulièrement des métadonnées Exif.

Notez qu'elles peuvent aussi être extraites avec un petit programme en Python. Il faut pour cela charger la bibliothèque PIL.

 

Référentiel de métadonnées

Un référentiel de métadonnées est une base de données qui ne stocke que des métadonnées. Il peut être très important pour un analyste qui travaille à partir d'une base de données issue de l'agrégation de plusieurs sources.