🠕

4 Le format de fichier GEDZIP de FamilySearch

Il est souvent utile de transmettre un jeu de données accompagné de fichiers externes. Le format de fichier FamilySearch GEDZIP 7.0 est prévu à cet effet. La version 7.0 étant la première version de GEDZIP publiée, le numéro de version d'un fichier GEDZIP correspond à celui du jeu de données qu'il contient.

Un fichier GEDZIP est une archive zip, telle que définie par la spécification du format de fichier .ZIP et normalisée par ISO/IEC 21320-1:2015.

Chaque fichier GEDZIP contient les entrées suivantes:

  • Une entrée nommée gedcom.ged contenant un flux de données.

  • Une entrée pour chaque fichier local local file g7:type-FilePath dans gedcom.ged, avec le même nom de fichier zip que la valeur utile. Si un fichier local nommé gedcom.ged existe, il doit être renommé avec un nouveau nom de fichier inutilisé et la même extension avant la création du fichier GEDZIP.

Tous les noms de fichiers à l'intérieur d'un fichier GEDZIP sont sensibles à la casse.

De nombreux autres formats de fichiers zip (tels que jar, epub, docx, GEDCOM-X) attribuent une signification particulière au répertoire zip META-INF et aux noms de fichiers zip MANIFEST.MF et META-INF/MANIFEST.MF. Ces éléments n'ont aucune signification particulière dans GEDZIP et il est recommandé de ne pas les utiliser dans un fichier GEDZIP, à la fois pour éviter de perturber les systèmes qui analysent les archives zip pour déterminer leur type, et pour permettre leur ajout dans une version ultérieure de cette spécification.

Lorsqu'il est enregistré en tant que fichier, un fichier GEDZIP doit utiliser l'extension de nom de fichier .gdz.

Quelques détails concernant le format d'archive zip sont utiles pour bien comprendre GEDZIP:

  • Une archive peut contenir un ou plusieurs fichiers.
  • Il est possible d'ajouter, de supprimer ou de mettre à jour individuellement les fichiers d'une archive sans avoir à retraiter le reste de l'archive. Des bibliothèques telles que libzip permettent aux applications d'opérer directement sur l'archive zip comme s'il s'agissait d'une arborescence de répertoires classique.
  • Ce que la spécification zip appelle un « nom de fichier » est en réalité un chemin local et peut contenir des répertoires.
  • Les séparateurs de répertoires sont, en interne, de type / et sont convertis au format approprié par l'outil de traitement ZIP lors de la compression et de la décompression. Par conséquent, la décompression d'un fichier GEDZIP dans n'importe quel répertoire local permet de conserver tous les chemins d'accès aux fichiers GEDZIP pour le fichier résultant gedcom.ged, sans traitement supplémentaire.