Ce document présente une bibliothèque de types, d'éléments et d'attributs permettant de représenter les données d'identification de base manipulées par l'INSEE et ses partenaires. Les types peuvent être utilisés dans les schémas d'applications XML pour représenter ces données sous forme d'éléments ou d'attributs portant des noms quelconques et appartenant à n'importe quel espace de noms et les éléments et attributs peuvent être directement inclus dans n'importe quel document XML.
La description de ces données de base a été scindée en plusieurs modules indépendants décrivant des domaines fonctionnels spécifiques (identification des sociétés, des personnes physiques, des catégories d'activité, des catégories juridiques et des lieux géographiques). Un module commun comporte quelques définitions de base auxquelles font appel les modules spécialisés.
Ce document décrit l'espace de noms INSEE : http://xml.insee.fr/schema/2004
Une version de cette documentation avec cadres (frames) HTML est disponible à l'adresse : http://xml.insee.fr/schema/2004/index.html.
Cette documentation et les ressources qui en dépendent (schémas, exemples, transformations XSLT) sont soumises aux conditions d'utilisation des informations publiées sur le site de l'INSEE.
Cette documentation et les ressources qui en dépendent (schémas, exemples, transformations XSLT) sont disponibles sous forme d'une archive .zip.
Le module commun contient la définition de types de base utilisés par les autres modules.
Le module SIRET concerne l'identification des entreprises et des établissements (numéros SIREN et SIRET).
Le module NIR concerne l'identification des personnes physiques (numéros NIR et dits "de sécurité sociale").
Le module ISO concerne l'identification des pays et territoires.
Le module ISO - énumérations complète la définition du module ISO en définissant la liste des valeurs acceptables.
Le module COG décrit les codes du Code Officiel Géographique (COG).
Le module Code Officiel Géographique - énumérations complète la définition du module COG en définissant les listes des valeurs acceptables.
Le module NAF décrit les codes de la Nomenclature d'Activités Française (NAF).
Le module NAF - énumérations complète la définition du module NAF en définissant les listes des valeurs acceptables.
Le module Catégories Juridiques décrit les codes des Catégories Juridiques des entreprises.
Le module CJ - énumérations complète la défition du module CJ en définissant les listes des valeurs acceptables.
Les schémas de chacun des modules peuvent être importés indépendamment ou au travers de ce schéma incluant tous les modules :
[Document]
§1.
<xs:schema xmlns:xs="http://www.w3.org/2001/XMLSchema" xmlns:ie="http://xml.insee.fr/schema/2004" targetNamespace="http://xml.insee.fr/schema/2004" elementFormDefault="qualified" attributeFormDefault="qualified" version="1.0"> <xs:include schemaLocation="siret.xsd"/> <xs:include schemaLocation="nir.xsd"/> <xs:include schemaLocation="iso.xsd"/> <xs:include schemaLocation="cog.xsd"/> <xs:include schemaLocation="naf.xsd"/> <xs:include schemaLocation="cj.xsd"/> </xs:schema>
Les modules ISO, NAF, COG et CJ disposent également de variantes incluant des contrôles de valeurs par énumération. Si ces variantes réalisent des contrôles plus avancés au niveau de certains types de données et permettent donc de détecter plus d'erreurs, ils présentent l'inconvénient d'être consommateur de mémoire lors de la validation et de n'inclure que les codes en vigueur à la date de publication des schémas. Pour les utiliser, on pourra faire appel à ce schéma qui inclut tous les contrôles de valeurs disponibles :
[Document]
§2.
<xs:schema xmlns:xs="http://www.w3.org/2001/XMLSchema" xmlns:ie="http://xml.insee.fr/schema/2004" targetNamespace="http://xml.insee.fr/schema/2004" elementFormDefault="qualified" attributeFormDefault="qualified" version="1.0"> <xs:include schemaLocation="siret.xsd"/> <xs:include schemaLocation="nir.xsd"/> <xs:include schemaLocation="iso-enum.xsd"/> <xs:include schemaLocation="cog-enum.xsd"/> <xs:include schemaLocation="naf-enum.xsd"/> <xs:include schemaLocation="cj-enum.xsd"/> </xs:schema>
Cette documentation est rédigée sous forme de modules de manière à ce que chaque application puisse utiliser le ou les modules dont elle a besoin.
Les modules NAF, ISO, COG et CJ sont disponibles dans deux versions : version de base définissant le format des données manipulées et version avec énumération reprenant la version de base et ajoutant le contrôle des valeurs par rapport à la liste des valeurs connues au moment de la publication de cette documentation.
Outre les modules fonctionnels (SIRET, NIR, ISO, COG, NAF et CJ), un module commun a été défini qui regroupe des définitions communes utilisées par plusieurs modules.
Les applications peuvent faire appel à deux schémas globaux intégrant tous les modules avec ou sans énumérations ou inclure séparément les schémas de chacun des modules dont elles ont besoin.
Le but de cette modularisation est de permettre à chaque application de n'utiliser que les définitions dont elle a besoin.
On retrouve cette décomposition en modules au niveau de la documentation elle-même : chaque module est documenté de manière séparée.
Pour faciliter la navigation entre les documentations des différents modules, nous proposons l'utilisation de cadres (frames) (X)HTML fournissant une ergonomie comparable à celle des documentations de bibliothèques Java.
Lorsque l'on utilise ce mode de navigation, la fenêtre du navigateur web est décomposée en trois parties :
On notera qu'il est également possible de parcourir la documentation de manière classique, sans utiliser ce mécanisme de cadres.
Cette documentation est publiée sous forme de "répertoires RDDL 1.0" (RDDL 1.0 est une application de XHTML et XLink destinée à documenter les espaces de noms XML sous une forme exploitable à la fois par les utilisateurs humains et des applications informatiques).
Suivant le principe de RDDL, elle s'attache à décrire des ressources liées à l'espace de noms. Ces ressources peuvent être internes et contenues dans la documentation elle-même ou externes et renvoyer à l'extérieur de la documentation.
Une "nature" (correspondant au type de document, par exemple "XHTML", "W3C XML Schema", "XSLT", ...) et une "fonction" ("espace de noms", "référence normative", "validation par schéma", ...) sont associées à chacune des ressources décrites.
La liste des ressources décrites dans chaque document est insérée à la fin du document et c'est également cette liste qui est présentée dans la fenêtre située en bas à gauche lorsque l'on utilise les cadres. Cette liste détaille les ressources suivant leur localisation (interne ou externe), leur fonction et leur nature.
Pour plus d'information sur RDDL, voir http://rddl.org/ (en anglais).
Cette documentation a été constituée en utilisant les principes de la programmation littéraire et les schémas correspondants sont générés à partir des fragments qui figurent dans la documentation elle-même.
Ceci permet d'assurer une parfaite conformité entre les schémas et la documentation et de considérer que les fragments de schémas inclus dans la documentation constituent des références normatives.
Chaque module contient une section "Téléchargements" dans laquelle les fragments de schémas mais également d'exemples et de transformations XSLT sont assemblés pour produire des documents téléchargeables.
Chaque fragment est numéroté (par exemple "§1.") et ces numéros sont repris sous forme de liens lors de l'assemblage des fragments (par exemple "§1.Type Code_Pays_ISO_stype").
L'outil utilisé est le module "litprog" de DocBook, voir http://docbook.sourceforge.net/projects/litprog/.
Les commentaires concernant cette documentation et les schémas associés peuvent être envoyés à publication-xml-dg@insee.fr.
Pour que votre application figure dans cette section, envoyez une courte description comprenant des liens sur la documentation et le schéma à l'adresse publication-xml-dg@insee.fr.
Les ressources suivantes sont définies ou référencées dans ce document :