Accueil M'écrire
XML

 

 

Qu'est ce que XML ?

XML est un langage de marquage constitué de balises tout comme HTML. Il se situe à mi-chemin entre SGML - le langage de référence en milieu professionnel pour la gestion électronique des documents (GED) - et HTML que l'on rencontre tous les jours sur l'internet.

Tout comme son cousin HTML, XML est directement issu de SGML. Cependant, il s'en rapproche davantage dans le sens où l'ont peut dire que XML est une forme simplifiée de SGML, car ce dernier est trop complexe pour s'afficher sur le WEB.

XML est l'acronyme de eXtensible Markup Language, cela signifie que XML n'est pas un langage sémantiquement figé comme peut l'être HTML mais au contraire un langage ouvert. C'est à dire que l'auteur d'un document XML peut créer ses propres balises, par exemple : la balise <INSTRUMENT> peut être définie pour désigner un instrument de musique. Cela s'écrirait de la façon suivante :

<INSTRUMENT>Guitare</INSTRUMENT>

Dans un document XML, on s'efforcera de ne pas tenir compte de la mise en forme mais seulement du contenu de celui-ci; la mise en forme étant réalisée par la feuille de style.

Dès lors, ont peut imaginer d'innombrables possibilités que nous offre un tel langage; par exemple dans l'échange de données informatisées (EDI). Prenons par exemple le secteur automobile, on pourrait employer les balises suivantes pour décrire un véhicule: <TYPE MINE>, <CHASSIS>, <MOTEUR>, <COULEUR>, ...

Les données pouvant être structurées, comme on définirait un enregistrement Moteur dans tout langage de programmation ou bien dans une base de données, en XML on écrirait :

<MOTEUR>
        <PUISSANCE>......</PUISSANCE>
        <CYLINDREE>......</CYLINDREE>
        <NB SOUPAPES>......</NB SOUPAPES>
</MOTEUR>

Et puisque dans un document XML l'information pertinente est marquée par des balises portant des noms significatifs, il sera plus facile de retrouver l'information en s'appuyant sur le nom de ces balises pour effectuer des recherches.
En effet, en HTML on ne sait faire actuellement  que de la  recherche plein-texte (full-text), ce qui la plupart du temps nous retrouve beaucoup de documents qui n'ont rien à voir avec notre recherche de départ, c'est ce que l'on appelle le bruit.

Dans notre exemple :

  • Un moteur de recherche pourrait aisément retrouver tous les documents traitant des moteurs 16 soupapes équipant un chassis d'un type donné. On serait alors sûrs que les réponses correspondraient exactement à nos critères de sélection. Ainsi, les autres documents ne traitant qu'un seul de ces deux critères ne seraient pas retournés.
  • De même que l'utilisateur obtenant ces réponses pourrait demander à son application de les classer par puissance de ces moteurs.
 

© kangoo's 1996 - 2006 - Crédits