SELFHTML

Identifications Client

Page d'information: vue d'ensemble

vers le bas Généralités sur les identifications client
vers le bas Identifications client de navigateurs Netscape
vers le bas Identifications client de l'Explorer Internet MS
vers le bas Identifications client d'autres navigateurs
vers le bas Identifications client de robots de recherche et d'agents proxy

 vers le bas 

Généralités sur les identifications client

Quand un navigateur Web ou un robot de recherche ou l'agent d'un serveur proxy réclame des données à un serveur Web, il envoie toujours une chaîne de caractères avec laquelle il se présente nommément auprès du serveur Web. Un schéma uniforme ou standardisé a été standardisé pour le faire dans la spécification sur HTTP 1,1. Après l'annonce de la présentation d'un "User-Agents" - agent utilisateur- (c'est le terme générique pour les programmes nommés au début qui peuvent réclamer des données) est envoyée au moins une indication ou un commentaire sur le produit. La distinction entre les différentes versions ou types de produits nécessaire pour la pratique n'est pas définie. C'est regrettable. Dans la pratique, une certaine règle s'est dégagée: le nom du produit et la version du produit sont représentés dans cet ordre, séparés par une barre oblique. Tous les navigateurs ne s'en tiennent pas, il est vrai à ce schéma. Quelques types de navigateurs se font passer pour d'autres, et d'autres encore permettent aussi à l'utilisateur de choisir dans les options du programme une identification quelconque. Quand l'utilisateur entre alors son nom ou une ineptie quelconque, le navigateur s'en servira pour s'annoncer au serveur.

Toutefois l'identification client est sauvegardée à certain endroits et peut servir, dans certaines situations, des fins utiles:

 vers le hautvers le bas 

Identifications client de navigateurs Netscape

Netscape se donne depuis son origine le nom de Mozilla. Cela ne suffit pas du tout à l'identifier clairement, car l'Explorer Internet se donne également par exemple le nom de Mozilla. Les exemples qui suivent montrent quelques identifications typiques qui ne le sont toutefois que pour Netscape.

Exemples:

Identification
Mozilla/2.0(Macintosh;I;PPC)
Mozilla/2.0(Win16;I)
Mozilla/3.01Gold[de](Win16;I)
Mozilla/4.03 [en] (X11; I; Linux 2.0.30 i686)
Mozilla/4.01 [en] (Win95; I)
Mozilla/4.01 [en]C-CCK-MCD (WinNT; I)
Mozilla/4.01 [en]C-FedExIntl (Win95; I)
Mozilla/4.5 [en] (X11; I; SunOS 5.6 sun4d)
Mozilla/4.6 [en] (X11; I; FreeBSD 3.2-RELEASE i386)
Mozilla/5.0 [en] (WinNT; I)
Mozilla/5.0b1 [en] (X11; N; Linux 2.2.0 alpha; Nav)

Explication:

Le schéma fondamental pour le nom de produit et la version est donc tenu - L'identification commence toujours par Mozilla/[mention de version]. Ce qui de permet pas de distinguer de nombreux autres navigateurs! La mention de version peut aussi contenir des mentions supplémentaires comme 5.0b1 (ce qui figure d'ailleurs pour la version 6.0, étant donné que la version 5.0 a été sautée et b1 figure pour "version Bêta 1". D'autres additifs comme 3.01Gold peuvent aussi figurer (Gold figurait à l'époque pour la première variante du navigateur Netscape qui permettait en même temps l'édition Wysiwyg, donc un précurseur du Composer Netscape).

Derrière la mention de version peut suivre entre crochets une Autre page d'information abréviation de langue, qui donne la langue des éléments de contrôle du navigateur. Cette abréviation de langue est certes standard pour les versions plus récentes mais il peut arriver qu'elle manque.

D'autres informations suivent enfin entre parenthèses. S'il y en a plusieurs, elles sont séparées les unes des autres par des points-virgules. D'abord est nommée la plate-forme utilisée. Ici des abréviations comme Win95, Win98 ou WinNT dont possibles pour les versions Windows correspondantes. Pour tous les systèmes basés sur Unix, c'est la plupart du temps X11 qui est mentionné à cet endroit, ce qui figure pour X-Windows, et pour les ordinateurs Mac, c'est Macintosh.

En deuxième position dans les parenthèses suit une majuscule qui désigne le niveau de sécurité du navigateur (longueur de clés). Un U figure pour "conforme US", un I pour "international". En ce qui concerne le N dans le dernier des exemples ci-dessus, il n'était pas possible de retrouver ce pour quoi il figurait.

Derrière le signe de sécurité, suivent ensuite encore des informations descriptives sur le type de processeur utilisé et/ou d'autres mentions sur le système d'exploitation.

Toutes ces composantes peuvent être séparées par des espaces mais ce n'est pas indispensable.

 vers le hautvers le bas 

Identifications client de l'Explorer Internet MS

l'Explorer Internet s'annonce dans l'identification de son navigateur d'une façon sensiblement moins prétentieuse qu'à l'ordinaire. Il se cache toujours derrière le même nom de code que le navigateur Netscape, mentionne dans un premier temps un numéro de version qui se réfère à Netscape et sort ensuite, introduites par le mot clé compatible, les informations proprement dites qui le concernent. Les exemples suivant montrent quelques identifications typiques de l'Explorer Internet.

Exemples:

Identification
Mozilla/1.22(compatible;MSIE2.01;WindowsNT)
Mozilla/2.0(compatible;MSIE3.0;AK;Windows95)
Mozilla/2.0(compatible;MSIE3.02;Updatea;AK;AOL3.0;Windows95)
Mozilla/4.0 (compatible; MSIE 4.0; Windows 95;BPH01)
Mozilla/4.0 (compatible; MSIE 4.0; Mac_68000)
Mozilla/4.0 (compatible; MSIE 4.0; Mac_PowerPC; e412354MCICDV4.0)
Mozilla/4.0 (compatible; MSIE 4.0b2; Windows 95)
Mozilla/4.0 (compatible; MSIE 5.0; AOL 4.0; Windows 95)
Mozilla/4.0 (compatible; MSIE 5.0; MSN 2.5; Windows 98)
Mozilla/4.0 (compatible; MSIE 5.0; Windows 95)

Explication:

Le schéma fondamental pour le nom de produit et la version suit celui de Netscape et il est donc respecté - L'identification commence toujours par Mozilla/[mention de version]. La mention de version placée derrière correspond à la version du navigateur Netscape, à laquelle l'Explorer Internet qui s'identifie, se donne comme étant pleinement compatible. Ce qui est naturellement toujours à apprécier avec une certaine modération, car un Explorer Internet n'a par exemple à aucun moment interprété l'élément layer en HTML donc l'affirmation de la compatibilité avec Netscape 4.0 n'est pas forcément vérifiée. Partant de là, la mention de version derrière Mozilla/ pour l'Explorer Internet n'est pas vraiment significative.

L'Explorer Internet ne dévoile son identité proprement-dite que dans les parenthèses. Celles-ci contiennent en principe plusieurs mentions séparées par des points-virgules. La première partie est toujours le mot clé compatible. Il est suivi par les quatre majuscules MSIE, qui posent la référence proprement-dite à l'Explorer Internet. Derrière vient la mention exacte de la version.

Toutes les autres mentions peuvent varier et avoir un ordre différent. Pour les désignations du système d'exploitation, on remarque que Windows est mentionné in extenso, alors que les versions Macintosh de l'Explorer Internet sont sorties couramment avec Mac plus tiret de soulignement plus désignation plus précise. Quand il s'agit de la fourniture du navigateur par un service en ligne comme AOL ou MSN, c'est précisé dans une mention additionnelle telle que AOL 4.0.

Toutes ces composantes peuvent être séparées par des espaces mais ce n'est pas indispensable en particulier pour les versions plus anciennes.

 vers le hautvers le bas 

Identifications client d'autres navigateurs

Les exemples suivants montrent quelques identifications typique de quelques types d'autres navigateurs.

Exemples:

Identification
Mozilla/1.2 (Opera/2.02)
Mozilla/3.0 (compatible; Opera/3.0; Windows 95) 3.51
Mozilla/3.0 (Windows 4.10;US) Opera 3.60 [en]
DosLynx/0.8a
Lynx 2.4-FM
Lynx 2.5 libwww-FM/2.14
Lynx 2.9 (compatible Interactive Tcl/Tk News Ticker v0.06)
Lynx/2-4-2 MU-MODS
Lynx_ALynx/2.4 AmigaPort/1.29
amaya/V2.0a libwww/5.2.1
AIR_Mosaic(16bit)/v3.10.198.18
IBM WebExplorer DLL /v1.1
IBrowse/1.2 (AmigaOS 3.1)
iCab/Pre1.4 (Macintosh; I; PPC)

Explication:

Les exemples montrent combien la façon dont les différents types de navigateurs s'identifient est hétérogène, ce qui ne facilite pas vraiment l'évaluation. En règle générale pour l'analyse avec un script par exemple, seule la recherche de mots-clés propres à chacun d'entre eux comme Opera, Mosaic, amaya, Lynx ou ICab peut aider dans un premier temps. Dans une deuxième étape, vous pouvez alors essayer en recherchant des expressions partielles telles que Win, Mac, Amiga etc... de déduire le système d'exploitation.

 vers le hautvers le bas 

Identifications client de robots de recherche et d'agents proxy

Il n'y a pas de recette miracle pour différencier les "visiteurs humains de pages Web" des programmes logiciels qui lors de l'appel des pages Web les traitent par lots et indexent par exemple les données pour leur moteurs de recherche ou transmettent les fichiers à un ordinateur proxy. Les exemples suivants montrent quelques identifications typiques de ces programmes.

Identification
Eule Robot v3.00 (www.eule.de)
FAST-WebCrawler/0.3 (crawler@fast.no)
Googlebot/1.0 (googlebot@googlebot.com http://googlebot.com/)
JCrawler/0.3 (robot; webmaster@netimages.com)
Netscape-Proxy/3.52 (Batch update)
Openfind Robot/1.1A2
W3CRobot/4.0D
WebCrawler/2.0
Lycos_Spider_(T-Rex)/3.0
Aladin/3.324
taz.northernlight.com Gulliver/1.3
Openfind Robot/1.1A2
KIT-Fireball/2.0
URL-Minder/2.4.5

Explication:

Pour les moteurs de recherche, il existe au moins quelques points de repère après lesquels il est possible d'effectuer des recherches dans une chaîne de caractères servant à l'identification. Ces robots s'identifient souvent avec des mots clés tels que Robot, Spider ou bien Crawler. Nombre d'entre eux comprennent aussi dans le nom, le nom du service de recherche correspondant. Dans les exemples ci-dessus, sont reconnaissables par exemple Google, Fireball, Lycos, Eule, Northernlight et Aladin. En général on peut reconnaître souvent les robots et aussi les agents de serveurs proxy en ce qu'ils mentionnent lors de l'identification un nom de domaine, une URI ou une adresse électronique.

 vers le haut
page suivante Autre page d'information robots.txt - contrôler les robots
page précédente Autre page d'information Abréviations de langue
 

© 2001 Stefan Münz / © 2003 Traduction Adresse électronique Serge François, 13405@free.fr
Adresse électronique selfhtml@selfhtml.com.fr