Ce document est un support de cours. Il donne quelques bases pour permettre de mieux comprendre l’évolution et le fonctionnement du web. Il détaille notamment divers points techniques qui permettent de mieux se l’approprier.
Un bon complément de ce cours est l’URL
http://cui.unige.ch/eao/www/Internet/Plan.html qui est un cours en ligne
mis à disposition par son auteur Bertrand Ibrahim de l’université de
Genève.
La consultation du lien suivant permet de se faire une idée de l’évolution de l’internet et du web.
Pour résumer :
Pour http://dino.education.fr/accueil/sommaire.htm/#meteo,
http:// signifie le service web4 situé
sur le même ordinateur, et désigne un endroit repéré par une ancre placée dans le fichier sommaire.htm. Losrque l’on demande juste de http://dino.education.fr/, on aura en fait la page
d’accueil du site web en question5.
En dehors des sites commerciaux, l’empreinte des universitaires est encore très présente sur le web et dans les forums. Le principe général est "j’ai créé des documents, je n’en perd pas l’usage si je les partage". Ce principe est repris notamment par les partisans des logiciels libres 6.
Pour le web comme pour d’autres services, les différentes normes de l’HTML n’ont pas été mises au point en un jour. Plusieurs entreprises regroupées au sein du consortium W3C 7 y ont oeuvré. Le premier navigateur, Mosaïc de NSCA8, fut mis à la disposition du public gracieusement. Ensuite, Netscape, entreprise privée, développa Netscape Navigator et participa activement au développement de la norme. Ce navigateur a équipé 8O% des machines connectées durant quelques années. Microsoft arrive dans les années 90 et tentent d’imposer un réseau "parallèle" : MSNet. Il développe alors le navigateur Internet Explorer. Le projet de réseau indépendant tourne court et l’entreprise développe ensuite son projet à l’intérieur de l’internet. Le fait que le navigateur fut ensuite installé d’office avec le système d’exploitation Windows explique le fait qu’aujourd’hui, c’est Microsoft qui détient 80%9 du marché des navigateurs. L’icône Internet du bureau de Microsoft Windows lance en fait une connection à l’internet et lance le navigateur Internet Explorer qui s’ouvre tout naturellement sur la page d’accueil de l’entreprise Microsoft. Le problème est que cette entreprise cherche à capter le marché en imposant ses normes sans vouloir les normaliser. Le navigateur Opera propose quelques fonctionnalités originales. A l’inverse de Netscape Navigator et d’Internet Explorer, celui-ci est payant mais on peut l’utiliser gratuitement si on accepte un petit bandeau publicitaire en haut de la fenêtre du logiciel. Il fonctionne sur beaucoup de systèmes différents à l’inverse d’Internet Explorer.
Mozilla, logiciel libre et gratuit, est disponible sur plusieurs plate-formes et peut être téléchargé sur http://frenchmozilla.sourceforge.net/.
Concernant les différents logiciels, leur fonctionnement est similaire et chacun a ses points forts et faibles. Le tout est de savoir si en tant que citoyen, nous souhaitons qu’une seule entreprise fournisse le seul logiciel qui nous permettra de rechercher des informations, de gérer nos comptes bancaires, d’envoyer et de recevoir des messages, nos déclarations d’impôts, etc. ou si nous souhaitons garder des possiblités de choix. Il est clair qu’il vaut mieux y être sensibilisé avant que cela se produise.
Lorsque l’on utilise un navigateur, l’adresse sur laquelle on clique ou celle que l’on tape peut ne pas fonctionner. Il peut y avoir au moins deux raisons. La première est que le nom de l’ordinateur utilisé est erroné. La deuxième est que le chemin de la ressource est erroné et donc qu’on ne peux pas la trouver sur l’ordinateur en question. En général, le navigateur donne une page d’explication en anglais.
Dans le deuxième cas, on peut en général retrouver rapidement la ressource recherchée. Il suffit d’effacer dans la barre d’adresse le nom du fichier puis de valider. En cas d’échec, effacer le nom du dernier dossier et de valider, et ainsi de suite. Au pire, on obtiendra la page d’accueil du site en question.
Par exemple, si je cherche
http://www.education.fr/accueil/profs/index.htm et que je tape
http://www.education.fr/accueil/profs/inde.htm, j’obtiens une erreur. Je
peux ensuite tenter
http://www.education.fr/accueil/profs/. En cas d’échec, j’essaie
http://www.education.fr/accueil/
et enfin
http://www.education.fr/ qui me donne la page d’accueil du portail de
l’éducation en France du Ministère de l’Éducation Nationale.
Notons pour commencer que le bouton Rechercher d’un navigateur aboutit en général à la page de recherche du concepteur du logiciel et que ces systèmes sont peu performants.
Pour trouver des informations sur le web, on peut utiliser différents systèmes de recherche d’informations.
Voyons quelques éléments qui permettent de chercher une information sur le web. Le lecteur pourra se reporter à http://www.abondance.com/ pour de multiples compléments pertinents sur le sujet et notamment sa FAQ10.
Certains systèmes proposent deux types de recherche : simple ou avancée. L’aide est proposée au moins sur la page d’accueil11.
Il faut distinguer la langue de l’interface – des informations qui s’affichent lors de la recherche – de la langue des sites recherchés. L’interface peut-être en langue anglaise et me permettre de rechercher des sites en français ou d’autres langues.
Quelques éléments de syntaxe sont relativement généralisés.
Un signe plus accolé devant un mot signifie que l’on exige sa présence alors qu’un signe moins signifie que l’on ne souhaite pas voir apparaître ce mot. Par exemple, +vanille +fraise chocolat -menthe donnera généralement des liens vers des pages qui contiennent obligatoirement les mots fraise et vanille, éventuellement chocolat et jamais menthe.
On peut souvent utiliser les connecteurs logiques AND, OR, NOT. Par exemple, vanille AND fraise donnera généralement des liens vers des pages qui contiennent les deux mots ou éventuellement vers des pages qui n’en contiennent qu’un seul.
Certains systèmes ignorent les caractères accentués12 du français alors que d’autres en tiennent compte. Il en est de même pour la casse13 des lettres. En général, "langue française" – avec les guillemets – impose que l’expression soit complète alors que langue française – sans les guillemets – peut renvoyer des liens vers des pages où langue est situé en bas de la page alors que française est situé en haut de la page, ces deux termes n’ayant rien à voir l’un avec l’autre. Sur Altavista, NEAR demande à ce que deux mots ne soient pas séparés eux-mêmes par plus de 10 mots. Cette fonctionnalité n’est pas proposée en général.
Pour dresser une typologie des systèmes disponibles, on définit généralement trois types de systèmes : les annuaires ou catalogues thématiques, les moteurs de recherche, les méta-moteurs. Il arrive aussi que certains sites proposent les trois types mais il reste toujours une dominante.
Enfin pour expliquer que cette puissance de recherche est à notre disposition à titre gracieux, il faut fournir quelques explications. Vous trouverez en général sur ces sites des bandeaux publicitaires qui sont modifiés en fonction de votre équation de recherche, des services annexes fournis par des partenaires comme des sites de ventes de livres par correspondance. Ces systèmes sont aussi des vitrines de la technologie qu’ils exploitent et qui peut être vendue à des entreprises pour leurs réseaux internes.
Ce sont des sites où l’on trouve des liens classés par thèmes de manière plus ou moins hiérarchisés. Ces sites ont été indexés manuellement et l’on peut effectuer une recherche dans tout le catalogue ou limitée à un thème, une catégorie. On peut aussi parcourir les différentes catégories et lister les sites proposés dans chacune d’elles. Étant donné que cette indexation est "manuelle", la liste des liens répertoriés est grande mais limitée et concerne des thèmes « grand public ». En général, seules les pages d’accueil des sites sont présentées.
Quelques exemples :
Des "robots logiciels" surfent sur le web et explorent les sites jusqu’à une certaine profondeur – dans la hierarchie des dossiers. Les mots sont indexés automatiquement après avoir été éventuellement filtrés. Une recherche sur ce type de système donne énormément de liens – pas toujours vers la page d’accueil des différents sites. Le classement des réponses dépend du moteur utilisé. Il est très rare de n’avoir aucune réponse et très courant d’en avoir plusieurs centaines de milliers. Il est donc utile de se reporter à l’aide disponible à partir de la page d’accueil.
Ces systèmes interrogent les deux autres catégories (annuaires et moteurs). Il existe par exemple http://www.wwsearch.com/. Le logiciel Copernic existe dans une version gratuite et permet d’interroger d’autres moteurs. Il a ses adeptes mais nécessite d’être installé sur la machine alors que les autres systèmes de recherche sont simplement disponibles sur le web.
Ce document est en cours de rédaction. Le lecteur voudra bien pardonner les éventuelles erreurs qu’il contient.