L'hypertexte
Introduction :
La lecture sur support informatique constitue un nouvel espace à explorer pour les sciences de l’information grâce à l’utilisation d’un réseau interactif qui réinvente le rapport à l’information.
Dans ce cours, nous allons apprendre le sens du concept de l’hypertexte et sa structure. Nous allons voir les liens hypertextes puis la différence entre hypertexte et lien hypertexte. Ensuite, nous allons nous intéresser au World Wide Web et à l’adresse URL.
L’hypertexte
L’hypertexte
Une nouvelle dimension à exploiter
Une nouvelle dimension à exploiter
D’après les découvertes actuelles, on estime que les premiers écrits sont apparu il y a 6000 ans et avaient surtout une fonction pratique : ils servaient souvent à dénombrer ou à attribuer des biens. Les supports et les usages de l’écriture ont beaucoup évolué depuis. Les tablettes et papyrus, uniques, écrits à la main ont laissé place aux livres, imprimés en milliers d’exemplaires.
Les progrès techniques se succèdent jusqu’au milieu du XXe siècle avec la création des ordinateurs où l’écran devient le nouveau support de l’écrit, qui se présente le plus souvent sous forme de textes.
Un texte est une suite de termes généralement conçue pour être lue d’une façon linéaire et séquentielle. Les idées sont découpées d’une façon structurée et logique (paragraphes, pages, chapitres).
Un livre dont le texte occupe plusieurs pages, se lit de manière linéaire c’est-à-dire page par page.
Dès la fin du XIXe siècle on trouve une alternative à la lecture linéaire avec les premiers livres-jeux, mais c’est avec l’arrivée de l’informatique que va émerger la notion d’hypertexte.
Hypertexte :
Le terme hypertexte désigne un texte électronique composé de blocs de textes (unités d’informations) liés entre eux de manière non séquentielle. Ces liaisons se font à travers des hyperliens.
C’est en 1945 qu’est imaginée pour la première fois une machine capable de faire des liens entre des informations. Le memex (ou « extension de la mémoire ») est décrit par Vannevar Bush dans l’article « As we may think ». C’est un bureau qui permet le stockage et la consultation de données personnelles comme des livres, des enregistrements ou des images. Bush conçoit le memex en opposition avec les classements habituels par ordre alphabétique ou chronologique, pour lui, le memex fonctionnerait comme le cerveau, par associations d’idées.
Par la suite Douglas Carl Engelbart participe à l’avancée technologique en inventant la souris (1964) et le premier système hypertexte, le NLS (1968). Ces deux inventions reflètent l’intention du chercheur de développer les rapports homme-machine.
En 1968 Theodor Nelson invente le terme d’« hypertexte » et en donne sa définition actuelle : un réseau de documents numériques interconnectés.
Dans un hypertexte, l’utilisateur peut choisir un parcours parmi plusieurs liaisons directes vers des éléments (texte, image…) situés dans des documents différents.
Articulations entre hyperliens et hypertextes
Articulations entre hyperliens et hypertextes
Un hyperlien permet à l’utilisateur d’accéder directement à l’unité qui l’intéresse, d’une façon non linéaire, sans restriction d’ordre.
Hyperlien :
Un lien hypertexte ou hyperlien, est un lien qui permet de passer d’un document à un autre dans un système hypertexte.
On trouve des hyperliens dans des applications de dictionnaire où ils renvoient à des définitions par un simple clic sans connexion Internet.
Pour illustrer le fonctionnement des hyperliens et des hypertextes, prenons par exemple une page contenant un texte avec des liens $\text L1$, $\text L2$, … $\text Ln$. Chaque lien renvoie à un nouveau texte dans une nouvelle page qui contient à son tour d’autres liens $\text L11$, $\text L12$, … $\text L1n$.
Les structures de liens internes
Les structures de liens internes
Les hyperliens sont dits internes lorsqu’ils pointent vers des ressources également situées sur le même site Internet. Selon la structure, l’utilisateur dispose d’un choix plus ou moins vaste de cheminements sur le site.
- Structure linéaire
La structure linéaire contrôle le parcours du lecteur à travers le document. Il n’y a qu’un seul chemin possible entre les pages.
- Structure arborescente
Elle permet d’amener l’utilisateur d’un site à ses sous-pages, c’est la structure type de la navigation par catégories.
- Structure en étoile
L’utilisateur est transféré vers d’autres sous-pages via des liens dans un document. Cette structure est typique d’un site comme Wikipédia.
- Structure en réseau
Ce type de structure permet aux utilisateurs d’accéder à toutes les pages accessibles via des liens multiples répétés sur toutes les pages du site. Ainsi les boutiques en ligne proposent souvent sur toutes leurs pages des liens vers d’autres versions de l’article consulté, d’autres articles apparentés ou en promotion, d’autres catégories d’articles ou encore des articles fréquemment achetés ensemble.
Les liens externes
Les liens externes
Parmi les liens externes reliant deux domaines, on distingue les liens entrants et les liens sortants.
- Liens entrants (inbound links ou backlinks)
On désigne par liens entrants les liens qui viennent de domaines externes et qui mènent vers le site pris pour référence.
- Les liens sortants (outbound links)
On désigne par lien sortant tout hyperlien qui dirige vers une ressource située sur un site autre que celui qui le référence. Ces liens sont utilisés pour indiquer ses sources d’informations ou pour recommander d’autres contenus.
Profondeur des liens
Profondeur des liens
Les liens de surface font référence à la page d’accueil ou d’autres pages d’atterrissage du site web.
Les liens profonds mènent à des pages secondaires spécifiques du site web, qui peuvent cibler des contenus textuels médias sur le site (vidéos, images, documents téléchargeables etc.).
World wide web et URL
World wide web et URL
Internet est un réseau informatique mondial accessible au public, composé de millions de réseaux aussi bien publics que privés, eux-mêmes regroupés en réseaux.
Si nous prenons l’exemple d’une navigation sur Internet, la page qu’affiche le navigateur web est un hypertexte.
Le web
Le web
Les hyperliens constituent la base de la structure en réseau du World Wide Web puisqu’ils permettent de passer d’une page à une autre à partir d’un simple clic de souris.
World Wide Web :
Le World Wide Web, souvent désigné par l’acronyme www, signifie « toile mondiale » ou « toile d’araignée mondiale » en français. C’est un système hypertexte public accessible sur le réseau Internet.
Les pages disponibles sur le web sont liées entre elles par des liens hypertextes ce qui représente par métaphore une toile d’araignée.
Le World Wide Web désigne collectivement l’ensemble des pages web accessibles sur les différents serveurs reliés au réseau mondial Internet. Les pages peuvent être consultées par des logiciels appelés « navigateurs ». Les technologies du web sont également utilisées pour créer des intranets. Un intranet est un réseau privé à l’usage exclusif d’une organisation, dont les membres accèdent à des applications et des sites web privés.
Internet ne se résume pas au web !
- Internet est un réseau dont l’origine remonte aux années 60.
- Le web est un système qui utilise le réseau Internet et qui a été inventé en 1989 au CERN par Tim Berners-Lee.
Le réseau Internet sert aussi à d’autres usages et applications comme le courrier électronique, les messageries instantanées ou encore les échanges pair-à-pair.
Adresse URL
Adresse URL
Lorsque l’utilisateur clique sur un lien, le navigateur envoie une requête au serveur qui héberge la page demandée. Le navigateur reçoit en réponse la page en question, sous réserve qu’elle existe toujours. Si ce n’est pas le cas, le navigateur indiquera que la page ne peut pas être trouvée.
- Notre navigation sur Internet se résume donc à des clics sur des hyperliens qui mènent vers des URL.
Il est possible de savoir où mène un lien avant de cliquer dessus en le survolant avec le curseur. Le navigateur indique alors l’adresse de destination du lien. Cela permet notamment de se prémunir contre d’éventuels liens malveillants.
URL :
L’URL « Uniform Resource Locator » est l’adresse normalisée d’une ressource présente sur le web (page web, vidéo, son, image, animation, adresse email…). L’URL est composée d’une chaine de caractères où chaque élément renvoie à une indication.
L’URL est une simple ligne de texte qui désigne l’emplacement d’une ressource, elle constitue un identifiant unique d’accès à une ressource, indispensable pour localiser une page parmi des milliards de pages internet existantes. La structure d’une URL est normalisée dans le monde entier.
Souvent employée comme synonyme pour une adresse web, une URL peut également localiser d’autres types de ressources. Par simplification on s’intéressera principalement aux URL du web.
L’adresse, ou l’URL de la page, est indiquée par le navigateur, par exemple : http://schoolmouv.fr.
Une URL se compose donc de différentes parties. Dans le cas où l’adresse est un nom de domaine, elle comporte au minimum :
- le protocole, http ou https pour le web, file pour un fichier local, mailto pour la messagerie, ftp pour le transfert de fichiers ;
- le nom de domaine de premier niveau, également appelé domaine de tête (dans notre exemple fr) ;
- le nom de domaine de deuxième niveau (dans notre exemple schoolmouv).
Elle peut comporter optionnellement en préfixe un sous-domaine (usuellement www, comme dans notre exemple).
Ces différentes composantes sont séparées par des points.
Parmi les composantes optionnelles d’une URL du web peuvent figurer :
- un numéro de port TCP ;
- un chemin d’accès à la ressource sur le serveur
- des paramètres optionnels en suffixe après un point-virgule et séparés par des esperluettes (exemple : ?langue=fr&visiteur=perso).
Analysons l’URL suivante :
$\scriptsize{\sf{\textcolor{Orange}{http}://\textcolor{Teal}{www}.\textcolor{SkyBlue}{siteexemple}.\textcolor{burlywood}{com}:\textcolor{orchid}{8080}\textcolor{lightsalmon}{/french/blog/2019/mai/}\textcolor{royalblue}{index.php}?\textcolor{sienna}{page=2\&contenu=complet}}}$
- le protocole de communication est $\sf{\textcolor{orange}{http}}$ ;
- le nom de domaine de premier niveau est $\sf{\textcolor{burlywood}{com}}$ ;
- le nom de domaine de second niveau est $\sf{\textcolor{skyblue}{siteexemple}}$ ;
- le sous-domaine est $\sf{\textcolor{Teal}{www}}$ ;
- le port TCP est $\sf{\textcolor{orchid}{8080}}$ ;
- le chemin d’accès sur le serveur est $\sf\textcolor{lightsalmon}{/french/blog/2019/mai/}$ ;
- le nom du fichier requis est $\sf{\textcolor{royalblue}{index.php}}$ ;
- deux paramètres sont passés lors de la requête de la ressource, le paramètre $\sf{\textcolor{sienna}{page}}$ avec la valeur $\sf{\textcolor{sienna}{2}}$ et le paramètre $\sf{\textcolor{sienna}{contenu}}$ avec la valeur $\sf{\textcolor{sienna}{complet}}$.
Conclusion :
Le World Wide Web (toile d’araignée à l’échelle mondiale) appelé web, est un système hypertexte public fonctionnant sur Internet. Le web permet de consulter avec un navigateur des pages accessibles sur des sites. L’image de la toile d’araignée vient des hyperliens qui lient les pages web entre elles. Le web est fréquemment confondu avec Internet alors que les hypertextes et les hyperliens peuvent être exploités hors connexion.
De plus, le web n’est qu’une des applications d’Internet, distincte d’autres applications comme le courrier électronique la messagerie instantanée ou encore le transfert de fichiers, qui coexistent sur le réseau.