HTML

HTML (HyperText Markup Language) est le langage de balisage utilisé pour créer des pages web. Il s'agit d'un élément fondamental dans la création de sites web, car il permet de structurer le contenu d'une page en utilisant des balises. Ces balises définissent la signification et la présentation des éléments sur une page, tels que les titres, les paragraphes, les images, les liens, les formulaires, et bien plus encore.

HTML utilise une syntaxe composée de balises (encadrées par des chevrons, comme <balise>) et de contenu (placé entre les balises).

Les balises peuvent également inclure des attributs qui fournissent des informations supplémentaires sur un élément. Par exemple, la balise <a> (utilisée pour les liens) peut inclure un attribut href qui spécifie l'URL vers laquelle le lien redirige. Les attributs sont ajoutés sous forme de paires nom-valeur à l'intérieur des balises, avec une syntaxe ressemblant à ceci : nom="valeur".

Les navigateurs web interprètent ensuite le code HTML pour afficher la page web correspondante à l'utilisateur.

Une page HTML de base commence généralement par la balise <html>, qui englobe l'ensemble du document. A l'intérieur de cette balise, on trouve les balises <head> pour les métadonnées et les liens vers des fichiers externes, ainsi que la balise <body> pour le contenu visible de la page.

Les balises HTML se divisent en trois catégories : balises ouvrantes, balises fermantes et balises auto-fermantes, chacune ayant un rôle spécifique.

Balises ouvrantes : elles débutent un élément HTML et sont entourées de chevrons, comme <p>. Elles marquent le début de l'élément et peuvent contenir des attributs.
Balises fermantes : elles marquent la fin d'un élément HTML et ressemblent aux balises ouvrantes, mais incluent un slash avant le nom, comme </p>. Elles indiquent où se termine l'élément.
Balises auto-fermantes : elles sont utilisées pour les éléments qui ne contiennent pas de contenu textuel et se ferment immédiatement avec un slash, comme <img />. Elles sont couramment employées pour insérer des médias ou des éléments vides.

Tip

Les balises auto-fermantes peuvent aussi s'écrire sans slash, comme <img>, selon les conventions d'écriture de code utilisées.

➡️ HTML Living Standard

Structure d'une page HTML

<!doctype html>
<html lang="en">
  <head>
    <meta charset="utf-8">
    <title>…</title>
  </head>
  <body>
    …
  </body>
</html>

<!doctype html>

Le doctype est nécessaire pour des raisons historiques.
Lorsqu'il est omis, les navigateurs peuvent utiliser un mode de rendu différent, appelé mode quirks, qui est incompatible avec certaines spécifications modernes.

<html lang="en">

L'élément html représente la racine d'un document HTML.
Il est recommandé de spécifier un attribut lang sur l'élément html, indiquant la langue principale du document.
Cela aide les outils d'accessibilité, comme les synthétiseurs vocaux, à utiliser la bonne prononciation, et les outils de traduction à appliquer les règles linguistiques appropriées.

<head>

L'élément head contient un ensemble de métadonnées pour le document, telles que le titre, les liens vers les feuilles de style et les informations de configuration.

<meta charset="utf-8">

Les éléments meta fournissent des métadonnées qui ne peuvent pas être exprimées avec les éléments title, base, link, style ou script.
L'attribut charset spécifie l'encodage des caractères utilisé par le document, utf-8 étant l'encodage standard et recommandé.

<title>

L'élément title représente le titre ou le nom du document, qui apparaît dans l'onglet du navigateur.

<body>

L'élément body contient tout le contenu visible par les utilisateurs, tel que le texte, les images, les vidéos et les autres éléments interactifs de la page.

Retour à la ligne

Les retours à la ligne dans le code source HTML ne provoquent pas de saut de ligne dans la page affichée par le navigateur web.

Pour insérer un saut de ligne, il faut utiliser la balise <br> :

<body>
  Some text…
  More text…
  <br>
  The "br" tag creates a line break!
</body>

Espace

Dans le code source HTML, les espaces multiples (c'est-à-dire plusieurs espaces consécutifs) sont réduits à un seul espace lorsqu'ils sont affichés dans le navigateur. Ainsi, même si plusieurs espaces sont présents entre les mots ou les éléments dans le code, ils seront affichés comme un seul espace sur la page web.

<body>
  <p>This     is     an     example</p>
</body>

Catégories de contenu

Les catégories de contenu sont un concept essentiel en développement web, car elles définissent comment les éléments HTML sont structurés et interagissent les uns avec les autres. Chaque élément appartient à une ou plusieurs catégories de contenu. Ces catégories regroupent donc des éléments partageant un ensemble de caractéristiques communes.

Source image

Metadata Content (contenu de métadonnées) : cette catégorie regroupe les informations cruciales sur le document, telles que les données de référencement, les encodages de caractères et les liens vers des feuilles de style et des scripts.

Balises : <base>, <link>, <meta>, <noscript>, <script>, <style>, <template> et <title>

Flow Content (contenu de flux) : les éléments de cette catégorie forment le coeur de la page, comprenant les paragraphes, les titres, les listes, les tableaux, les images et les liens. Ils façonnent la structure générale de la page.

Balises : <a>, <article>, <audio>, <br>, <button>, <div>, <footer>, <h1>, <header>, <img>, <input>, <p>, <ul>, <table>, …

Sectioning Content (contenu de sectionnement) : ces éléments divisent la page en sections sémantiques, facilitant ainsi la compréhension et l'accessibilité du contenu. Ils définissent également la portée des éléments d'en-tête et de pied de page.

Balises : <article>, <aside>, <nav> et <section>

Heading Content (contenu de titre) : les balises de titre déterminent la hiérarchie des titres sur la page, aidant les utilisateurs et les moteurs de recherche à comprendre la structure de l'information.

Balises : <h1>, <h2>, <h3>, <h4>, <h5> et <h6>

Phrasing Content (contenu de mise en forme) : cette catégorie comprend les éléments qui mettent en forme le texte, contribuant à la présentation et à la structuration du contenu textuel.

Balises : <a>, <b>, <button>, <em>, <i>, <img>, <input>, <label>, <span>, <strong>, <textarea>, <u>, …

Embedded Content (contenu incorporé) : ces éléments permettent d'intégrer des médias et des contenus externes dans une page web, enrichissant l'expérience utilisateur.

Balises : <audio>, <canvas>, <embed>, <iframe>, <img>, <math>, <object>, <picture>, <svg> et <video>

Interactive Content (contenu interactif) : les éléments interactifs permettent aux utilisateurs d'interagir directement avec la page via des formulaires, des boutons cliquables et d'autres éléments.

Balises : <a>, <audio>, <button>, <details>, <embed>, <iframe>, <img>, <input>, <label>, <select>, <textarea> et <video>

➡️ WHATWG - Kinds of content

Tip

Toujours se référer à la spécification HTML

Pour savoir comment utiliser les balises :

Comment créer des listes imbriquées ?

Pour connaître la sémantique d'une balise :

Quelle est la différence entre <b> et <strong> ?

Réponses : Listes imbriquées

Source image

<ul>
  <li>
    Fruits
    <ul>
      <li>Pommes</li>
      <li>Oranges</li>
      <li>Bananes</li>
    </ul>
  </li>
  <li>
    Légumes
    <ul>
      <li>Carottes</li>
      <li>Tomates</li>
      <li>Brocolis</li>
    </ul>
  </li>
</ul>

Réponses : Différence entre <b> et <strong>

Source image

<strong>Attention :</strong> Il est important de lire la documentation !

Le langage HTML est facile à écrire si on lit la <b>documentation</b> !

Références de caractères

Documentation

Les named character references en HTML, également appelées entity references, sont des codes spéciaux utilisés pour représenter des caractères spéciaux ou réservés dans le code HTML. Ces codes commencent généralement par une esperluette (&), suivie d'un nom, puis se terminent par un point-virgule (;). Les caractères spéciaux et réservés doivent être encodés de cette manière pour éviter toute confusion avec la syntaxe HTML.

Caractères à toujours encoder

< (inférieur à)

Le caractère < est utilisé pour ouvrir les balises HTML.
Si vous souhaitez l'afficher tel quel dans le contenu de votre page, vous devez l'encoder en <.
Sinon, il serait interprété comme le début d'une balise HTML, ce qui pourrait perturber la structure de la page.

& (esperluette)

L'esperluette est utilisée pour commencer une character reference en HTML.
Si vous souhaitez afficher une esperluette telle quelle, vous devez l'encoder en &.
Sinon, le navigateur interprétera le texte suivant comme une référence HTML, ce qui peut entraîner des erreurs de rendu.

Autres caractères fréquemment encodés

Afin d'éviter divers problèmes d'affichage et de sécurité (notamment sur les sites web dynamiques), certains caractères supplémentaires sont également encodés :

> (supérieur à)

Ce caractère est utilisé pour fermer les balises HTML.
Pour afficher un > tel quel, vous pouvez l'encoder en >.

" (guillemets doubles)

Les guillemets doubles sont utilisés pour délimiter les valeurs des attributs HTML.
Pour les afficher normalement, vous pouvez les encoder en ".

' (apostrophe)

Les apostrophes sont également utilisées pour délimiter les valeurs des attributs HTML.
Pour les afficher sans problème, vous pouvez les encoder en '.

Références de caractères numériques

Chaque caractère Unicode peut être encodé dans le code source HTML grâce aux références de caractères numériques décimales ou hexadécimales. Il s'agit d'utiliser le code point du caractère Unicode sous la forme &#…; (décimale) ou &#x…; (hexadécimale).

Par exemple, 🥸 peut être encodé avec 🥸 ou 🥸.

Source image

Caractères invisibles ou ambigus

Dans certains cas particuliers, il peut être nécessaire d'utiliser des caractères spéciaux invisibles. Un exemple est le caractère Unicode U+200F Right-To-Left Mark, utilisé pour gérer la direction dans un texte bidirectionnel (par exemple, pour les écritures arabe ou hébraïque). Cependant, il n'a pas de forme graphique visible, ce qui rend difficile l'identification de sa présence dans le code source. S'ils sont omis ou oubliés, ces caractères peuvent provoquer des résultats inattendus lors d'une édition ultérieure.

Un autre exemple est le caractère Unicode U+00A0 No-Break Space. Cet espace empêche le retour à la ligne, mais ressemble à un espace ordinaire lorsqu'il est utilisé. Il peut donc être difficile à identifier dans le code source.

Tip

Dans ce type de cas particuliers, il est fortement recommandé d'utiliser les références de caractères.

Lien utile

SYMBL (◕‿◕)

Conception d'une page web

Réfléchir et concevoir la structure d'une page web avant de la coder.
Aller au-delà du simple affichage dans un navigateur web.
Utiliser les balises HTML en fonction de leur sémantique.

1. Réfléchir et concevoir

Le processus de conception d'une page web commence par des esquisses pour générer des idées, passe ensuite aux wireframes pour définir la structure, et se termine par les mockups pour créer une représentation visuelle détaillée de la page. Chaque étape joue un rôle crucial dans la création d'une page web fonctionnelle et esthétiquement agréable.

Sketch (esquisse)

L'esquisse est la première étape du processus de conception.
Elle consiste à créer des croquis rapides et informels sur papier ou à l'aide d'outils numériques pour explorer des idées initiales.
A ce stade, l'accent est mis sur la créativité et la génération d'idées.
Les croquis peuvent inclure la disposition générale de la page, la disposition des éléments clés, la navigation de base et d'autres idées visuelles.
Cela permet de capturer rapidement les concepts sans se soucier des détails.

Wireframe (maquette fil de fer)

Après les esquisses, la prochaine étape consiste à créer des wireframes.
Les wireframes sont des représentations schématiques et structurées de la page web.
Ils sont généralement en noir et blanc et se concentrent sur la disposition et la hiérarchie des éléments.
Les wireframes définissent la structure de la page, l'emplacement des éléments, les zones réservées au contenu, la navigation et d'autres éléments clés.
Ils aident à planifier la convivialité et la fonctionnalité de la page sans se soucier des aspects visuels détaillés.

Mockup (maquette graphique)

Une fois la structure de base définie à l'aide des wireframes, on passe à la création de maquettes graphiques.
Les mockups sont des représentations visuelles de la page web avec des détails graphiques tels que les couleurs, les polices, les images et les éléments de design.
Les maquettes graphiques donnent vie à la conception en montrant à quoi ressemblera la page web une fois terminée.
Elles servent également de référence pour le développement, car elles fournissent des indications précises sur l'apparence visuelle de la page.

Source image

2. Penser plus loin

Moteurs de recherche

L'optimisation pour les moteurs de recherche (SEO) est un aspect essentiel de la conception de pages web. Pour garantir que votre site soit bien classé dans les résultats de recherche et atteigne un public plus large, il est crucial de prendre en compte plusieurs éléments :

Choix des mots-clés : utiliser des mots-clés pertinents pour le contenu de la page.
Titre de la page (<title>) : s'assurer que le titre de chaque page est unique, descriptif et contient un ou plusieurs mots-clés pertinents. Le limiter à environ 60 caractères.
URL conviviale : créer des URLs lisibles par l'humain et inclure des mots-clés si possible. Eviter les URL longues et complexes contenant des chiffres ou des caractères spéciaux.
Balises de titre (<h1> à <h6>) : utiliser les balises de titre pour structurer le contenu. L'élément <h1> devrait contenir le titre principal de la page, et les autres balises de titre devraient organiser le contenu de manière logique.
Contenu de qualité : rédiger un contenu informatif, pertinent et de haute qualité, qui répond aux besoins des utilisateurs.
Balises sémantiques : utiliser les balises HTML sémantiques (<article>, <section>, <header>, <footer>, etc.) pour structurer le contenu de manière claire et significative.
Optimisation des images : utiliser l'attribut alt pour décrire les images de manière concise et pertinente.
Liens internes et externes : créer des liens internes vers d'autres pages du site pour améliorer la navigation, et inclure des liens vers des sources externes de confiance lorsque cela est pertinent.
Balises meta (<meta>) : rédiger des balises descriptives pour chaque page, en incluant des mots-clés pertinents.
…

Source image

Agrégation de contenus

L'agrégation de contenus, en informatique et dans le contexte du développement web, fait référence à la collecte, la fusion et la présentation de contenus provenant de différentes sources ou sites web sur une seule plateforme. Elle permet de regrouper des informations issues de diverses sources pour offrir aux utilisateurs une expérience de navigation centralisée.

Par exemple, un agrégateur de nouvelles en ligne peut rassembler des articles de plusieurs médias et les présenter sur une seule page, permettant ainsi aux utilisateurs de consulter différentes perspectives en un seul endroit.

La création d'un site web destiné à être agrégé par d'autres services nécessite une attention particulière aux aspects techniques du code HTML. Un code bien structuré et conforme aux normes permet aux agrégateurs d'extraire facilement et avec précision votre contenu.

Les points techniques mentionnés pour les moteurs de recherche s'appliquent également afin que vos contenus puissent être exploités efficacement par les agrégateurs.

Source image

Lecteur d'écran et synthèse vocale

La conception de pages web accessibles aux lecteurs d'écran et à la synthèse vocale est essentielle pour garantir l'accessibilité des personnes ayant des limitations visuelles (aveugles, malvoyants, daltoniens, etc.).

Structuration sémantique : utiliser les balises HTML appropriées (<header>, <nav>, <main>, <footer>, etc.) pour structurer le contenu de manière claire. Cela aide les lecteurs d'écran à comprendre la hiérarchie et la signification du contenu.
Texte alternatif pour les images : chaque image doit avoir un attribut alt descriptif expliquant son contenu. Les lecteurs d'écran utilisent ces descriptions pour informer l'utilisateur.
Ordre de lecture : assurer un ordre logique et cohérent, même si la mise en page visuelle est différente. Les lecteurs d'écran suivent généralement l'ordre du code HTML.
Contraste : le texte et les éléments interactifs doivent avoir un contraste suffisant par rapport à l'arrière-plan pour faciliter la lecture.
Eviter les éléments non textuels : ne pas créer d'éléments interactifs qui ne sont que des images sans texte explicite, car cela rendrait la compréhension difficile pour les utilisateurs de lecteurs d'écran.
ARIA : utiliser les attributs ARIA (Accessible Rich Internet Applications) lorsque cela est nécessaire pour améliorer l'accessibilité des éléments interactifs complexes, tels que les menus déroulants.

Note

Accessible Rich Internet Applications (ARIA), qu'on peut traduire par applications Internet riches et accessibles, est un ensemble de spécifications techniques qui définissent comment rendre le contenu et les applications web accessibles (notamment ceux développés avec JavaScript) aux personnes en situation de handicap.

ARIA complète HTML afin que les éléments interactifs et les widgets puissent être utilisés par les outils d'assistance lorsque les fonctionnalités standard ne le permettent pas. ARIA permet ainsi de rendre accessibles les widgets JavaScript, les indications dans les formulaires, les messages d'erreur, les mises à jour dynamiques du contenu, etc.

Source image

3. Structuration sémantique

La structuration sémantique d'une page web est un concept essentiel en développement web. Elle consiste à utiliser les balises HTML de manière appropriée pour décrire le contenu de la page de façon significative et structurée. Cela permet, par exemple, aux navigateurs web, aux moteurs de recherche et aux technologies d'assistance de comprendre la hiérarchie et la signification du contenu de la page.

Source image

Article et Section

Les balises HTML <article> et <section> sont toutes deux utilisées pour structurer le contenu d'une page web, mais elles ont des significations et des usages légèrement différents.

La balise <article> est généralement utilisée pour marquer une partie autonome et auto-suffisante du contenu de la page. Cela signifie qu'un <article> doit avoir un sens et une utilité indépendants, même s'il est retiré du contexte de la page. Par exemple, un article de blog ou une publication de journal peut être encapsulé dans une balise <article>.

La balise <section> est utilisée pour diviser le contenu d'une page en sections thématiques ou logiques. Elle est souvent utilisée pour organiser le contenu en chapitres ou en grandes parties. Les éléments <section> permettent de structurer la page de manière à rendre le contenu plus lisible et compréhensible pour les utilisateurs, mais ils ne sont pas censés être des éléments autonomes comme <article>.

Source image | Source image

Nav, Header, Footer et Aside

Les balises HTML <nav>, <header>, <footer> et <aside> sont toutes des éléments de structure utilisés pour organiser et définir la structure d'une page web.

La balise <nav> est utilisée pour marquer une section de la page qui contient des liens de navigation. Cela peut inclure un menu principal, un menu secondaire, ou tout autre ensemble de liens facilitant la navigation sur le site.

La balise <header> est utilisée pour englober le contenu d'en-tête d'une section ou de la page entière. Elle peut contenir des éléments tels que le logo du site, le titre principal ou les liens de navigation. Le <header> est généralement positionné en haut de la page ou de la section.

La balise <footer> est utilisée pour marquer le contenu de bas de page d'une section ou de la page entière. Elle contient généralement des informations comme les coordonnées, les liens vers les politiques du site, les mentions légales ou la date de copyright. Le <footer> se trouve généralement en bas de la page ou de la section.

La balise <aside> est utilisée pour marquer le contenu lié de manière secondaire au contenu principal. Cela peut inclure des encarts publicitaires, des informations connexes, ou des citations. Les éléments <aside> sont souvent affichés à côté du contenu principal, mais ne sont pas essentiels à sa compréhension.

Source image | Source image | Source image | Source image

Document outline

Le document outline en HTML fait référence à la structure logique d'un document, basée sur l'utilisation des éléments de titres (<h1> à <h6>). Ces éléments servent à organiser et à définir clairement les différentes parties d'une page web.

Une structure logique des titres est essentielle pour les outils d'assistance (comme les lecteurs d'écran), car elle leur permet d'afficher la hiérarchie du contenu d'une page web, un peu comme une table des matières dans un document, un rapport ou un livre.

✅ Exemple conforme

<body>
  <h1>Level 1</h1>
  <h2>Level 2</h2>
  <h3>Level 3</h3>
  <h1>Level 1</h1>
</body>

❌ Exemple non conforme

<body>
  <h1>Level 1</h1>
  <h3>Level 3</h3>
  <h2>Level 2</h2>
  <h1>Level 1</h1>
</body>

Cas particulier - H1

Les titres de niveau 1 (<h1>) ne doivent pas être utilisés à l'intérieur d'éléments appartenant à la catégorie Sectioning Content, c'est-à-dire les balises qui définissent la structure d'un document : <article>, <aside>, <nav> et <section>.

✅ Exemple conforme

<body>
  <h1>Level 1</h1>
  <section>
    <h2>Level 2</h2>
  </section>
  <h3>Level 3</h3>
  <h1>Level 1</h1>
</body>

❌ Exemple non conforme

<body>
  <h1>Level 1</h1>
  <section>
    <h1>Level 1</h1>
  </section>
  <h2>Level 2</h2>
  <h1>Level 1</h1>
</body>

Note

Le premier titre dans une page HTML doit toujours être un <h1>.

Même si c'est autorisé, n'utilisez pas plus d'un <h1> par page.

Un titre qui suit un autre doit avoir une différence de niveau maximale de ±1.

Ajoutez un titre à chaque élément <section> et <article>.

Lien utile

Nu Html Checker

💡 En résumé : Réfléchir 》Coder 》Vérifier

DOM

Le DOM (Document Object Model) est une représentation hiérarchique de la structure d'une page HTML. Il s'agit d'une interface de programmation qui permet aux développeurs de manipuler dynamiquement le contenu et la structure d'une page web à l'aide de langages tels que JavaScript.

Source image

Le DOM est un outil fondamental pour les développeurs web, en particulier lors du développement et de l'utilisation des outils de développement intégrés dans les navigateurs modernes (Developer Tools).

Inspection des éléments

Les outils de développement permettent d'inspecter la structure du DOM en temps réel. Les développeurs peuvent visualiser la hiérarchie des éléments HTML, les propriétés CSS appliquées à chaque élément, ainsi que les valeurs de leurs attributs.

Modification en temps réel

Les outils de développement offrent la possibilité de modifier le contenu du DOM directement dans le navigateur. Il est possible de tester des changements de texte, d'attributs ou de styles sans altérer le code source du fichier HTML.

Debugging

Les développeurs peuvent s'appuyer sur le DOM pour diagnostiquer et corriger des problèmes dans une page web. Ils peuvent définir des points d'arrêt (breakpoints) dans le code JavaScript afin d'observer comment le DOM évolue lors de l'exécution du script.