La Codifica HTML o Charset HTML

Per mostrare correttamente una pagina HTML, con particolare riferimento alle lettere accentate, il browser deve conoscere la codifica dei caratteri o "charset" da essa adottata.

Come imposto correttamente la Codifica UTF-8 nelle mie pagine web?

Per far sì che le lettere accentate delle tue pagine HTML siano visualizzate correttamente da tutti i browser devi informare questi ultimi del fatto che stai utilizzando la codifica UTF-8. Per farlo devi inserire il meta tag charset nella sezione <head> della tua pagina HTML, come segue:

Per HTML4

<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />

Per HTML5

<meta charset="utf-8" />

 

Come vedi ci sono due possibilità a seconda della versione HTML da te utilizzata, se ti interessa la massima retro-compatibilità coi browser più vecchi usa la versione HTML 4, altrimenti usa il meta tag più corto.

Un Esempio

L'immagine in alto è uno screenshot di una pagina HTML in cui il carattere "è" è ovviamente rappresentato male, ecco il codice HTML della pagina che causa il problema (come quello visto nell'immagine di copertina qui in alto):

<!DOCTYPE html>
<html>
  <head>
    <title>Codifica non specificata</title>
  </head>
  <body>
    <p>
      Perchè impostare la codifica HTML è importante
    </p>
  </body>
</html>

Ed ecco lo stesso file corretto specificando la codifica con uno dei metatag di cui sopra inserito nella sezione <head> della pagina:

<!DOCTYPE html>
<html>
  <head>
    <meta charset="utf-8">
    <title>Codifica impostata correttamente</title>
  </head>
  <body>
    <p>
      Perchè impostare la codifica HTML è importante
    </p>
  </body>
</html>

Provare per credere!

Dove trovo altre informazioni utili per imparare l'HTML?

Proprio in questo periodo stiamo scrivendo il nostro "WebMaster Tutorial" che contiene anche un'ottima Guida HTML!

Cos'è la Codifica dei Caratteri?

La codifica dei caratteri o "charset" è l'associazione fra un insieme di codici numerici e i rispettivi caratteri caratteri di un determinato linguaggio.

Storicamente la prima codifica di caratteri inventata fu, nel 1840, il famoso codice MORSE, il quale invece di associare i caratteri a dei codici numerici li associava all'intermittenza di un segnale acustico o luminoso. 

Tuttavia i computer, in particolare quelli che utilizziamo oggi per accedere a Internet e più nello specifico al Web, capiscono molto più facilmente i numeri dei segnali acustici o luminosi. Pertanto nel 1963 nacque la codifica ASCII (anche nota come standard ASCII), la quale utilizza 7bit per rappresentare i 95 caratteri principali utilizzati nel linguaggio scritto. 

Com'è facile intuire, il vari linguaggi umani per essere rappresentati correttamente necessitano di ben più di 95 caratteri. Per esempoi, sebbene esse siano fondamentali nella lingua italiana, la codifica ASCII non contiene le lettere accentate. 

Per ovviare a questi problemi e poter rappresentare molti più caratteri, nel 1992 è stata creata la codifica UTF-8 o "Unicode Transformation Format, 8 bit". Essa permette di rappresentare pressoché tutti i caratteri necessari al linguaggio umano scritto, comprese le lettere accentate. Sopra abbiamo visto come impostarla correttamente nelle nostre pagine HTML.

Per rappresentare altri caratteri speciali (per esempio questi: © ™ æ ♕ ☯ ↑) o le lettere maiuscole accentate (per esempio l'a maiuscola accentata: À) è possibile utilizzare le "entità HTML", ecco una tabella con le più diffuse.

Vorrai mica perderti altri articoli come questo?
Iscriviti per riceverne altri!

Scritto da

Duccio

Duccio Armenise

Corsidia Founder

Aiuto solo i migliori Maestri a trovare i loro prossimi Studenti. Come? Così! :)

Bio - uCV

Per

Corsidia logo

I tuoi prossimi Studenti ti stanno già cercando, tu ci sei?

Materie

Trova un altro corso