Link sponsorizzati

Gestire il charset di una pagina web. Le entità ISO 8859-1

Articolo scritto da Max Bossi
Pagina 1 di 3

Uno dei problemi più ricorrenti in fatto di sviluppo di pagine web è la corretta gestione del charset, cioè il set di caratteri (o codifica) con il quale viene scritto (e successivamente interpreatato) il nostro documento HTML. Iniziamo col premettere che ogni lingua ha il suo charset.

Il charset utilizzato per la corretta formattazione di documenti in italiano è ISO-8859-1 (Latin 1) che rappresenta il set di caratteri tipico dell'europa occidentale (tale charset contiene le lettere dell'alfabeto, i numeri, la punteggiatura e vari simboli tipici della nostra lingua e delle altre lingue dell'europa occidentale).

(L'articolo continua più sotto...)

Per definire correttamente il set di caratteri utilizzato in una pagina web scritta in HTML è opportuno utilizzare il seguente codice da inserire nell'intestazione della pagina:

<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-1">
Specificando questa intestazione avremo buone speranze (non la certezza!) che i nostri utenti riusciranno a leggere correttamente il testo scritto nel nostro documento.

I caratteri che creano maggiori problemi (e maggiori mal di testa ai webmaster!) sono i caratteri accentati: se il nostro documento è interpretato correttamente secondo il charset ISO-8859-1 non avremo problemi e pertanto potremo tranquillamente scrivere nel codice sorgente del documento HTML le lettere accentate (come ad esempio à o é); in caso contrario dovremo avere la premura di scrivere (al posto delle lettere accentate) la corrispondente entità HTML. Vediamo di seguito una semplice tabella di conversione per i caratteri accentati in entità:

  • à => &agrave;
  • è => &egrave;
  • é => &eacute;
  • ì => &igrave;
  • ò => &ograve;
  • ù => &ugrave;
Come già detto, la definizione del charset nell'intestazione del documento non è garanzia di successo.
Può infatti capitare che, nonostante la corretta definizione del charset, si verifichino dei problemi causati dal charset di default del web-server (cosa frequente soprattutto se il nostro sito è hostato da un provider estero) o dal browser del nostro utente.

I problemi, inoltre, non si limitano ai caratteri accentati (che come abbiamo detto sono, tuttavia, la principale fonte di mal di testa del webmaster!) ma riguardano tantissimi altri caratteri!

Per evitare questi problemi, ed anche per rendere le pagine web più conformi agli standard del HTML, pertanto è consigliabile realizzare il codice sorgente delle nostre pagine web avendo cura di inserire direttamente le entità al posto del carattere/simbolo rappresentato!

Per fare un esempio la parola:

felicità
dovrà essere scritta - nel codice sorgente HTML - in questo modo:
felicit&agrave;
Nella pagina seguente pubblichiamo una utilissima referenza dei caratteri del charset ISO-8859-1 con le rispettive entità (nel duplice formato testuale e numerico).

Nella stessa categoria...
E-Learning
Corso CSSCorso CSS
Web Design ed Accessibilità secondo il W3C con CSS ed XHTML. A partire da 29 €.
Corso HTMLCorso HTML
Il linguaggio di marcatura per il Web. A partire da 29 €.
Corso Web DesignCorso Web Design
Disegno di siti Web con HTML, CSS e Dynamic HTML. A partire da 39 €.
Link sponsorizzati