Codepage tables

Istruzioni & annotazioni: selezionare la codifica di caratteri nel menù a tendina.

La tabella mostra, in ciascuna cella di uno schema 16x16, il carattere assegnato dalla codifica selezionata all'ottetto il cui valore (in esadecimale) è riportato in alto a sinistra nella cella.
Passando con il mouse sulla cella viene mostrato in un tooltip una versione ingrandita del glifo, il nome del carattere e il codepoint (o i codepoint) Unicode corrispondenti.
Se la cella è colorata di giallo, significa che il byte è riservato o semplicemente indefinito, in ogni caso non è utilizzato dalla codifica.
Se la cella è bianca e non mostra alcun carattere, può trattarsi di caratteri di controllo o comunque invisibili: passando con il mouse sulla cella si visualizza il tooltip.
La corretta visualizzazione del carattere dipende dal browser e dalla disponibilità dei font installati sul proprio sistema.
Sto lavorando a un sistema di produzione delle immagini dei glifi, ma ci vorrà un po' di tempo.
Sono visualizzate solamente codifiche a 7 e 8 bit, ovvero codifiche che assegnano un solo byte a ciascun carattere, con alcune eccezioni interessanti per l'Asia orientale in cui alcuni caratteri dello script asiatico sono già assegnati a sequenze di un solo byte.
Per la codifica GSM 03.38, a causa del particolare funzionamento, vengono visualizzati solo i caratteri che occupano un solo byte (da 7 bit): mancano i caratteri rappresentabili con i codici di escape.

Il lavoro di raccolta delle codifiche è lontano da essere completo. Sto progettando anche di aggiungere informazioni descrittive su ciascuna codifica e una funzione di ricerca tramite gli alias (spesso molti) attraverso i quali una codifica è nota.

Credits:
Gran parte delle codifiche sono state raccolte dai file di mapping messi a disposizione dal consorzio Unicode.
Altre codifiche provengono dal lavoro di raccolta di Roman Czyborra sui charset.
La maggior parte delle codifiche della famiglia ISO-646 (estensioni nazionali del codice ASCII), sono state ottenute via software utilizzando iconv.
Alcune ISO-646 più esotiche (Irlanda, Islanda, Malta, Taiwan, …), sono state ricavate dalla tabella riportata alla voce su Wikipedia. La fonte autoritativa per queste codifiche d'antiquariato dovrebbe essere l'ISO/IEC International Register of Coded Character Sets (un alias per molte codifiche inizia con ISO-IR-, con riferimento a questo registro, anche per le ISO-8859). La pagina web dell'International Register of Coded Character Sets sembra essere ospitata su un sito giapponese, e riporta una serie di PDF con alcune scannerizzazioni (!!) di queste tabelle di codici.

Disclaimer:

© 2012-2024 — Maurizio ManettiCorso charset e Web i18n