Istruzioni & annotazioni: selezionare la codifica di caratteri nel menù a tendina.
La tabella mostra, in ciascuna cella di uno schema 16x16, il carattere assegnato dalla codifica selezionata all'ottetto il cui valore (in esadecimale) è riportato in alto a sinistra nella cella.
Passando con il mouse sulla cella viene mostrato in un tooltip una versione ingrandita del glifo, il nome del carattere e il codepoint (o i codepoint) Unicode corrispondenti.
Se la cella è colorata di giallo, significa che il byte è riservato o semplicemente indefinito, in ogni caso non è utilizzato dalla codifica.
Se la cella è bianca e non mostra alcun carattere, può trattarsi di caratteri di controllo o comunque invisibili: passando con il mouse sulla cella si visualizza il tooltip.
La corretta visualizzazione del carattere dipende dal browser e dalla disponibilità dei font installati sul proprio sistema.
Sto lavorando a un sistema di produzione delle immagini dei glifi, ma ci vorrà un po' di tempo.
Sono visualizzate solamente codifiche a 7 e 8 bit, ovvero codifiche che assegnano un solo byte a ciascun carattere, con alcune eccezioni interessanti per l'Asia orientale in cui alcuni caratteri dello script asiatico sono già assegnati a sequenze di un solo byte.
Per la codifica GSM 03.38, a causa del particolare funzionamento, vengono visualizzati solo i caratteri che occupano un solo byte (da 7 bit): mancano i caratteri rappresentabili con i codici di escape.
Il lavoro di raccolta delle codifiche è lontano da essere completo. Sto progettando anche di aggiungere informazioni descrittive su ciascuna codifica e una funzione di ricerca tramite gli alias (spesso molti) attraverso i quali una codifica è nota.
Credits:
Gran parte delle codifiche sono state raccolte dai file di mapping messi a disposizione dal consorzio Unicode.
Altre codifiche provengono dal lavoro di raccolta di Roman Czyborra sui charset.
La maggior parte delle codifiche della famiglia ISO-646 (estensioni nazionali del codice ASCII), sono state ottenute via software utilizzando iconv.
Alcune ISO-646 più esotiche (Irlanda, Islanda, Malta, Taiwan, …), sono state ricavate dalla tabella riportata alla voce su Wikipedia. La fonte autoritativa per queste codifiche d'antiquariato dovrebbe essere l'ISO/IEC International Register of Coded Character Sets (un alias per molte codifiche inizia con ISO-IR-, con riferimento a questo registro, anche per le ISO-8859). La pagina web dell'International Register of Coded Character Sets sembra essere ospitata su un sito giapponese, e riporta una serie di PDF con alcune scannerizzazioni (!!) di queste tabelle di codici.
Disclaimer:
- Il materiale pubblicato nel presente sito proviene da fonti diverse, per cui nel sito possono figurare imprecisioni tecniche e/o errori di trascrizione. Tutto quanto appare nel sito viene fornito “così com’è”, a puro scopo didattico e di consultazione senza garanzie di alcun tipo, implicite o esplicite.
- L’autore si impegna a mantenere quanto più aggiornati e accurati i contenuti del sito, ma non presta alcuna garanzia sull’accuratezza degli stessi. L’autore non si assume alcuna responsabilità per eventuali errori o omissioni presenti all’interno del sito.
- L’autore non si assume alcuna responsabilità per fatti e/o danni, diretti ed indiretti, che possano derivare all’Utente e/o a terzi dall’uso del contenuto del presente sito, tra cui a mero titolo esemplificativo danni da mancato guadagno o risparmio non realizzato.
- L’autore non può, in nessun caso, essere ritenuto responsabile per i danni o le perdite di qualsiasi natura che l’Utente assuma di aver subito per l’effetto del mancato funzionamento di qualsiasi servizio offerto dal sito e/o per la mancata ricezione di informazioni e/o per la loro inesattezza o incompletezza.