Unihan

Cet article est une ébauche concernant l’informatique.

Vous pouvez partager vos connaissances en l’améliorant (comment ?) selon les recommandations des projets correspondants.

Le Projet Unihan est une tentative d'unification des caractères chinois. C'est le processus employé par les auteurs d'Unicode et d'UCS pour coder le jeu multi-caractères des langues CJC en un jeu mono-caractères unifié. Les caractères chinois sont communs au chinois (hanzi), au coréen (hanja), au japonais (kanji), ainsi que CJCV y incluant également le vietnamien (Chữ nho et Chữ Nôm).

Le coréen, le chinois et le japonais peuvent représenter un caractère chinois, ou sinogramme, de différentes manières. Cependant, dans la formulation d'Unicode, ces différences ont été réduites.

Cette unification est souvent appelée Unification Han ou Unihan.

Le projet Unihan utilise entre autres les dictionnaires libres EDICT (japonais-anglais, commencé en 1991), et CEDICT (chinois-anglais, commencé en 1997).

Annexes

Références

Bibliographie

  • Nadine Lucas, « Le retour des idéogrammes », Document numérique, éditions Lavoisier, vol. 6, nos 3-4,‎ , p. 183-210 (DOI 10.3166/dn.6.3-4.183-210, lire en ligne).

Articles connexes

Liens externes

  • (en) Exemple des données pour le caractère 中
  • (fr) « Tableaux de caractères Unicode – Écritures »(Archive.org • Wikiwix • Archive.is • Google • Que faire ?)
  • (en) About the Unihan database
v · m
Jeux de caractères de base Logo d'Unicode
Codification de fichiers et protocoles
Adaptations de référence
Équivalences standards
  • NFC (forme précomposée, recommandée)
  • NFD (forme décomposée)
  • NFKC (forme précomposée de compatibilité)
  • NFKD (forme décomposée de compatibilité)
Propriétés et algorithmes
Transformations
Standards et normes liés
  • BCP 47 (étiquettes IETF d’identification de langues)
  • ISO 639 (codes pour la représentation des noms de langues ou groupes de langues)
  • ISO 15924 (codes pour la représentation des noms d’écritures)
  • ISO 3166-1 (codes pour la représentation des noms de pays ou régions du monde)
  • ISO 4217 (codes pour la représentation des noms de devises monétaires)
Mises en œuvre et applications
  • icône décorative Portail de l’informatique
  • icône décorative Portail de l’écriture