|
{revue}
L’ISO 639 (ICS n°01.140.20) est une norme internationale l'ISO qui définit des codes pour la représentation des noms de langues. Les langues sont représentées par un code unique de 2 ou 3 lettres, par exemple La norme se compose de différentes parties :
Codes alpha-2Les codes à 2 caractères latins, utilisé par l'ISO 639-1, donnent la possibilité de coder 262=676 langues différentes. Ceci est insuffisant pour coder l'ensemble des langues (estimé de 4000 à 7000), ce qui est réalisé par les normes ISO 639-2 et ISO 639-3 qui utilisent des codes à 3 lettres. La norme ISO 639-1 associe chaque code au nom de la langue en français et en anglais. Codes alpha-3Les codes à 3 caractères latins donnent la possibilité de coder 263=17 576 langues différentes. Les codes à 3 lettres sont utilisés par l'ISO 639-2 et l'ISO 639-3. L'ISO 639-2 définit en plus de l'ISO 639-1 des codes désignant des groupes de langues (arabe, quechua, chinois…), ainsi que des codes spéciaux :
Certaines langues (23 en tout) sont codées dans l'ISO 639-2 par deux codes différents : terminologique et bibliographique. Par exemple pour l'allemand, on a : L'ISO 639-3, publié en 2007, vise à répertorier le plus grand nombre possible de langues. Celles-ci peuvent être d'une part des langues individuelles (exemple : arménien, SIL International est l'auteur principal de l'ISO 639-3 et s’est largement appuyé sur les données en provenance de la base de données Ethnologue.com pour codifier des centaines de langues auparavant non codées. Toutefois les codes Ethnologues.com (trois caractères indiqués en majuscules jusque dans sa 15e édition) n'ont pas été tous retenus car certains étaient en conflits avec des codes ISO 639-2 existants. Depuis la publication de la norme ISO 639-3, Ethnologue.com a modifié sa base de données et n’utilise plus que les codes ISO 639-3 (en minuscules) : ses anciens codes, auparavant utilisés aussi par SIL, ne doivent plus être utilisés car Ethnologue.com ne les supporte plus. La norme ISO 639-3 a subi de nombreuses modifications et corrections depuis sa première publication (et notamment de nombreux codes publiés transitoirement dans la version bêta ont été supprimés, fusionnés ou scindés suite aux contributions et discussions sur cette nouvelle norme). L’ISO 639-5, dont une première version provisoire a été publiée le 15 mai 2008, vise à classer l’ensemble des langues individuelles (ou éventuelles macro-langues qui les contiennent) en familles de langues et groupes de langues selon un système plus complet que ce que permet l’ISO 639-3 (qui ne traite que des macro-langues sans possibilité de définir une hiérarchie complète sur plus d'un seul niveau), en attribuant des codes alpha-3 supplémentaires pour ces familles et groupes de langues, ce que ne permet pas l’ISO 639-1 ou 639-2, où des codes collectifs ont été définis (mais non spécifiés précisément) regroupant parfois des langues isolées de différents groupes et non mutuellement intelligibles ou des groupes trop restreints de langues. La nouvelle norme ISO 639-5 (publiée mais pas encore sous une forme librement diffusable) visera à préciser les codes collectifs de ISO 639-2 (ou leur équivalent dans la norme ISO 639-1 quand ils existent ; il n'y a aucun nouveau code collectif dans la norme ISO 639-3) et à en définir d’autres selon une classification scientifique la plus sérieuse possible, et les avis des linguistes et bibliothèques du monde entier (elle s’appuie largement sur les données de classification des langues déjà collectées et publiées par Ethnologue.com). Cette norme visera aussi à faciliter la localisation des logiciels et améliorer globalement le traitement des langues plus rares en les rapprochant de langues plus proches au lieu d’utiliser une langue de repli unique (souvent l’anglais dans une version simplifiée et parfois imprécise). Voir aussiArticles connexes
Liens externes
Le Texte ci-dessus est disponible sous GNU Free Documentation License. La source est wikipedia http://fr.wikipedia.org/wiki/{title} |