The Unicode Consortium

séquence de code unité

Une séquence ordonnée d'une ou plusieurs unités de code. *Lorsque le code d'unité est une unité de 8 bits, une séquence de code unité peut aussi être appelé une séquence d'octets. Séquence de *a code unité peut consister en une unité de code unique. *Dans le contexte des langages de programmation, la valeur d'un type de données chaîne se compose essentiellement d'une séquence de code unité. De manière informelle, une séquence de code unité est elle-même juste appelé une chaîne, et une séquence d'octets est appelée une chaîne d'octets. Soins doit être prise pour rendre cette équivalence terminologique, cependant, parce que le concept défini officiellement d'une chaîne peut-être avoir des exigences supplémentaires ou des complications dans les langages de programmation. Par exemple, une chaîne est défini comme un pointeur de char en langage c et est conventionnellement terminée par un caractère NULL. Dans des langages orientés objet, une chaîne est un objet complexe, avec des méthodes associées, et sa valeur peut ou peut ne consister simplement une séquence de code unité. *Dépendant de la structure d'une norme de codage de caractères, il peut être nécessaire d'utiliser une séquence de code unité (de plus d'une unité) pour représenter un caractère codé unique. Par exemple, la code unité de SJIS est un octet : caractères codés tels que « a » peuvent être représentées avec un seul octet en SJIS, tandis que les idéogrammes exigent une séquence de deux unités de code. La norme Unicode utilise également des séquences de code unité dont la longueur est supérieure à l'unité d'un seul code.

Industry:Computer; Software

séquence de caractères codés

Une séquence ordonnée d'un ou plusieurs points de code.Séquence de caractères *a codé est également connu comme une représentation de caractères codée. *Normalement une séquence de caractères codés se compose d'une séquence de caractères codées, mais il peut également inclure noncharacters ou réservés des points de code. *En interne, un processus peut choisir de rendre l'utilisation de points de code non-caractère dans ses séquences de caractères codés. Cependant, ce type de code les points ne peuvent être interprétées comme des caractères abstraits (voir clause de conformité C2). Leur renvoi par un processus conforme constitue la modification de l'interprétation de la séquence de caractères codés (voir clause de conformité C7).Les points de code *réservés sont inclus dans les séquences de caractères codée, afin que les exigences de conformité concernant l'interprétation et la modification sont définis correctement lorsqu'une application conforme à Unicode rencontre des séquences de caractères codés produites dans une future version de la norme. Sauf indication contraire pour plus de clarté, dans le texte de la norme Unicode, le personnage de terme seul désigne un caractère codé. De la même façon, le terme de la séquence de caractères seule désigne une séquence de caractères codés.

Industry:Computer; Software

du jeu de caractères codés (CCS)

Un jeu dans lequel chaque caractère est attribué un point de code numérique. Souvent abrégé comme jeu de caractères, jeu de caractères ou un ensemble de code.

Industry:Computer; Software

codespace

(1) Une gamme de valeurs numériques disponibles pour le codage de caractères. (2) De la norme Unicode, une gamme de nombres entiers de 0 à 10FFFF16.

Industry:Computer; Software

classement

Le processus de commande des unités de l'information textuelle. Classement est généralement spécifique à une langue particulière. Aussi appelé tri alphabétique ou le tri alphabétique. Unicode Technical Standard # 10, « Unicode Collation Algorithm, » définit un classement complet, sans ambiguïté, spécifié pour tous les caractères dans la norme Unicode.

Industry:Computer; Software

combinaison de caractères

Un personnage avec la catégorie générale de marque diacritique (M). *Caractères se composent de tous les caractères avec les valeurs de la catégorie générale des espacement combinant Mark (Mc), marque d'espacement (Mn) et Mark de (me) enveloppant. *Tous les caractères de classe zéro canonique combinant combinent caractères, mais l'inverse n'est pas le cas : il existe des caractères avec une zéro classe combinant canonique. *L'interprétation des caractères usage privé (Co) en combinant les caractères ou non est déterminé par la mise en œuvre. *Ces caractères ne sont pas normalement utilisés isolément sauf si elles sont décrite. Ils comprennent ces caractères comme accents, signes diacritiques, points de l'hébreu, signes de voyelle arabe et matras indo-aryenne. *Le graphique de positionnement des caractères repose sur le dernier caractère de base précédent, à moins qu'ils sont séparés par un caractère qui n'est ni les caractères ni soit zéro menuisier de largeur ou le zéro nonjoiner de largeur. Caractère la combinaison est censée s'appliquer à ce caractère de base. *Il ne peut être telle aucun caractère de base, par exemple lorsque les caractères au début du texte ou suit un caractère de contrôle ou format — par exemple, un retour chariot, tabulation ou marque de droite à gauche. Dans de tels cas, les caractères sont appelés caractères isolés. *Avec des caractères isolés ou quand un processus est incapable d'exécuter la combinaison graphique, un processus peut présenter un caractère d'association sans combinaison graphique ; autrement dit, il peut présenter comme s'il s'agissait d'un caractère de base. *Le représentant des images de la combinaison des caractères sont représentés avec un cercle pointillé dans les charts de code. Caractère de base du lors de présentation graphique combiné à un précédent, que le caractère de base est destiné à apparaître dans le poste occupé par le cercle en pointillé.

Industry:Computer; Software

combinant la séquence de caractères (CCS)

Une séquence de caractères maximale consistant soit suivi d'une séquence d'un ou plusieurs caractères où chacun est un personnage de la combinaison, un caractère de base zéro menuisier de largeur ou zéro largeur non-menuisier ; ou une séquence d'un ou plusieurs caractères, où chacun est un personnage de la combinaison, zéro menuisier de largeur ou zéro largeur-menuisier.Séquence de caractères *lors de l'identification d'une combinaison de texte Unicode, la définition de la combinaison séquence de caractères est appliquée au maximum. Par exemple, dans la séquence < c, dot-dessous, caron, aiguë, un >, la séquence entière < c, dotbelow, caron, aiguë > est identifiée comme le caractère combinant séquence, plutôt que la solution d'identification < c, dot-dessous > comme une combinaison séquence suivie d'un distinct (défectueux) combinant la séquence de caractères < caron, aiguë > de caractères.

Industry:Computer; Software

séquence de caractères composites

Une séquence de caractères maximale consistant soit suivi d'une séquence d'un ou plusieurs caractères où chacun est un personnage de la combinaison, un caractère de base zéro menuisier de largeur ou zéro largeur non-menuisier ; ou une séquence d'un ou plusieurs caractères, où chacun est un personnage de la combinaison, zéro menuisier de largeur ou zéro largeur-menuisier.Séquence de caractères *lors de l'identification d'une combinaison de texte Unicode, la définition de la combinaison séquence de caractères est appliquée au maximum. Par exemple, dans la séquence < c, dot-dessous, caron, aiguë, un >, la séquence entière < c, dotbelow, caron, aiguë > est identifiée comme le caractère combinant séquence, plutôt que la solution d'identification < c, dot-dessous > comme une combinaison séquence suivie d'un distinct (défectueux) combinant la séquence de caractères < caron, aiguë > de caractères.

Industry:Computer; Software

combinaison de classe

Une valeur numérique dans la gamme de 0..254 donné à chaque point de code Unicode, formellement définie comme la propriété Canonical_Combining_Class. *La classe de combinaison pour chaque caractère codé dans la norme est spécifié dans le fichier UnicodeData.txt dans la base de données de caractère Unicode. Un code point ne figurant ne pas dans ce fichier de données défini par défaut à \\p(Canonical_Combining_Class = 0) (ou \\p(ccc = 0) en abrégé). *Une liste extraite de la combinaison de classes, triés par valeur numérique, est fournie dans le fichier DerivedCombiningClass.txt dans la base de données de caractères Unicode. *Seulement la combinaison marques ont une combinaison classe autre que zéro. Presque toutes les marques de combinaison avec une classe autre que zéro sont également des marques sans espacement, à quelques exceptions près. , Pas toutes les marques sans espacement ont une classe de la combinaison de zéro. Ainsi, alors que la corrélation entre les ^ \\p(ccc=0) et \\p(gc=Mn) est étroite, il n'est pas exacte, et mises en œuvre ne devraient pas dépendre de ces deux concepts sont identiques.

Industry:Computer; Software

compatibilité

(1) En cohérence avec la pratique existante ou caractère préexistant des normes de codage. (2) Caractéristique d'une forme d'équivalence et cartographie normative.

Industry:Computer; Software

ISTILAH

SOSIAL

TAMBAHAN

SOLUSI