upload
The Unicode Consortium
Industri: Computer; Software
Number of terms: 11048
Number of blossaries: 0
Company Profile:
The Unicode Consortium or Unicode Inc. is a not-for-profit organization that coordinates the development of the Unicode standard. Its stated goal is to eventually enable computers to operate in all languages from around the world. The consortium develops and publishes a list of freely-available ...
Žingsnis algoritmas Unicode normalizuoti formos, per kurį suirusi sekų pakeičiami pirminių kompozitams, jei įmanoma.
Industry:Computer; Software
Pradedant nuo antrasis simbolis koduojamų simbolių seka (kanonicznych skilimo ar suderinamumo skilimo) ir tyrimo nuosekliai galutinis pobūdžio, atlikti šiuos veiksmus: ieškoti R1 atgal (kairioji koduojamų simbolių seka nuo simbolio c rasti paskutinę Starter L iki c simbolių seka). R2 jei tokių yra l ir c yra ne blokuoti nuo l ir egzistuoja pagrindinis sudėtiniai P, kuris yra canonically lygi seka &lt; L, C &gt;, tada pakeisti P L seka ir naikinti c iš numeracijos.Kai algoritmas užbaigia, porų visi ne užblokuotas canonically *lygiaverčiais pirminių sudėtiniai bus sistemingai pakeitė tų pirminių kompozitams. *Starter L R2 pakeitimo toliau reikia patikrinti po to sekantys simboliai, kol simbolių šioje padėtyje nebėra dalis, gali būti pakeičiamas pirminio sudėtiniai ne blokuojami poros. Pvz., apsvarstyti šiuos hipotetinis koduojamų simbolių seka: <u>. Nė vienas iš pirmųjų trijų derinant ženklai sudaro a pirminių sudėtiniai su laišku z. tačiau, ketvirtoji besijungiančių ženklas seka, ūmaus, ar forma yra pagrindinis sudėtiniai su z, ir jis neblokuojamas iš z. todėl, R2 mandatą seka pakeitimo &lt; U + 007A z,... U + 0301 ūmus &gt; su &lt; U + 017A z-ūmus... &gt;, nors yra trys kitų derinant ženklų, įstojusi į bylą seka. *Simbolio C R1 nebūtinai yra ne starteris. Būtina patikrinti visų simbolių seka, nes ten yra sekų &lt; L, C &gt; kur l ir c yra starterių, dar yra pagrindinis sudėtiniai P, tai yra canonically kad seka, . Pvz., indų dviejų dalių samogłoski dažnai turi kanonicznych decompositions į sekų du tarpai samogłoskę požymių, kurių kiekvienas turi Canonical_Combining_Class &#61; 0 ir kuris todėl yra Starter pagal apibrėžimą. Vis dėlto, toks suirusi seka turi yra lygiavertės pirminių sudėtiniai.
Industry:Computer; Software
Simbolį, nesutampa su savo kanonicznych skilimo. , Jis gali taip pat žinomas kaip kanonicznych precomposed simbolis arba kanonicznych mišraus pobūdžio. *Pvz., U + 00E0 Lotynų mažoji raidė a su kapas yra kanonicznych decomposable simbolių, nes jos kanonicznych skilimo seka <u>. U + 212A Kelvino ženklas yra kanonicznych decomposable simbolių, nes jos kanonicznych skilimo į U + 004B Lotynų didžiąja raide K.
Industry:Computer; Software
Система письмовій формі, в якому зазначено приголосними та голосних. Термін "абетка" походить від перших двох літер грецького сценарію: альфа, бета-версії.
Industry:Computer; Software
Інформативний власності первинного одиниць алфавітів і/або силабаріїв.
Industry:Computer; Software
Процес замовлення одиниць тексту на основі в алфавітному порядку. Алфавітних сортування є зазвичай специфічних для конкретної мови.
Industry:Computer; Software
(1) 7-Трохи закодовані набір символів для обміну інформацією. Це США національної варіант ISO/IEC 646, і офіційно США стандарт ANSI-X3.4. Був запропонований ANSI в 1963 році і завершено в 1968 році. (2) Набір 128 символів Юнікод з U + 0000 до U + 007F, у тому числі керування кодів, а також як графічні символи. (3) ASCII неправильно використовується для позначення різних кодувань 8-бітових символів, що містять символи ASCII в перші очки 128 код.
Industry:Computer; Software
Асоціація середньої текстового змісту з точки або діапазон основного тексту. (Значення конкретного анотації вважається частиною "зміст" тексту. Типові приклади включають glossing, цитати, exemplification, Японський йомі і так далі.)
Industry:Computer; Software
Американський Національний інститут стандартів є некомерційною організацією, що здійснює контроль за розробку добровільного консенсусу стандарти для продукції, послуг, процеси, системи та персоналу в Сполучених Штатах. Організації також координує U.S. з міжнародними стандартами, щоб американський продукти використовуються в усьому світі. ANSI є також Microsoft назва для всіх сторінок код Windows. Іноді, призначених для кодова сторінка 1252, який є розширеним набором ISO/IEC 8859-1.
Industry:Computer; Software
Колекція конвенцій, які використовуються для коментувати і прокоментувати текстових редакторів.
Industry:Computer; Software