Unicode: Za oponou

Konzorcium Unicode minulý rok oslávilo svoje 25. výročie. Pravda je, že napriek všetkej práci, ktorú Unicode robí, aby zaistil text z jazykov po celom svete – väčšina z nás pozná Unicode ako skupinu, ktorá schvaľuje nových emodži.
To, čo nemusí byť také jasné, je, prečo sa vyžaduje veľké konzorcium, alebo skrytá zložitosť Unicode. Alebo ako sa už „emodži zvracania zobrazené v karikatúre XCKD vyššie sa považujú za„ platné (ale neodporúčané) “.

Mark Davis, spoluzakladateľ a súčasný prezident spoločnosti Unicode, sa snažil objasniť, ako sa Emoji zapadá do Unicode v tomto prehľade na vysokej úrovni, ktorý sa zameriava na to, čo je Unicode a ako sa do nej uniká podvýbor Unicode Emoji („Emoji SC“) to.
Davis poznamenáva, že emodži tvoria iba zlomok celkového počtu znakov v štandarde Unicode. Sotva ich v tejto tabuľke dokážete urobiť:

Samotné postavy nehovoria polovicu príbehu. Niekoľko glyfov sa musí kombinovať, keď sa zobrazia v určitých objednávkach alebo kombináciách.

Kombináciou, ktorá bude mnohým známa, je to, ako sa implementujú tóny pokožky emodži.
Tieto fungujú tak, že zistí, kedy sa znak modifikátora zobrazuje po ľudskej emodži, napríklad 👧 dievča. Tieto kombinujú na podporovaných platformách, aby ukázali jediný emodži:

Zložitejšia implementácia spočíva v spojení dvoch alebo viacerých emodži do tzv. Emoji ZWJ sekvencie.
Používajú sa na vytváranie povolaní, ako je sudkyňa 👩‍⚖ ženy. Táto emodži sa vytvára v sekvencii pomocou 👩 ženy a ⚖ Emojis v rovnováhe.
Postava „ZWJ“ (stolár s nulovou šírkou) stojí medzi týmito dvoma emodži a je neviditeľným lepidlom, ktoré sa pripojí k viacerým emodži do jedného (kde je podporovaný).

Iné typy sekvencií ZWJ uvádzajú existujúce emodži, ako napríklad 🕵 detektív so symbolom pohlavia ♀ ženský znak pridaný po ňom.
Tento typ sekvencie ZWJ sa všeobecne používa, ak už existuje emodži. Napríklad: Runner, Surfer alebo mnoho gest.

A áno, môžete kombinovať modifikátory a ZWJ, aby ste vytvorili dlhšiu sekvenciu.

Unicode nekontroluje sekvencie ZWJ rovnakým spôsobom ako nový emodži, ktoré si vyžadujú vlastný kódový bod.
Unicode odporúčané sekvencie, ktoré by mali byť podporované pre konzistentnosť medzi platformami. Predajcovia však môžu slobodne kombinovať akékoľvek emodži s akýmkoľvek iným, ako to považujú za vhodné.
Spoločnosť Microsoft má v systéme Windows k dispozícii šesť mačiek Ninja, ktoré nie sú súčasťou zoznamu odporúčaných Unicode. 🐱 Cat Face a 🚀 Raketa sa kombinujú na Windows 10, aby ukázali emodži pre 🐱‍🚀 Astro Cat.
Astro Cat je platná (pretože používa správnu sekvenčnú štruktúru), ale neodporúča sa, ako sú iné povolania a pohlavia.

XKCD navrhol, že zvracanie by malo byť znakom modifikátora, aby sa vytvoril „zvracanie kovboja“.
Davis poukazuje na to, že 🤠 kovbojská klobúková tvár už mohla byť kombinovaná s 🤮 tvárou vracaním, aby sa vytvorila platná sekvencia ZWJ:

Pre emodži existujú ďalšie typy sekvencií, vrátane sekvencií príznakov, sekvencií značiek a sekvencií keycap. Mali by ste sa pozrieť na celú sadu snímok, aby ste ich videli podrobnejšie.
Nakoniec sa pozrieme na časovú os (aktuálnu, 2017), ako sa narodí nový emodži:

🚨 Aktualizácia v apríli 2020: Aktuálny časový harmonogram toho, ako sa vytvára nový emodži, výrazne ovplyvnil pandémia Covid-19. Viac informácií o revidovanom rozvrhu na rok 2020 a ďalej nájdete tu.
Unicode má samozrejme stále veľa čo robiť mimo podpory emodži:

„Existuje približne 7 000 žijúcich ľudských jazykov, s rôznou úrovňou vitality. Menej ako 100 z týchto jazykov je na počítačoch, mobilných telefónoch a iných zariadeniach dobre podporovaných, zatiaľ čo všetky zvyškové riziko je digitálne znevýhodnené“

Unicode má program Adopt a znakový program. Finančné prostriedky získané z adopcií idú do výskumu na podporu týchto digitálne znevýhodnených jazykov.
Viac:

Unicode Emoji od Marka Davisa
Unicode si osvojte postavu
Noví emodži na rok 2017
Zábavné hackery emodži

Hľadať emodži: