Одним глазком в Юникод 16.0
Юникод 15.1 пока не поддерживается никем и никак. Но к 16.0 уже готовятся: 1 ноября приняли первые семь эмодзиков. Окончательный выпуск будет осенью 2024.
Эмодзи
Вот она, великолепная семёрка
Колобок с мешками под глазами — усталый, измученный, похмелье, бессонница
Отпечаток пальца — биометрия, место преступления, мелочи, опознание
Корнеплод — свёкла, дайкон, редька, борщ, репетиция, дать в репу
Голое дерево — осень, зима, засуха, экология, депрессия
Арфа — лира, кифара, цитра, классическое исполнительское искусство, Ирландия
Лопата — откопать, подкопать, закопать (прямо или фигурально), вкалывать
Клякса — грязь, пятно, праздник Холи, краска, соус, пейнтбол
Автоматически вместе с кодом государства появился Сарк, островок в Ла-Манше, владение Великобритании.
600 человек, и уже код государства CQ
Кириллица
Добавлена одна буква, появившаяся в 2013 году,— ТЬ из языка ханты (уральская семья, 9 тыс. на 2010). Очевидная лигатура из Т и мягкого знака.
Типа их алфавит
Автор заявки — пикабушник! Мне казалось, что это единственная действующая буква из 16-го Юникода, но нет: есть ещё заглавная буква ɤ, придуманная в 2014 для языка восточный дан (Кот-д’Ивуар, 650 тыс., неписьменный). И целый алфавит гарай.
Около 700 символов со старых компьютеров
Вот лишь немногие из этих символов
Amstrad CPC, Apple II, Mattel Aquarius и множество других. Полагается, что значимые старые платформы исчерпаны и больше символов со старых компьютеров не будет. Вот, как пример, карты ханафуда на одном из японских терминалов.
В этом увидят красоту разве что японцы
Вы только посмотрите на их изобретательность: мордашки, кресты, машинки, диоды, резисторы — и из всего этого нарисовали карты.
Алфавит Тодри
Алфавит Тодри. Авторское Послание к евреям
Тип: алфавит, слева направо, без регистра, экспериментальный
Язык: албанский (на то время — арабица)
Существовал: середина XVIII века…≈1800
Албанский язык, очень далёкий родственник современного греческого, под властью турок несколько веков использовал арабскую вязь. И просвещённые умы около 1800 придумывали другие алфавиты — частично для конспирации от турок, частично для культурной автономии. Уже закодированы виткутьский алфавит (≈1850) и алфавит Эльбасанского Евангелия (до 1800). Вот перед нами третий образчик, также использовавшийся в районе города Эльбасана. Потому алфавит также нередко зовётся «эльбасанским», и чтобы одно не путать с другим, назвали в честь автора — Теодора Хаджифилиппа по прозвищу «учитель Тодри».
Гарай
Гарай. Авторский букварь
Тип: алфавит, справа налево, с заглавными, экспериментальный
Языки: волоф (6,9 млн на 2017, латиница, арабица, адлам); мандинка (2,1 млн ≈2020, латиница, арабица, нко); оба — Сенегал, нигеро-конголезская семья
Существовал: с 1961
Что такое 1961? Это типа освобождение Африки, и некто Ассане Файе из Сенегала придумал вот такой алфавит. В любом случае в конкуренции победила латиница и количество грамотных в гарае в наши дни исчисляется сотнями, но письменность не умерла и изучается.
На ум приходит знаменитая шутка из комикса xkcd
Заглавная буква снабжена большим крючком. В конце слова часто добавляют длинный хвост, что, впрочем, не обязательно и будет поддерживаться шрифтами лишь когда туда добавится Тьюринг-полное программирование. Есть и другие места, где разработчики шрифтов ждут настоящего программирования: сложные стили арабского, египетские иероглифы, европейские ноты, стенография Дюплойе.
Тигалари (=западная грантха, тулу-малая́лам, грантха-малая́лам)
Тигалари. Книга санскритом на пальмовом листе
Тип: брахмийская абугида (особый вид слоговой письменности родом из Индии), слева направо, религиозная
Языки: санскрит (индоевропейская семья), кáннада, малая́лам, тулу (все три — Западная Индия, дравидийская семья). На последнем чаще пишут кáннадой и даже на переписях относят к говорящим на кáннаде.
Существовала: IX…XVII век, крайне редко поныне
Письменность сестринская с уважаемой письменностью малая́лам, и крайне мало используется в индуизме.
Подход к кодированию живых и исторических индийских письменностей очень разный. например, в деванáгари (крупной письменности для хинди, маратхи и более мелких языков):
क [ка] = ка
क् [к] = ка + вирама
क्ष [кша] = ка + вирама + ша
क्षी [кши:] = ка + вирама + ша + ии
Сделано это, чтобы задействовать поменьше клавиш на стандартный стиль — а если нужен другой, есть спецсимволы, которые можно хоть через AltGr. Сложно, но не все в Индии «индусы», есть и те, кто запрограммирует как надо.
В исторических письменностях разделяют видимую вираму (убирает гласную A) и виртуальную вираму (=conjoiner, склеивает согласные). Это упрощает создание шрифтов, перепечатывание документов в авторской орфографии, прочтение авторской орфографии на неполноценном шрифте.
Conjoiner — спецсимвол, склеивает согласные. Virama — видимая, убирает гласную
Цифры берут кто на какие горазд, предлагается унифицировать с кáннадой.
Но это не всё!
Юникод 16.0 — это будет мега-обновление! (В 2022 Консорциум Юникода потерял двух ключевых людей и вынужден был сделать небольшой выпуск.) С новой пачкой эмодзиков будут:
сунвар (Непал, алфавит без регистра, 1942)
гурунг или кхема (Непал, брахмийская абугида, около 1972)
кират-рай (Индия, брахмийская абугида, около 1920)
ол-онал (Индия, алфавит без регистра, 1992)
Я пишу программу «Юникодия» — энциклопедию символов Юникода. Качать тут.
ИТ-проекты пикабушников
351 пост3.2K подписчиков
Правила сообщества
0. Запрещены посты вне тематики сообщества
1. Уважайте труд людей, пишите только конструктивную критику,
2. Не выкладывайте информацию по своему проекту чаще 2ух раз в месяц