Энциклопедия символов «Юникодия»: Юникод 17 альфа
Я всё ещё продолжаю писать программу под Windows — самую лучшую замену стандартной Таблице символов и одновременно небольшую энциклопедию. Качать тут.
И вот что пока вышло.
Инсталлятор
Даже не знаю, что поставить картинкой. Теперь простому юзеру будет сподручнее устанавливать и обновлять прогу. Единственный недостаток — программа всё ещё не подписана.
Программа, как и раньше, не требует инсталляции, и 7z-архив никуда не делся.
Альфа-версия Юникода 17
Выйдет осенью 2025, и будут:
эмодзи: косатка, огрызок, раздутый колобок, обвал, облако драки, снежный человек, танцор балета, тромбон, сундук с сокровищами, многорасовые девушки Плейбоя и борцы
5 новых письменностей: три действующих, одна мёртвая, одна историческая
около 20 знаков астероидов из астрономии XIX века
фигуры «алфил» и «фарзин» из прото-шахмат, чтобы не путать с современными дальнобойными слоном и ферзём
В версии 2.11 закрыто всё, что я в принципе мог закрыть, на этом моя компетенция всё. Остались умляуты шарады, лигатуры арабского и ККЯ.
Для этого, кстати, мне пришлось придумать новый метод перекраски многорасовых эмодзи.
Египетские иероглифы Юникода 16
С ними всё одновременно просто и сложно: нашёл способ полуавтоматически собрать шрифт из программы JSesh. 2900 есть, 1100 не хватает, и потому могу с уверенностью сказать: у меня самый исчерпывающий на данный момент свободный египетский шрифт! (Один полукоммерческий уже есть, но для свободной программы это не выход.)
Иконки блоков
В Юникоде есть собственный шрифт под названием LastResort — шрифт последей надежды, который всеми правдами и неправдами формата TrueType каждому символу Юникода, существующему и будущему, даёт изображение.
Те же иконки блоков, только в профиль.
Бывали случаи, когда я удивлялся, как мы с LastResort, не кооперируясь, взяли один и тот же символ.
С другой стороны, иногда я признавал, что выбор LastResort лучше, и даже частично формализовал принципы выбора иконки.
Сказал носитель языка. Отменяется только серьёзными возражениями. Пример: хирагана あ.
Стандартный символ: А в греческом семействе, ℵ (алеф) в арамейском, К в брахмийском. Отменяется слишком простым, сложным или неопределяющим символом — крестикам, чёрточкам и безликой латыни на иконках не место.
Другой принцип греческого семейства: особый символ, которого нет больше нигде. Примеры: кириллица Я, карийский 𐋆.
Символ, показывающий особенности написания. Пример: Пагба-ламы ꡐ.
Банальная возможность нарисовать на иконке 16×16.
В сестринских письменностях — один общий символ на весь набор.
Первая буква самоназвания. Пример: ваи ꕙ.
Пасхальное яйцо. Пример: кáннада ಠ.
Кроме того, новые алгоритмы масштабирования иконок под HiDPI — итого переделано более 40 штук.
Нет, я не всегда шёл на поводу у LastResort, а наоборот, активно с ним спорил.
Латиница: есть отличная специфичная буква. Изображения управляющих: ради какого символа обычно идут в этот блок? Дальше продолжать?
Японский
Объявился японец и перевёл Юникодию на свои иероглифы. Я ему активно помогал, и даже дописывал принципы локализации, чтобы работал язык, далёкий от западного.
Готовил к китайскому, но уже в начале работы китаец исчез, зато объявился кто-то близкий — несчастный случай, работа сворачивается.
Локальные меню
Локальные меню — не лучший способ управлять прогой (раскрываемость ниже плинтуса), но если пользователь методом псевдонаучного тыка раскроет — и понятно, и закон Фиттса радуется. Пусть будет.
Cambria
Стандартный шрифт для латиницы и кириллицы я люблю и ненавижу: он достаточно лёгкий, для мелких символов типа дробей и индексов хорошо выставлены вес и положение, отличная математика, неплохо сочетается с Noto, но каждый символ надо проверять. Вот пример:
Так замену ему и не нашёл. Не хочу обычный Таймс (например, BabelStone Roman).
Что остаётся? Закрытый список символов, которые вообще могут отображаться Кембрией. Для латиницы правило таково: блок C или версия до 5.0, и не Алфавитные формы, и не вот такие глючки. Любой другой символ, который когда-нибудь войдёт в Cambria, будет отброшен.
Техническое
Тридцать мелких шрифтов объединил в один большой «франкеншрифт» — это должно снизить вероятность глючка, когда какой-то шрифт не подгружается. (Хотя такие глюки стали совсем редкими — народ сообщал, но я не видел на своих трёх компах ни разу.)
OpenSSL 1.1 брошен, но кто-то продолжает неофициально исправлять уязвимости. А я подбираю и компилирую.
Несколько упростилась сборка программы.
Из книги В неведомых горах Якутии. Открытие хребта Черского. Обручев С.В. - Развитие письменности у малых народов
Наблюдение за сохранением и развитием уникальности в культуре якутского народа.
В СССР в первые же годы, активно началась ликвидация безграмотности и практика сохранения своей культуры при интеграции в общую культуру Советского строя
Книга 1928 года издания
Интересная вакуумная перезаправляемая ручка
Ручка Majohn V1 с прозрачным корпусом и вакуумным наполнением чернилами в винтажном стиле. Ссылка на ручку. Чернила приобретаются отдельно, есть цвета: красные, синие, зелёные и чёрные на выбор. Ссылка на чернила
Алфавиты №1. Абазинский язык
Абазинский язык (абаза бызшва) национальный язык абазин, относится к абхазо-абазинской ветви абхазо-адыгской языковой семьи группы языков Кавказа. Наиболее близок к абхазскому языку. Имеет официальный статус в одном из субъектов Российской Федерации - Республика Карачаево-Черкесия.
Абазинская письменность развивалась на основе разных алфавитов, XIX — начало XX веков — попытки создания письменности на арабской основе, с 1932 до 1938 года состояла из латиницы.
С 13 мая 1938 года решением народного комиссариата просвещения РСФСР введён кириллический алфавит. На данный момент состоит из 71 букв + 2 буквы ФI и ЛI встречаются в диалектах и отсутствуют в официальном алфавите. Далее алфавит с транскрипцией по Международному Фонетическому Алфавиту:
А а - /a/
Б б - /b/
В в - /v/
Г г - /g/
Гв гв - /gʷ/
Гъ гъ - /ɣ/
Гъв гъв - /ɣʷ/
Гъь гъь - /ɣʲ/
Гь гь - /gʲ/
ГӀ гӀ - /ɦ/~/ʕ/
ГӀв гӀв - /ʕʷ/
Д д - /d/
Дж дж - /ʤ/
Джв дж - /ʤʷ/
Джь джь - /dʑ/
Дз дз - /dz/
Е е - /je/, /e/
Ё ё - /jo/
Ж ж - /ʒ/
Жв жв - /ʒʷ/
Жь жь - /ʑ/
З з - /z/
И и - /i/
Й й - /j/
К к - /k/
Кв кв - /kʷ/
Къ къ - /q'/
Къв къв - /q'ʷ/
Къь къь - /q'ʲ/
Кь кь - /kʲ/
КӀ кӀ - /k'/
КӀв кӀв - /k'ʷ/
КӀь кӀь - /k'ʲ/
Л л - /l/
Ль ль - /ɮ/
М м - /m/
Н н - /n/
О о - /o/
П п - /p/
ПӀ пӀ - /p'/
Р р - /r/
С с - /s/
Т т - /t/
Тл тл - /ɬ/
Тш тш - /ʧ/
ТӀ тӀ - /t'/
У у - /u/, /w/
Ф ф - /f/
Х х - /x/
Хв хв - /xʷ/
Хъ хъ - /q/
Хъв хъв - /qʷ/
Хь хь - /xʲ/
ХӀ хӀ - /ħ/
ХӀв хӀв - /ħʷ/
Ц ц - /ʦ/
ЦӀ цӀ - /ʦ'/
Ч ч - /tɕ/
Чв чв - /tɕʷ/
ЧӀ чӀ - /tɕ'/
ЧӀв чӀв - /tɕ'ʷ/
Ш ш - /ʃ/
Шв шв - /ʃʷ/
ШӀ шӀ - /ʧ'/
Щ щ - /ɕ/
Ъ ъ - /ʔ/
Ы ы - /ə/
Ь ь - /ʲ/
Э э - /e/
Ю ю - /ju/
Я я - /ja/
ФӀ фӀ - /f'/
ЛӀ лӀ - /ɬ/
В Египте хоронили русских?
По версии Фоменко-Носовского, Русско-Ордынская Империя хоронила каких-то выдающихся людей в Египте. Как-то странно, ведь везти далеко из Владимиро-Суздальской Руси, и, если хоронят наших, логично писать на могилах по-славянски, а не по-древнеегипетски
Что (скорее всего) ожидается в Юникоде 17
Буквально позавчера появился список эмодзи Юникода 17. Поскольку зафиксированы только эмодзи и китайские иероглифы, остальное — мои догадки.
Эмодзи
Искажённый колобок — уязвимый, тревога, паника, потрясение, удивление
Облако драки — драка, спор, несогласие, дискуссия, борьба
Балерина — я так и не понял, для чего они её хотят (она бесполая), но, полагаю, как бесполая версия танцора (женщина 💃 танцует латиноамериканские, а мужчина 🕺 диско)
Огрызок — компост, съедено, отходы, гнилое
Косатка (хищный зубатый кит) — краснокнижные морские обитатели, главная достопримечательность океанариумов
Снежный человек (бигфут, сасквач, йети) — бродить, неизвестно где
Тромбон — помимо джаза, есть знаменитый джингл «грустный тромбон»
Обвал — ещё одно природное бедствие. А если иносказательно — когда что-то в душе рушится
Сундук с сокровищами — приз, награда, богатство
Также сделали многорасовыми эмодзи «девушки Плейбоя» и «борцы». Больше не останется эмодзи, где есть много людей без расы. Как обычно, сделано это через ZWJ-последовательность «человек1 + раса1 + ZWJ + что-то + ZWJ + человек2 + раса2». Для девушек Плейбоя это «что-то» — заяц 🐰, для борцов — то самое облако драки.
Возможно (пока не знаю), что балетные тапочки из бежевых сделают чёрными. Это ещё один шаг к лишению эмодзи пола и расы.
Китайские иероглифы
Дело в том, что в конце 2022 китайское правительство решило ответвиться от Юникода и выпустить отраслевой стандарт, где около 800 иероглифов из китайских имён без надлежащей проверки были закинуты в неиспользуемую плоскость A. Это стало форменным плевком в лицо Консорциума: закинули бы в пользовательскую E или F — никто бы и слова не сказал!
Проверка шла с большим скрипом, к выпуску едва уложились (обычно ничего не меняется уже за 8 месяцев, а если символ отправят на доработку — остаётся дыра). К тому же умер главный иероглифист Консорциума.
И вот мартышкин труд закончен, знамя умершего подхвачено, но от выпуска 15.1 до фиксации Юникода 16 было всего четыре месяца. Так что 5000 символов войдут в Юникод 17.
Другие символы для полудиезов/полубемолей (±четверть тона)
Юникодные ноты появились в 2001 году. А музыкальное ПО за более чем 20 лет выбрало другие изображения полудиезов и полубемолей. Собрали все существующие стандарты и закинули скопом.
Шахматные фигуры «алфил» и «фарзин»
В прото-шахматах cлон и ферзь были малоподвижными фигурами: ферзь ходил на одну клетку по диагонали, а слон — на две, перепрыгивая через фигуры.
Чтобы не путать их с современными дальнобойными слоном и ферзём, для них сделали отдельные изображения.
Разунификация консольных символов с эмодзи
Выяснилось, что добавлять текстовым символам свойство «эмодзи» (00A9 — знак копирайта ©, 00A9+FE0F — эмодзи копирайта ©️) — это несколько упрощает жизнь в моменте, усложняя «в долгую», и такого больше делать не надо.
И тут в 2024 приходят символы со старых компьютеров и делают прямо противоположное: эмодзи иногда становятся текстовыми. Некоторые из тех компов вообще не имели графики, игровые спрайты выводились текстом.
Эмодзи, работающие на символе FE0F — глаз 👁️, домики 🏘️ — разунифицировать не стали.
Сидетский
Тип: алфавит, ←
Язык: сидетский (около начала нашей эры, совр. Турция)
Состояние: исторический, частично расшифрован
Сидетский — современное название языка (самоназвание неизвестно), потому что использовался в районе города Сид. Известно всего 13 надписей. Поскольку часть символов спорные, символы названы по каталожным номерам.
Толонг-сики
Тип: алфавит, →, действующий
Язык: курух (Индия, дравидийская семья, 2,3 млн)
Состояние: изобретён в 1999 и набирает публику
Я тут смотрю на новые алфавиты Индии и удивляюсь: значительно менее ёмки, чем, например, деванáгари, сделаны коряво, но набирают сторонников? А потом: посмотри на свою собственную кириллицу! Разница только в том, что над кириллицей работали поколения типографов, и она перестала быть корявой — а толонг даже лучше кириллицы приспособлен под беглое письмо.
А также удивляюсь, как в Индии встречаются неписьменные языки с миллионом говорящих.
Чжурчжэньские иероглифы
Тип: иероглифы, ←↓↓ по столбцам, исторические
Язык: чжурчжэньский, предок маньчжурского
Состояние: действовал 1100 –1300, язык никогда не заговорит, но благодаря любви китайцев к документированию всего и вся про него известно очень много
Письмо использовалось в первую очередь для связи чжурчжэней с китайским двором. Как правило, иероглифические надписи имеют китайский порядок слов, а не маньчжурский.
Чисой
Тип: спорный (абугида/алфавит), →, действующий
Язык: курмальский (Индия, индоевропейская семья, 300 тыс.)
Состояние: изобретён в 1994 и набирает популярность
Вот это я понимаю алфавит! И красив, и писать достаточно просто.
Берия
Тип: алфавит, →, дейстувющий
Язык: загава (Африка, сахарская семья, 300…450 тыс.)
Состояние: изобретён около 1950, реформирован в 2021
Раз загава — кочевники-скотоводы, то письменность сделана из… клейм для верблюдов. Видимо, если верблюдом владеет условный Пумба, пусть это будет буква П.
Лорна Эванс из SIL International, которая много раз прикладывала руку к подобным мелким языкам, участвовала в реформе письменности и сделала вот такой красивый открытый шрифт.
Интересная фишка — большие буквы не поднимаются ввысь, а опускаются ниже строки.
Я пишу программу «Юникодия» — самую исчерпывающую таблицу символов Юникода. Качать тут.




























