В предыдущем посте я рассказала о программе, позволяющей вводить тысячи символов Юникода с клавиатуры рядом способов: клавиатурные привязки, режим «Композиции» (аналог «Compose»), функция «Поиска». Понемногу продолжаю улучшать и расширять её возможности, а в этом посте описаны основные изменения за серию обновлений (0.1.3.2 α >>> 0.1.7.3 α).
Для быстрой справки: библиотека программы состоит из внушительного перечня символов латиницы, кириллицы, греческого, ряда исторических форм письменности и иных различных символов: валютные, математические и пр. GitHub репозиторий с релизами тут.
Это позволяет писать на внушительном перечне языков, имея лишь английскую и русскую раскладки, и иметь под рукой символы под разные нужды. Нужен интеграл? «Поиск» → запрос «интеграл» → вставит в поле ввода «∫».
Что нового?
В общем библиотека символов возросла с 4700+ до 6300+ символов.
Добавлены новые формы письменности, чьи наборы привязок доступны в «Альтернативном вводе»:
Теги (как я поняла, это устаревшие символы для разметки, ныне используются для записи ещё ряда флагов: 🏴<теги gbwls/gbsct/gbeng><закрывающий тег> → 🏴 🏴 🏴 дадут флаги Уэльса, Шотландии и Англии [сами теги невидимы при вводе])
Символы в круге (Ⓒⓘⓡⓒⓛⓔⓓ ⓢⓨⓜⓑⓞⓛⓢ)
… в закрашенном круге (🅝🅔🅖🅐🅣🅘🅥🅔 🅒🅘🅡🅒🅛🅔🅓)
… в двойном круге (⓵⓶⓷⓸⓹⓺⓻⓼⓽⓾)
… в квадрате (🅂🅀🅄🄰🅁🄴🄳 🅂🅈🄼🄱🄾🄻🅂)
… в закрашенном квадрате (🅽🅴🅶🅰🆃🅸🆅🅴 🆂🆀🆄🅰🆁🅴🅳)
… в скобках (🄟⒜⒭⒠⒩⒯⒣⒠⒮⒤⒮⒠⒟ ⒮⒴⒨⒝⒪⒧⒮)
… с точкой/запятой (⒈⒉⒊⒋⒌ | 🄂🄃🄄🄅🄆)
… контурные () [недоступны через селектор]
… сегментированные (🯱🯲🯳🯴🯵🯶🯷🯸🯹🯰) [недоступны через селектор]
Добавлены/расширены наборы тематических символов:
Алхимия, астрология и астрономия раньше были представлены 48-ю символами, теперь же набор состоит из 234-х символов.
С расширением этих наборов были улучшены генерация названий/тегов и поиск в главном окне.
Алхимические, астрологические и прочие символы могут нести ряд значений.
Пример: символ Юпитера «♃» в алхимии означает олово, и оба значения присутствуют в его тегах. При вводе «Олово» в строке поиска главного окна список отобразит «Алхимический символ элемент Олово» вместо стандартного названия «Астрологический символ планета Юпитер».
Улучшена логика отдельной функции «Поиска», вставляющей символы по запросу: теперь при вводе без пробела ищет цельное слово. Раньше ввод «олово» давал символ «〈» («восточная левая заголовочная кавычка»). Теперь олово даёт… олово ♃. Дополнение полезно и для ранее добавленных символов: теперь для получения альтернативных форм не нужно писать что-то в духе «!lat let a::mo» для получения надстрочной «ᵃ», теперь достаточно «!a::mo».
Карточные масти: закрашенные/контурные и эмодзи варианты ♠♥♦♣♤♡♢♧♠️♥️♦️♣️ (некоторые приложения/сайты могут принудительно преобразовывать закрашенные в эмодзи).
Игральные карты (81): 56 «обычных», 3 джокера, 1 дурак, 1 рубашка и 21 козырная карта «Таро Нуво» 🃘🃌🂽🂡🂠.
Плитки/кости Маджонг (43): 3 масти по 9 костей, 7 благородных костей, 8 цветов/сезонов, джокер Американского Маджонга 🀤🀖🀛🀄.
Расширен набор поддерживаемых раскладок кириллицы, в сумме: ЙЦУКЕН, Диктор, ИІУКЕН (1907), ЯШЕРТЫ, Харламак, Рулемак.
Наиболее важные изменения и исправления
Режим «Композиции» теперь поддерживает кастомизацию: размер шрифта, шрифт, цвет текста и фона, ограничения символов для обрезки подсказки, возможность отключить отображение избранного, предложений и выбор показа альтернативных рецептов совпадающих символов (вкл: покажет все рецепты для совпавшего символа, выкл: покажет только текущее совпадение).
Примеры разных настроек «Композиции»
Селектор для Альтернативных режимов также заимел немного кастомизации: количество выводимых пунктов на страницу, максимальное количество колонок и порог, когда они активируются; возможность использовать цифровые клавиши.
Варианты окна селектора с разными настройками
Исправлена ошибка при запуске на Windows 11 (появившаяся в версии 0.1.5.3 α), а так же невозможность ввода символов привязок в поле «Композиции» на этой же ОС.
Исправлена критическая ошибка в режиме «Композиции», вызываемая вводом символов «?+()[]».
Исправлена ошибка при использовании в пользовательских рецептах мультиссылок формата ${\m,u,l,t,i/}: раньше при запуске программы такая ссылка сравнивалась в лоб, вместо разбора на отдельные и сравнения каждой.
Исправлены ошибки, связанные с добавление в избранное и удаления из него.
Исправлен недостаток режима «Композиции» из-за которого был невозможен ввод рецептов с символами из суррогатных пар (символы с кодовой точкой из пяти значений, представляют из себя два символа: 🜍 = U+1F70D = U+D83D и U+DF0D).
Теперь в режиме «Композиции» показывается символ, соответствующий текущему режиму «Вариации глифов».
Без «Вариаций глифов», Комбинируемые символы, Символы-модификаторы/надстрочные
Изменения для модификаций: изменения файла информации о моде; добавлена возможность создать базовый шаблон мода прямо из окна модификаций; теперь создатель мода может добавить локальные настройки и они будут доступны через соответствующую кнопку в окне модификаций, однако интерфейс окна настроек необходимо будет создать самому
Появился вспомогательный класс «ModTools», автоматически инициализируемый в экземпляре класса мода при его создании через интерфейс и содержит сейчас следующие параметры: origin (директория мода); dirName (имя директории); paths.data/locale/lib/resources (пути до локальных папок); config (экземпляр класса для управления настройками: Set/Get); config_editor (переменная для назначения в неё GUI окна настроек мода). Под изменения системы модификаций был обновлен мод-пример.
Более мелкие исправления включают в себя изменение ошибочных рецептов, ошибок параметров отдельных символов, исправление ошибок в обработке записей символов, добавление пропущенных привязок и прочие улучшения.
Что дальше?
Продолжу улучшать программу и пополнять её новыми/пропущенными символами, а возможно и новыми фичами.
— Но… зачем это мне?
Мой инструмент может быть полезен, если вы:
Лингвист/филолог, пользуетесь Международным фонетическим алфавитом, интересуетесь семитскими и анатолийскими языками; с учётом охвата латиницы и рун можно упомянуть и германские языки (Древнеанглийский [Ænglisċ], Древнескандинавский [Dǫnsk tunga / Norrœnt mál] и пр.); а с учётом кириллицы и глаголицы — Старославянский язык [Словѣньскъ ѩꙁꙑкъ].
Составляете конланги на основе существующих форм письма.
Пишите на трёх и более языках, при этом ища альтернативы обычным языковым раскладкам (например, мне самой не удобно, когда одна графема на раскладках разных языков — в разных местах, пусть это и логично).
Занимаетесь типографикой/дизайном и вас не удовлетворяет арсенал «Типографской раскладки» (здесь намного больше разных пунктуационных знаков, вариаций пробела и т.д.; ещё в программе есть и своя функция «Оттипографить»).
А может даже интересуетесь темой оккультизма, алхимии, гадательных практик и хотели бы использовать соответствующие символы без Ctrl+C Ctrl+V и карт символов.
Или просто нуждаетесь в символах, обычно недоступных на клавиатуре/доступных только с Alt+XXXX комбинаций.
«Ограничения и нюансы» остаются такими же, как описаны в предыдущем посте, однако после контентных добавлений потребление ОЗУ в пике может дойти до 190 МБ (раньше 180, первичный запуск программы + первичный запуск главного окна) (без учёта модов и пользовательских рецептов).
Я всё ещё продолжаю писать открытую энциклопедию Юникода и замену стандартной Таблице символов. Качать тут.
Скриншот
Вот отчёт за последние полгода.
Всплывающее окно: символ
Теперь, чтобы увидеть символ и скопировать тривиальную информацию по нему, можно просто ткнуть на ссылке.
Панель Подборок из синей стала зелёной: теперь это не переход.
Внизу ссылочка «◀◀◀ U+FE0F». Она во всех всплывающих окнах: если вдруг вы закрыли, или любопытство завело вас непонятно куда, вы легко можете вернуться туда, где были. История запоминается на целых 100 шагов.
Иероглифы разные
Эмодзи. Обратите внимание на балерину выше: подтянул свежую библиотеку Google Noto. Только косатку оставил свою: ну не получился у Гугла хищный зубатый кит.
Эмодзики Google Noto
Флаг Сирии заменил на бенладенский, вслед за Ябблом.
Бенладенский флаг Сирии
Египетские. Сейчас они обслуживаются тремя шрифтами.
Google Noto: проверен египтологами. Низкие кегли совсем не держит. Покрывает базовый блок 2009 года.
Мой, основанный на JSesh (программе-редакторе египетских текстов). Низкие кегли неплохо держит. Покрытие рандомное. Пришлось проверять и перерисовывать, но такая красотища! Разногласия решались простым большинством из трёх источников: изображения Юникода, описания Юникода и NewGardiner.
Жанровые сцены (разные, но близкие) тремя шрифтами: Noto, GewGardiner, JSesh
Шрифт буду потихоньку расширять, пока буду жив, и последовательность такая.
Стадия 1. Три шрифта в сумме покрывают все египетские иероглифы. Выполнено в июле, нарисовано и перерисовано несколько десятков иероглифов.
Стадия 2. Все символы моего шрифта проверены на простейшую корректность. Выполнено только что, сделано более 600 иероглифов. Главный вопрос — борода: у египтян короткая, у фараонов длинная, у богов крючком.
Стадия 3. Шрифт растяну на 1100 символов основного блока. Будет ХЗ когда, предполагаемый срок — после Нового года. Рассчитываю на 200…300 иероглифов работы.
Стадия 4. Буду поддерживать все египетские иероглифы. Будет минимум через полтора года и 800 иероглифов.
Поставил на свой шрифт такие требования: 1) если человек держит что-то, оно всегда будет изображаться гипертрофированно; 2) если минимальная причёска и ничего не говорится про бороду — то бороды нет; 3) только очень близкие символы приводятся в единый стиль.
Тангутские. Просто нашёлся человек, нарисовавший всё, что было.
Новые тангутские иероглифы
Арабский. Он же нарисовал временные изображения арабских лигатур.
И Сулейман ибн Дауд — мир с ними обоими! — приказал принести два сосуда: один медный, а — другой глиняный, и заточил меня в глиняном сосуде, а брата моего, Омара Хоттабовича, — в медном.
Лазарь Лагин. Старик Хоттабыч. — М: 1959
Вот такие стандартные фразы часто заменяются лигатурами (склейками), примерно такими.
Слева — профессиональная (Scheherezade New). Справа — затычка, сделанная тем китайцем
Китайские. Китаевед Эндрю Уэст стал более публично работать над своим шрифтом, я с ним советовался, проверял его на ошибки… и вдруг он неожиданно помер! Что с ним дальше делать, просто не знаю: шрифт-то отличный, просто больше никем не поддерживается. Оставил небольшую «пасхалку» в его память, кто найдёт…
Нашёл более удачную библиотеку преобразования GlyphWiki→SVG, и теперь китайские подскочили в качестве.
Плохие новости для Windows 7 и необновлённой 10-ки: теперь самый-самый резервный китайский шрифт — новый стандартный SimSun-ExtG. Простите уж, и до этого были тофу — будет больше.
Турецкая локализация
Нашёлся турок, и мы с ним вместе сделали неплохой перевод.
Турецкий перевод
А вот японский несколько застоялся: японец выхаживает серьёзно больную жену.
И тут получилась проблема: я не могу быстро изменить языки, которые не знаю. А ведь есть фразы типа «в базовой плоскости Юникода осталось 16 нераспределённых символов», или «изобретатель маджонг-пасьянса прикован к коляске, но жив» — пока истинны, но может измениться. Вот приходится писать что-то вроде «жив на 2025», и это 2025 — особый шаблон. Если узнаю, что умер,— напишу. А не известные мне языки продолжат гласить: жив на такой-то год.
Поиск
Обнаружилась ошибка: поиск неизвестного флага давал ошибочную строку. После разговоров с пользователем решил не убирать, только облагородил.
Поиск «XA»
Докрутил поиск в египетских иероглифах. Иероглифы намеренно имеют пониженный приоритет.
Поиск «man»
Перебраны короткие словечки: где они играют роль, а где нет.
Поиск «by»
Почему сверху Белоруссия, понятно. Почему второй — именно этот слог письма и? А потому, что именно там BY — не предлог, а нечто значимое!
И… довольно странная просьба. Дело в том, что за обработку эмодзи отвечают сразу три подсистемы: вписанная в шрифт программа, типографский движок и высокоуровневая типографская библиотека где-то в прикладной проге. В результате такого разделения ответственности получается, что определённые нестандартные последовательности, тем не менее, корректно отображаются картинками-эмодзиками. Такие последовательности делятся на 1) минимально квалифицированные (скорее всего, отобразятся), 2) неквалифицированные (отобразятся, если будет угадан шрифт), и 3) странные (полагаются на особую реализацию эмодзи-шрифта).
Просили декодировать такие странные эмодзи.
Стандартный код для него — просто 1F46B
Все такие нестандартные эмодзи у меня делятся на три категории: 1) поменяны местами мужчина/женщина, мальчик/девочка; 2) существует более короткая последовательность; 3) оба сразу.
Минимально квалифицированный: не хватает VS16 после сердечка
Программа даёт доступ к внушительному перечню символов Юникода прямо с клавиатуры. Основной фокус — увеличение охвата латиницы и кириллицы без надобности в отдельных языковых раскладках, помимо английской и русской. Но этим инструмент не ограничивается.
Написана на AutoHotkey v2
Прескриптум: из-за отсутствия элемента блока кода все примеры кода будут ссылкой на GitHub Gist’ы.
Зачем? — У меня и самой был запрос на такую программу. Программу с кучей «нестандартных» символов. Существующие решения не отвечали моим потребностям и тогда я решила создать своё, подходящее под мои хотелки: многоязычный ввод, ввод типографских, математических и даже алхимических символов. И теперь я надеюсь, что сие «изобретение» окажется полезным не только для меня.
Такой инструмент необходим мне для разработки вселенной — построение канона культур, писательство и работа с языками. Создавать новые языки на основе существующих систем ныне будет проще — все нужные символы как на ладони.
Примеры названий языков и систем, написанные с помощью моей программы:
Қазақ тілі, Хуэйзў йүян, Забони тоҷикӣ, Йағнобӣ зивок, Аԥсуа бызшәа, Авар мацӏ, Українська мова, Словѣньскъ ѩꙁꙑкъ, Црногорски језик, Лимба Рꙋмѫнѣскъ, Итәнмәӈин крвэԓхатас, Даһур Усүүэ, Азәрбајҹанҹа, Башҡорт теле, Тэлэңгэт, Чӑваш чӗлхи…
Ænglisċ sprǣċe, Français, Tiếng Việt, Hànyǔ Pīnyīn, Norrœnt mál, Limba Română, Español, Język polski, Čeština, Bokmål, Tamaziɣt, Türkçe, Sää’mǩiõll…
Распаковать содержимое архива куда угодно — это и будет директорией установки.
Запустить DSLKeyPad.exe или DSLKeyPad.ahk файл.
При необходимости в настройках можно установить автозагрузку при старте системы.
*При перемещении папки необходимо будет снова установить автозагрузку, т.к. путь не обновляется автоматически.
Нужен шрифт Noto Serif, но при его отсутствии программа сама предложит установку.
GUI с представлением списка доступных символов с их хоткеями или «рецептами» (см. далее)
Краткий экскурс
Идея «DSL KeyPad» родилась, как было упомянуто выше, из собственной потребности в «нестандартных» символах. Сначала я пользовалась «Типографской раскладкой» Ильи Бирмана (и пользуюсь по сей день в паре со своим инструментом), но этого мне оказалось мало — она не давала мне всего необходимого.
Работа над книгой стала отправным толчком: мне хотелось использовать в ней буквы «Ў», «Ӯ», «Ӣ», «Ō» и пр.: Сўкэнори, «Записи времён Тōбō» (Tōbō nendai-ki), Фӯдзин. Я искала и пробовала другие решения — например, WinCompose, — но по итогу это привело меня к мысли «всё не совсем то». Тогда я уже занималась написанием своего скрипта, ещё совсем простого, и продолжила его развивать.
Первая версия была до банальности примитивной, ~20 биндов формата обычных привязок:
<^<!m:: Send("{U+0304}") ; Combining macron
<^<!b:: Send("{U+0306}") ; Combining breve
…
<^>!>+1:: Send("{U+2003}") ; Em Space
<^>!>+2:: Send("{U+2002}") ; En Space
…
<^<!e:: Send("{U+045E}") ; (Ў)
…
Со временем мою голову начали посещать всё новые идеи и желание хотя бы попробовать их реализовать. Желание сделать что-то сложнее, разнообразнее, и что могло бы охватить все мои потенциальные символьные хотелки. Как итог — процесс, конечно, сильно затянулся, да получился какой-то монструозный ООП’оид, но результатом я довольна (есть что улучшать, и я буду это улучшать по мере возможности).
Думаю тут же следует упомянуть, что я не программист. Максимум кодер. В начале разработки так вообще была утёнком тем ещё и бегала частенько к нейронке (с которой контакт заладился плохо — не умел гпт с автохоткеем нормально помочь… и хорошо — лишний пинок самой думать над кодом).
Краткий перечень возможностей
Как описано в заголовке — поддержка более 4 700 символов Юникода, включая: пунктуацию, математические символы, символы валют, специальные символы, алхимические и т.д.
«Многослойный» набор привязок, в основном — раздельных для английского и русского языков ([англ.] RAlt + A → Ă, RAlt + Z → Ż [рус.] RAlt + Ф → Ѳ, RAlt + Я → Ѧ). Включает поддержку пользовательских привязок в JSON‐формате.
Режим композиции — активируется двойным нажатием RAlt и позволяет получать одни символы из последовательности других («рецепта») (AE → Æ OE → Œ A◌̆◌́ → Ắ ІѪ → Ѭ ДЧ → Ԭ ΣΤ → Ϛ, αͺ → ᾳ). Включает поддержку пользовательских рецептов в INI/JSON/XCompose форматах.
Вариации глифов — режимы, позволяющие вводить альтернативные варианты символов (A → ᴬ 𝐴 𝐀 𝑨 𝖠 𝘈 𝗔 𝘼 𝙰 ᴀ 𝔄 𝕬 𝒜 𝓐 𝔸). Интерфейс схож с предыдущим пнуктом, но сама фича работает чуть-чуть иначе.
Переключение режима ввода между символами Юникода [Ă Ǣ], HTML-энтити/мнемоники [Ă Ǣ] и LaTeX [\u{A} \={\AE}] (если LaTeX команды нет — введёт символ Юникода) (RAlt + RShift + F1).
Поиск символов по «тегам». У большинства из символов локальной библиотеки есть два и более тегов, по сути, представляющих из себя варианты названий, которые можно вводить как полностью, так и частично, чтобы получить результат (прописная буква Еры глаголицы или гла еры → ⰟⰊ).
Внутренние раскладки клавиатуры, позволяющие использовать отличное от QWERTY/ЙЦУКЕН расположение привязок. Включает поддержку пользовательских раскладок в JSON‐формате.
Мини-режимы для ввода надстрочных/подстрочных символов цифрового ряда (LWin LAlt + ↑/↓), при этом CapsLock зеркалит вводимые символы (при активном надстрочном режиме — активация CapsLock заставит вводиться подстрочные, и наоборот).
Мини-режим для ввода римских цифр (отдельных символов Юникода) (LWin LAlt RShift + ↑): ⅠⅡⅢⅣⅤⅥⅦⅧⅨⅩⅪⅫ…
Возможность добавлять символы в избранное. Избранный символ будет выделяться в списке символом ★, а его рецепт (если он есть) будет всегда отображаться в подсказке режима композиции.
Поддержка модификаций. Возможно добавление, например, собственного «Альтернативного» или TELEX/VNI-подобного режима к уже существующим.
И другие, менее значимые возможности…
Подробнее об основных возможностях
Многослойные привязки, они же «Быстрые ключи»
Самое страшное. Их много, невероятно много, и опытный пианист, безусловно, справится с ними. Если верить .HotKeysCount()’у, то их более восьмисот. На каждой клавише может быть до 10–11-ти возможных комбинаций (если не считать комбинации с активным CapsLock за отдельные), но в среднем их около восьми (латинская I в этом чемпион: Ĭ Ï Ī Ĩ Î Ǐ Į İ Í Ì Ȉ).
Демонстрация
В случае необходимости их можно отключить/включить через RAlt + F1. Состояние сохраняется в файле настроек.
Инструмент создавался под полноразмерную клавиатуру — со стрелками, нампадом и т.д. Это может вызывать неудобства у пользователей других вариантов клавиатур, однако это можно сгладить через пользовательские привязки.
Некоторые комбинации были унаследованы от «Типографской раскладки»:
RAlt + Точка (/) — вводит многоточие [ … ],
RAlt + 1 | 7 — вводят перевёрнутые восклицательный и вопросительный знак [ ¡ ¿ ],
RAlt + 5 — вводит промилле [ ‰ ],
RAlt LAlt + 8 — вводит символ бесконечности [ ∞ ] (оригинальную комбинацию занял символ умножения [ × ], а потому для бесконечности в неё был добавлен левый Альт),
Комбинации, которые не будут отображены в интерфейсе:
Shift + 2, 3, 4, 6, 7 отзеркалены для языков на RShift, т.е. при английском LShift + 2 введёт [ @ ] (как обычно), а RShift + 2 — [ " ], на русском — наоборот.
2 (@"), 3 (#№), 4 ($;), 6 (^:), 7 (&?).
RShift *(LShift) + Х, Ъ введут скобки [] и {} соответственно.
Ещё есть «Вторичные» и «Третичные ключи», активируемые через RAlt LAlt + F1 и RAlt LAlt + F2. Это дополнительные привязки для символов, которые не влезли в основной пул, но им очень хотелось. Они пришли на замену са́мой первой, отбракованной «механике» инструмента — «Группам активации»: необходимо было нажать комбинацию для активации одной из «групп», а затем ввести символьный ключ желаемого знака.
Отключаются эти ключи повторным нажатием их комбинации, а состояние сохраняется в файле настроек.
Для создания привязок необходимо разместить <ФАЙЛ>.JSON в «DSLKeyPad\User\profile-<ПРОФИЛЬ>\CustomBindings\» со схожей структурой: (см. «Пример.jsonc» в Gist)
Примечание: кодировка файла должна быть UTF-8.
Пользовательские привязки поддерживают следующие форматы: (см. «Форматы.md» в Gist)
И следующие типы значений:
// Обычный текст
"@<ТЕКСТ>"
// Ссылка на запись в библиотеке
"<ИМЯ ЗАПИСИ>::<ВАРИАНТ>×<КОЛИЧЕСТВО>"
Подробнее о формате ссылки на запись см. в блоке о пользовательских рецептах.
Модификаторы: < и > указывают «левый» или «правый», ^, !, + — Ctrl, Alt, Shift. Для RAlt нужно использовать конструкцию <^>!.
После создания пресета его можно будет выбрать в окне настроек либо после перезапуска программы, либо после нажатия кнопки рядом с выпадающим списком в окне настроек.
Режим композиции
Вдохновлён клавишей Compose из Linux и WinCompose. Преобразует последовательность одних символов во что-то другое.
Активируется двойным нажатием RAlt. Ввод пользователя будет отображаться во всплывающей подсказке вместе с предложениями совпадений и списком рецептов избранных символов.
Демонстрация
Введение «композиции» дало больше простора для ввода. Клавиатура не резиновая и не может уместить бесконечное число привязок. Композиция же принимает любой ввод, в том числе и от «Быстрых ключей», что даёт большу́ю вариативность в рецептах и доступ к бо́льшему количеству символов напрямую с клавиатуры.
Режим композиции срабатывает на первое точное совпадение рецепта. Это и плюс и немного минус — такое поведение не позволит ввести, например, Ǣ из-за автоматического срабатывания AE → Æ. Для решения этой проблемы я ввела режим удержания (клавиша Pause), при котором композиция ждёт нажатия Enter или снятия с удержания.
Помимо режима удержания можно использовать «оператор» гравис [ ` ]. Он не отменяет автоматическое срабатывание, но сохраняет его результат в переменной активной композиции вместо отправки в окно приложения. Это позволяет продолжить последовательности, если есть рецепты, начинающиеся с полученного результата. Ǣ = A`E → Æ → Æ<МАКРОН>.
Общий перечень клавиш:
Enter — подтвердить ввод.
Escape — отменить режим композиции.
Backspace — стереть последний символ.
Insert — вставка содержимого буфера обмена.
Pause — переключение удержания.
Операторы
Гравис [ ` ] — описан выше.
(ЧИСЛО) — при начале ввода с такого оператора результат рецепта будет продублирован указанное число раз, «(5) TH» → «ÞÞÞÞÞ».
(~) — при начале ввода с такого оператора можно вводить целые слова, внутри которых будут обработаны рецепты, «(~) T<ЗАПЯТАЯ СНИЗУ>ara Roma<ЦИРКУМФЛЕКС>neasca<КРАТКА>» → «Țara Românească».
Режим композиции можно использовать для вставки символов по их кодам. Ввод начинается с U+/Ю+ или A+/А+, а после — значение. Можно указывать множество значений, разделяя их пробелом.
На альт-коды влияет язык активной раскладки: числа 128–255 и 0128–0255 используют страницы 850/Windows−1252 для английской раскладки, 866/Windows−1251 для русской, 737/Windows−1253 для греческой, Windows−1258 для вьетнмаской.
Альт-коды можно вводить в шестнадцатеричном формате: A+0B9 = A+0185 → № (Windows−1251). Для этого ввод должен содержать букву из диапазона A–F. Верхняя граница — A+FF (A+255).
Демонстрация альт-кодов
Демонстрация Юникода
Пользовательские рецепты
Как «вручную», так и через окно интерфейса можно создавать свои рецепты для композиции. Результат может быть сколько угодно объёмным многострочным текстом, но не рекомендую вставлять туда через чур большой текст.
Окно «Мои рецепты»
Окно создания и редактирования рецепта
При первом запуске создаётся несколько рецептов для демонстрации — шаблон HTML, иероглиф «義», тег <kbd> и эмодзи «».
Основной файл представлен в JSON‐формате, «DSLKeyPad\User\profile-<ПРОФИЛЬ>\CustomRecipes.json». Можно добавлять и дополнительные файлы рецептов в INI (UTF-16 LE) или JSON (UTF-8) форматах, размещая в директории «DSLKeyPad\User\profile-<ПРОФИЛЬ>\CustomRecipes\». Рецепты оттуда будут автоматически загружены при старте программы или при нажатии кнопки обновления в окне «Мои рецепты».
Поддерживается подгрузка последовательностей из файлов формата XCompose. Их небходимо помещать в директорию «DSLKeyPad\User\profile-<ПРОФИЛЬ>\XCompose\». Файл должен заканчиваться расширением «.XCompose»
Примечание: поддерживаются только простые последовательности XCompose, как, например, «<Multi_key> <g> <r> <i> <n> : ""» или «<Multi_key> <U1100> <U1100> : "ᄁ" U1101 # HANGUL CHOSEONG SSANGKIYEOK». При первом запуске в демонстрационных целях по указанному пути создаётся файл «demo.XCompose» с последовательностью «<Multi_key> <0> <0> : "∞"».
${<ИМЯ ЗАПИСИ>::<ВАРИАНТ>×<КОЛИЧЕСТВО>} — ссылка, обращающаяся к записи библиотеки, если та существует. Через «::» можно задать «вариацию» (${digit_1} → «1» | ${digit_1::superscript} → «¹»). В конце ссылки через символ «×» можно указать количество повторений вывода записи (${digit_1::superscript×10} → «¹¹¹¹¹¹¹¹¹¹»).
Одной ссылкой можно обратиться сразу к нескольким записям, помещая названия или их часть в \/ конструкцию, например: ${lat_c_let_\b,o,l,d/::bold} → 𝐁𝐎𝐋𝐃, ${\hel,lat/_c_let_a_alpha} → ΑⱭ, ${\nabla,delta,integral,square_root/} → ∇∆∫√.
Ссылки можно использовать и между пользовательскими рецептами для создания зависящих друг от друга рецептов, например:
[white_heart]
name=Белое сердце
recipe=бср|whr
result=
[white_heart_triple]
name=Три белых сердца
recipe=3бср|3whr
result=${white_heart×3} ; вставляет результат первого рецепта трижды
Для <Вариантов> существуют альтернативные формы записи для удобства/сокращения:
Bold — полужирный, п, b
Italic — курсив, ку, it
ItalicBold — курсив полужирный, куп, itb
Modifier — верхний индекс, ви, sup
Superscript — верхний индекс, ви, sup
Subscript — нижний индекс, ни, sub
Fraktur — фрактур, ф, f
FrakturBold — полужирный фрактур, пф, fb
Script — рукописный, р, s
ScriptBold — полужирный рукописный, пр, sb
DoubleStruck — ds
SansSerif — без засечек, бз, ss
SansSerifItalic — курсив без засечек, кубз, ssit
SansSerifItalicBold — курсив полужирный без засечек, купбз, ssitb
SansSerifBold — полужирный без засечек, пбз, ssb
Monospace — моноширинный, м, m
Fullwidth — полноширинный, пш, fw
SmallCapital — капитель, к, sc
SmallCapitalModifier — капитель-модификатор, км, scm
Small — маленькая, мал, sm
Combining — комбинируемый, ко, c
Uncombined — некомбинируемый, неко, uc
Для дополнительных файлов рецептов есть возможность добавлять несколько параметров для всех содержащихся в них рецептов (указываются вручную в начале файла):
[options]
; последовательность, устанавливаемая в начало всех рецептов в файле
prefix=<ПЕРФИКС>
; отключает добавление пробела после префикса
no_whitespace=1
; … рецепты
[
"options": {
"prefix": <"ПЕРФИКС">,
"no_whitespace": 1
},
// … рецепты
]
Если в файле есть двойные (и более) рецепты (например «лёд|ice»), для них можно задать и подобного вида префиксы (одинарные рецепты всегда берут первый из префиксов):
[options]
prefix=эмодзи|emoji
[recipe_name]
name=Лёд
; потребует ввода «эмодзи лёд» или «emoji ice»
recipe=лёд|ice
result=
PS. Не рекомендую использовать больше 1 500 пользовательских рецептов (что очень легко получить с XCompose-файлами). Сейчас такое может ощутимо замедлить инициализацию программы, но возможно у меня получится это оптимизировать.
XCompose рецепты
Альтернативный ввод
Селектор алтернативного ввода
Комбинация: LWin + LAlt + S (селектор)
По сути — просто наборы активируемых привязок для целого перечня форм письменности/алфавитов, в основном отличных от латиницы и кириллицы.
Примечание: наборы привязок используют клавиши латиницы и кириллицы, т.е смена «внутренней» раскладки влияет на них.
Некоторые формы письменности активируются парами — одна письменность работает на латинской раскладке, другая на кириллической. В остальном режимы одиночны, работают сразу на нескольких языковых раскладках, но предназначены именно для латинской (в особенности режимы с вводом слогов).
Эллинское письмо (оно же — греческое) — позволяет вводить как символы современного греческого алфавита, так и древнегреческие знаки с добавлением прочих различных символов, относящихся к нему, например: αάὰὰἀᾳᾱᾰἅἄἃἂἇἆ ΐ ϐϕϱϖϰϲϵ · ; ⸒ ⸏ ⸐ ⸑ ⸎ ⸔ ⸕ ⸓ ⸖ ʹ ͵ ₯
От стандартной греческой раскладки отличается типичным для английского расположением небуквенных символов и наличием коппы и дигаммы (Ϟ Ϝ) на месте Q W (; ς на греческой раскладке). Здесь знак ς вводится комбинацией LAlt Σ (S).
Положение привязок не изменяется при смене латинской/кириллической раскладки — для Эллинского письма введена собственная раскладка, однако изменить её нельзя (ну, льзя, просто не посчитала нужным добавить пункт выбора в GUI настроек).
Германские руны — позволяет вводить руны Старшего Футарка, Англосаксонского Футорка, Младшего Футарка, Средневековые руны, «Золотые числа» 17–19 Рунического альманаха (ᛮᛯᛰ), Руны с Ларца Фрэнкса и ещё три руны Толкина за компанию. Ну и значки пунктуации (᛫᛬᛭).
Глаголица — основывается на кириллической раскладке и позволяет вводить как простые буквы глаголицы, так и комбинируемые и соответствующую диакритику. Включается в пару с «Германскими рунами».
Полный охват для каждого режима не гарантирую, но при обнаружении новых или упущенных мной символов — режим будет дополнен.
Вариации глифов
Селектор вариации глифов
Комбинация: LWin + LAlt + A (селектор)
Имеет такой же селектор, как у «Альтернативного ввода», но вместо набора привязок указывает программе, какой вариант символа нужно использовать. У записей библиотеки есть атрибут, в котором прописаны варианты — полужирный, курсивный, капитель и т.д. Такие символы не представлены отдельными записями, являясь лишь свойством. Это делает «Вариации глифов» легко совместимыми с фичами, полагающимися на создание привязок.
Если в записи символа отсутствует указанный вариант — будет послан «обычный» символ.
В главной панели под предпросмотром символа будут отображаться первые восемь из доступных вариантов, а справа от предпросмотра активируется кнопка, открывающая GUI для просмотра всех вариантов (которое так же можно открыть через меню трея → Вариации глифов → Панель вариации глифов):
GUI промосмотра вариантов
TELEX/VNI-подобный ввод
Режимы, основанные на вьетнамских TELEX и VNI раскладках для облегчения ввода, собственно, вьетнамского (с добавлением букв джарайского алфавита) и пиньиня.
Для ввода букв с диакритикой необходимо вводить последовательность символов, например: AWS → Ắ (A → Ă → Ắ), A5 → Ẫ, DD→ Đ, BB → Ƀ, UONGW → ƯƠNG, UONG5 → ƯỠNG. Для отмены слипания последовательности можно использовать \, A\W → AW вместо Ă или повторно ввести последний символ (AW → ĂW → AW). Последнюю введённую диакритику можно отменить вводом Z (ǕZ → ÜZ → U).
Можно менять диакритику уже введённого символа, если не перемещать каретку: ẰS → Ắ, ẮA → Ấ, ẤJ → Ậ, ẬR → Ẩ…
Демонстрация
Перечень символов режимов
Tiếng Việt: Á À Ả Ã Ạ Â Ấ Ầ Ẩ Ẫ Ậ Ă Ắ Ằ Ẳ Ẵ Ặ É È Ẻ Ẽ Ẹ Ê Ế Ề Ể Ễ Ệ Í Ì Ỉ Ĩ Ị Ó Ò Ỏ Õ Ọ Ô Ố Ồ Ổ Ỗ Ộ Ơ Ớ Ờ Ở Ỡ Ợ Ú Ù Ủ Ũ Ụ Ư Ứ Ừ Ử Ữ Ự Đ
Jơrai: Ĕ Ě Ĭ Ŏ Ǒ Ö Ŭ Ü Ƀ Č Ñ
Hànyǔ Pīnyīn: Ā Á À Ǎ Ē É È Ě Ī Í Ì Ǐ Ō Ó Ò Ǒ Ū Ú Ù Ǔ Ü Ǖ Ǘ Ǜ Ǚ
Нюансы
Работает, не так хорошо, как настоящая вьетнамская языковая раскладка — не учитывает контекст поля ввода и перемещение каретки в нём. Для получения контекста необходимо (если не ошибаюсь) лезть в процесс активного окна, и я решила не рисковать — те же античиты в играх такое не оценят, особенно со стороны автохоткея. Было бы не очень, слови пользователь моей программы бан за такое (или я же сама).
Если по какой-то причине «локальный» контекст (видимый во всплывающей подсказке) не совпадает с контекстом поля ввода — его можно сбросить нажатием RCtrl. Так же локальный контекст сбрасывают Enter, Esc, Home, Page Up/Down, Del, клавиши стрелок, ввод пробельных символов.
Ещё один нюанс — не во всех приложениях оно будет работать как задумано из-за отсутствия механизмов IME. Например, в VS Code попытка ввести Ắ приведёт к разными результатам: ĂẮ, AẮ, Ắ, AĂẮ.
В общем, есть что дорабатывать. Если автохоткей позволит (безопасно) использовать средства IME или нечто подобное — эти режимы ждёт видимое улучшение. Я, конечно, спрашивала нейросети про это, но ни одного маломальски рабочего решения они не предложили.
Поиск
Окно ввода для поиска
Комбинация: LWin + LAlt + F
Как уже упоминалось — у каждого символа есть набор «тегов», и они могут быть весьма длинными. Например, «строчная буква омега с псили, периспомени и ипогеграммени эллиницы» даст символ «ᾦ».
Вводить полный тег не обязательно — «омег пс пе ип» даст тот же «ᾦ». Однако чем короче запрос, тем менее точный будет результат. Через запятую можно вводить множество запросов:
«дез ди, !дез ди, lamb, !lamb» → «𐐔𐐼Λλ»
«ref, obe, psms, msps» → «※÷±∓»
Вместо тега можно ввести имя записи, например «hel_c_let_l_lambda» → «Λ».
Можно использовать регулярные выражения, например:
«fut.*?\s+\S+al» (ищем тег с любыми символами и пробелами между fut и al) → «ᚺ» (руна Хагалаз), полный тег: «germanic rune elder futhark Hagalaz».
«az$» (ищем тег с az в конце) → «ᛞ» (руна Манназ), полный тег: «germanic rune elder futhark Mannaz».
«^фра» (ищем тег с фра в начале) → «₣» (Франк).
Поддерживается и указание вариации глифа, добавляя ::<ВАРИАНТ> в конец запроса:
%globalInstances.crafter.Start("Compose")% — аналогично RAlt×2 активирует режим композиции…
/KbdBinder.Init — ре-инициализирует раскладки и привязки.
Внутренние раскладки клавиатуры
Возможно они могли бы показаться лишними, но они необходимы — привязки прибиваются гвоздями к скан-кодам клавиш (что я посчитала более надёжным, чем к «абстракции» в виде буквы/названия клавиши). Из-за этого переключение системной раскладки не изменит положение привязок программы. Однако в настройках можно выбрать соответствующие внутренние раскладки и тогда привязки будут на корректных местах для отличных от QWERTY/ЙЦУКЕН раскладок.
Для латиницы доступны следующие раскладки: QWERTY, Colemak, Dvorak. Для кириллицы: ЙЦУКЕН, ЙІУКЕН (1907), Диктор. Раскладки могут отличаться от своего оригинала.
Диктор:
Для ввода «Ъ» необходимо зажать левый Альт и нажать на «Ь». При этом «Быстрые ключи», назначенные на «Ъ» переходят к «Ь» с добавлением левого Альта в комбинацию (было RAlt *(LShift) + Ъ → ҮҰ, стало RAlt + LAlt *(LShift) + Ь → ҮҰ).
Цифровой ряд от ЙЦУКЕН.
ИІУКЕН:
*Добавлена скорее ради забавы.
Ввод «-_— –» и «=+≠≈±» перенесён на клавиши «Ъ» и «\» по ЙЦУКЕН.
Цифровой ряд от ЙЦУКЕН, за исключением «-» и «=».
Если в программе нет подходящей раскладки — её можно создать самому через <ФАЙЛ>.JSON разметку в «DSLKeyPad\User\profile-<ПРОФИЛЬ>\CustomLayouts\» со следующей структурой: примеры на GitHub Gist.
Модификации
В директории «DSLKeyPad\Mods\» можно размещать сторонние AHK-файлы в качестве «модов» к программе. С помощью модификаций можно значительно кастомизировать программу, например, добавив хоть сотню новых режимов «Альтернативного ввода» или вообще ввести новую, самостоятельную фичу.
Для создания мода необходимо создать папку со следующей базовой структурой:
Mods/
└── <ИМЯ МОДА>/
├── index.ahk
├── options.ini
└── preview.(ico|jpg|png) (необязательный файл)
Файл index.ahk будет содержать логику мода и к нему можно подключать другие AHK-файлы через #Include (ничем не отличается от независимого AHK-скрипта).
Тип загрузки может быть pre_init (для загрузки до основной инициализации) или post_init (для загрузки после неё).
Моды автоматически подхватываются. После добавления нового мода следует подождать 5 секунд перед перезапуском программы.
Переключать моды можно через GUI: Меню трея → Модификации.
PS. если необходимо получить путь до папки вашего мода — он автоматически сохраняются в mods[«<ИМЯ МОДА>»].
PSS. моды — не изолированные друг от скрипты, т.е. возможен конфликт в именах переменных, классов.
Окно Модификаций
Главная панель
Скриншот окна
Комбинация: LWin + LAlt + Home (или через контекстное меню иконки в трее).
Содержит списки записей символов, их рецепты и комбинации ввода. Также имеется вкладка «Помощь» с поясняющей информацией.
Окно настроек
Скриншот окна
Комбинация: RCtrl + F9 (или через контекстное меню иконки в трее).
Контекстное меню трея
Скриншот окна
Ограничения и нюансы
Инструмент всё ещё находится в стадии разработки, но уже может быть полноценно использован.
Антиничиты в играх могут триггериться от использования автохоткея, так как немало людей создают на автохоткее разного рода макросы. Перед заходом в любую многопользовательскую игру лучше закрывать все процессы автохоткея.
Потребляет ~140–180 МБ ОЗУ (без учёта модов и пользовательских рецептов). По возможности буду пытаться оптимизировать использование памяти.
Программа плохо совместима с быстрой печатью. Если вам необходима высокая скорость ввода символов — это не тот инструмент, лучше использовать раскладки для отдельных языков.
Программа ограничена работой на английских и русских раскладках. При обнаружении другого языка клавиатуры (например, японский) — все привязки автоматически приостановятся, так как будут мешать этому языку (в примере с японским — невозможность использовать катакану при зажатии LShift). При возврате на английский/русский — автоматически восстановятся.
Не все привязки могут работать на той или иной мембранной клавиатуре. Полноценно проверить работоспособность привязок на механической клавиатуре не удалось (по причине её полурабочего состояния), но она помогла понять, что некоторые привязки не работают из-за основной, мембранной, клавиатуры, а не косяка в коде.
Не во всех приложениях комбинации будут работать или работать стабильно. Например, в Adobe Illustrator что-то вводит символ, что-то нет, а что-то вводит, но он не появляется, пока не нажмёшь на клавишу стрелки.
Из планов на будущее
Продолжать улучшать программу, её логику и возможно вводить какие-то новые фичи.
Сделать страницу с документацией, включающей и гайд для создания модификаций.
Расширить возможности модификаций.
Расширение «Легенд», но своими силами вряд ли получится — это требует лингвистических познаний, коими я не обладаю в достаточной мере.
Расширение библиотеки символов (пропущенными или по мере их ввода в Юникод). Возможно и расширение режимов альтернативного ввода.
Есть мысли перевести интерфейс на веб-рельсы при помощи соответствующей либы и DLL’ки, но это пока имеет низкий приоритет, пусть и результат будет явно симпотичнее, чем с деревянностью местного GUI.
PS. Благодарю дочитавших. Надеюсь, что мой инструмент кого-то заинтересует и окажется полезным.
UPD:
15 августа Вышла версия 0.1.4.3 α: • Теперь символов 4900+ • Добавлены режимы для Агванского, Пальмирского и Парфянского письма • Добавлено 16 раскладок для латиницы и 1 для кирилилцы • Различные фиксы и улучшения
Я всё ещё продолжаю писать программу под Windows — самую лучшую замену стандартной Таблице символов и одновременно небольшую энциклопедию. Качать тут.
И вот что пока вышло.
Инсталлятор
Даже не знаю, что поставить картинкой. Теперь простому юзеру будет сподручнее устанавливать и обновлять прогу. Единственный недостаток — программа всё ещё не подписана.
Программа, как и раньше, не требует инсталляции, и 7z-архив никуда не делся.
Альфа-версия Юникода 17
Выйдет осенью 2025, и будут:
эмодзи: косатка, огрызок, раздутый колобок, обвал, облако драки, снежный человек, танцор балета, тромбон, сундук с сокровищами, многорасовые девушки Плейбоя и борцы
5 новых письменностей: три действующих, одна мёртвая, одна историческая
около 20 знаков астероидов из астрономии XIX века
фигуры «алфил» и «фарзин» из прото-шахмат, чтобы не путать с современными дальнобойными слоном и ферзём
В версии 2.11 закрыто всё, что я в принципе мог закрыть, на этом моя компетенция всё. Остались умляуты шарады, лигатуры арабского и ККЯ.
Эмодзи Юникода 17
Для этого, кстати, мне пришлось придумать новый метод перекраски многорасовых эмодзи.
Символы разные дополнительные
Сидетский (из турецкого города Сиде)
Египетские иероглифы Юникода 16
С ними всё одновременно просто и сложно: нашёл способ полуавтоматически собрать шрифт из программы JSesh. 2900 есть, 1100 не хватает, и потому могу с уверенностью сказать: у меня самый исчерпывающий на данный момент свободный египетский шрифт! (Один полукоммерческий уже есть, но для свободной программы это не выход.)
Египетские иероглифы из JSesh
Иконки блоков
В Юникоде есть собственный шрифт под названием LastResort — шрифт последей надежды, который всеми правдами и неправдами формата TrueType каждому символу Юникода, существующему и будущему, даёт изображение.
Маленький кусочек LastResort
Те же иконки блоков, только в профиль.
Бывали случаи, когда я удивлялся, как мы с LastResort, не кооперируясь, взяли один и тот же символ.
Неслучайная случайность
С другой стороны, иногда я признавал, что выбор LastResort лучше, и даже частично формализовал принципы выбора иконки.
Сказал носитель языка. Отменяется только серьёзными возражениями. Пример: хирагана あ.
Стандартный символ: А в греческом семействе, ℵ (алеф) в арамейском, К в брахмийском. Отменяется слишком простым, сложным или неопределяющим символом — крестикам, чёрточкам и безликой латыни на иконках не место.
Другой принцип греческого семейства: особый символ, которого нет больше нигде. Примеры: кириллица Я, карийский 𐋆.
Символ, показывающий особенности написания. Пример: Пагба-ламы ꡐ.
Банальная возможность нарисовать на иконке 16×16.
Не заставляйте меня рисовать на иконке эту загогулину!
В сестринских письменностях — один общий символ на весь набор.
Первая буква самоназвания. Пример: ваи ꕙ.
Пасхальное яйцо. Пример: кáннада ಠ.
Кроме того, новые алгоритмы масштабирования иконок под HiDPI — итого переделано более 40 штук.
Есть и другие алгоритмы, но эти два основные
Нет, я не всегда шёл на поводу у LastResort, а наоборот, активно с ним спорил.
Эти иконки я не заменю!
Латиница: есть отличная специфичная буква. Изображения управляющих: ради какого символа обычно идут в этот блок? Дальше продолжать?
Японский
Объявился японец и перевёл Юникодию на свои иероглифы. Я ему активно помогал, и даже дописывал принципы локализации, чтобы работал язык, далёкий от западного.
Юникодия по-японски
Готовил к китайскому, но уже в начале работы китаец исчез, зато объявился кто-то близкий — несчастный случай, работа сворачивается.
Локальные меню
Нажать ПКМ, Sh+F10, или одноимённую клавишу W95
Локальные меню — не лучший способ управлять прогой (раскрываемость ниже плинтуса), но если пользователь методом псевдонаучного тыка раскроет — и понятно, и закон Фиттса радуется. Пусть будет.
Cambria
Стандартный шрифт для латиницы и кириллицы я люблю и ненавижу: он достаточно лёгкий, для мелких символов типа дробей и индексов хорошо выставлены вес и положение, отличная математика, неплохо сочетается с Noto, но каждый символ надо проверять. Вот пример:
Дизайнер — лентяй!
Так замену ему и не нашёл. Не хочу обычный Таймс (например, BabelStone Roman).
Что остаётся? Закрытый список символов, которые вообще могут отображаться Кембрией. Для латиницы правило таково: блок C или версия до 5.0, и не Алфавитные формы, и не вот такие глючки. Любой другой символ, который когда-нибудь войдёт в Cambria, будет отброшен.
Техническое
Тридцать мелких шрифтов объединил в один большой «франкеншрифт» — это должно снизить вероятность глючка, когда какой-то шрифт не подгружается. (Хотя такие глюки стали совсем редкими — народ сообщал, но я не видел на своих трёх компах ни разу.)
OpenSSL 1.1 брошен, но кто-то продолжает неофициально исправлять уязвимости. А я подбираю и компилирую.
Облако драки — драка, спор, несогласие, дискуссия, борьба
Балерина — я так и не понял, для чего они её хотят (она бесполая), но, полагаю, как бесполая версия танцора (женщина 💃 танцует латиноамериканские, а мужчина 🕺 диско)
Снежный человек (бигфут, сасквач, йети) — бродить, неизвестно где
Тромбон — помимо джаза, есть знаменитый джингл «грустный тромбон»
Обвал — ещё одно природное бедствие. А если иносказательно — когда что-то в душе рушится
Сундук с сокровищами — приз, награда, богатство
Также сделали многорасовыми эмодзи «девушки Плейбоя» и «борцы». Больше не останется эмодзи, где есть много людей без расы. Как обычно, сделано это через ZWJ-последовательность «человек1 + раса1 + ZWJ + что-то + ZWJ + человек2 + раса2». Для девушек Плейбоя это «что-то» — заяц 🐰, для борцов — то самое облако драки.
Возможно (пока не знаю), что балетные тапочки из бежевых сделают чёрными. Это ещё один шаг к лишению эмодзи пола и расы.
Китайские иероглифы
Дело в том, что в конце 2022 китайское правительство решило ответвиться от Юникода и выпустить отраслевой стандарт, где около 800 иероглифов из китайских имён без надлежащей проверки были закинуты в неиспользуемую плоскость A. Это стало форменным плевком в лицо Консорциума: закинули бы в пользовательскую E или F — никто бы и слова не сказал!
Проверка шла с большим скрипом, к выпуску едва уложились (обычно ничего не меняется уже за 8 месяцев, а если символ отправят на доработку — остаётся дыра). К тому же умер главный иероглифист Консорциума.
И вот мартышкин труд закончен, знамя умершего подхвачено, но от выпуска 15.1 до фиксации Юникода 16 было всего четыре месяца. Так что 5000 символов войдут в Юникод 17.
Другие символы для полудиезов/полубемолей (±четверть тона)
Из программы «Сибелиус»
Юникодные ноты появились в 2001 году. А музыкальное ПО за более чем 20 лет выбрало другие изображения полудиезов и полубемолей. Собрали все существующие стандарты и закинули скопом.
Шахматные фигуры «алфил» и «фарзин»
Изображения алфила и фарзина в разных шрифтах
В прото-шахматах cлон и ферзь были малоподвижными фигурами: ферзь ходил на одну клетку по диагонали, а слон — на две, перепрыгивая через фигуры.
Чтобы не путать их с современными дальнобойными слоном и ферзём, для них сделали отдельные изображения.
И тут в 2024 приходят символы со старых компьютеров и делают прямо противоположное: эмодзи иногда становятся текстовыми. Некоторые из тех компов вообще не имели графики, игровые спрайты выводились текстом.
Эмодзи, работающие на символе FE0F — глаз 👁️, домики 🏘️ — разунифицировать не стали.
Сидетский
Надпись на восточных воротах Сида
Тип: алфавит, ←
Язык: сидетский (около начала нашей эры, совр. Турция)
Состояние: исторический, частично расшифрован
Сидетский — современное название языка (самоназвание неизвестно), потому что использовался в районе города Сид. Известно всего 13 надписей. Поскольку часть символов спорные, символы названы по каталожным номерам.
Толонг-сики
Детская книжка в двух письменностях: толонг-сики и деванáгари
Тип: алфавит, →, действующий
Язык: курух (Индия, дравидийская семья, 2,3 млн)
Состояние: изобретён в 1999 и набирает публику
Я тут смотрю на новые алфавиты Индии и удивляюсь: значительно менее ёмки, чем, например, деванáгари, сделаны коряво, но набирают сторонников? А потом: посмотри на свою собственную кириллицу! Разница только в том, что над кириллицей работали поколения типографов, и она перестала быть корявой — а толонг даже лучше кириллицы приспособлен под беглое письмо.
А также удивляюсь, как в Индии встречаются неписьменные языки с миллионом говорящих.
Чжурчжэньские иероглифы
Перевод закона с китайского на чжурчжэнский
Тип: иероглифы, ←↓↓ по столбцам, исторические
Язык: чжурчжэньский, предок маньчжурского
Состояние: действовал 1100 –1300, язык никогда не заговорит, но благодаря любви китайцев к документированию всего и вся про него известно очень много
Письмо использовалось в первую очередь для связи чжурчжэней с китайским двором. Как правило, иероглифические надписи имеют китайский порядок слов, а не маньчжурский.
Состояние: изобретён около 1950, реформирован в 2021
Раз загава — кочевники-скотоводы, то письменность сделана из… клейм для верблюдов. Видимо, если верблюдом владеет условный Пумба, пусть это будет буква П.
Лорна Эванс из SIL International, которая много раз прикладывала руку к подобным мелким языкам, участвовала в реформе письменности и сделала вот такой красивый открытый шрифт.
Интересная фишка — большие буквы не поднимаются ввысь, а опускаются ниже строки.
Я пишу программу «Юникодия» — самую исчерпывающую таблицу символов Юникода. Качать тут.
Я продолжаю писать программу под Windows — самую лучшую замену стандартной Таблице символов и одновременно небольшую энциклопедию. Качать тут.
Ещё один эмодзик Юникода 16
В сентябре вышел новый Юникод, а значит, новый отчёт.
Главное изменение — это…
Шрифты!
Алфавит Тодри (алфавит для албанского, экспериментальный, до 1800) — нарисовал сам
Кхема (абугида для языка гурунг, Непал, действующая) — нарисовал сам
Ол-онал (алфавит для языка бхумидж, Индия, действующий) — нарисовал сам. Все три рабочие, то есть не коллекция глифов, а годный для печати шрифт!
Псевдографика со старых компьютеров — тот же Эндрю Уэст, что рисовал китайские иероглифы
Совершенно упоротое албанское письмо
Вполне годная абугида
Письменность, ставшая упоротой без вины автора
А теперь загадка (чур, в справочники не смотреть!) В средние века латиница претерпела одно важное изменение. Ол-онал претерпел обратное — можете догадаться, какое?
Небольшой совет: готовишь шрифт для непечатной письменности — ориентируйся на рукописные образцы. А лучше на каллиграфические. Компьютерные шрифты и основанные на них вывески, как правило, полный ужас. Вот моя мотивация по дизайну ол-онала.
Обратный контраст (горизонтальные штрихи шире) и перо бэкслэшом \ довольно распространены в каллиграфии Юго-Восточной Азии, но непривычны для латиницы и кириллицы, пока не появились шахид-маршрутки 🚐😎 (на самом деле раньше, гуглите «брусковый шрифт»).
Двуязычный район пишет одну вывеску несколькими языками. Деванáгари ёмче ол-онала, отсюда буквы ýже, чем в большинстве печатных шрифтов.
Где можно, я использовал элементы эстетики Noto, примерно понимая, как пойдёт перо: полукруглую законцовку я чаще применял в начале штриха, чем в конце.
Главный (но не единственный) источник вдохновения
Остались 4100 символов в двух блоках: египетские иероглифы и старый тулу (религиозная абугида для языка тулу).
Нашёл примерно 2900 иероглифов, но с массовым импортом начались технические проблемы, а чтобы их решить, нужна хорошая математика. Может, лучше ждать рабочего шрифта, чем мучиться с неполной коллекцией? Старый тулу — действующий шрифт сделать сложно, а коллекцию глифов — а стоит?
Эмодзи
Ценное изменение Юникода 16: объединены категории «Морские животные» и «Морепродукты». Деление съедобное/несъедобное очень шатко и, скажем, рыба-ёж 🐡 может означать фугу, экстремальное японское кушанье. Жареная креветка 🍤 находится в «Восточной кухне» и никуда не убежала.
Теперь всё скопом
Очень спорное изменение Юникода 15.1: сделаны пять бесполых силуэтных семей, а остальные рекомендовано убрать с «клавиатур» и забить силуэтами, чтобы радикально избавиться от комбинаторного взрыва. Оказалось, весной за Гуглом последовал Эпл — изменение прижилось!
Одна из силуэтных семей
Ну и наконец — Гугл обновил эмодзи! Помните, я сетовал на низкий контраст новых широкоугольных рук? Гугл услышал!
Эмодзи Гугла: подняли контраст
Художник пользовался такой вот методикой расстановки теней: создал группу объектов и обрезал по контуру. Эта самая обрезка не поддерживается доступным SVG-движком, так что полдня потратил на ручную переделку эмодзиков. А межрасовые рукопожатия тупо автоматически перекрасил, забив на автотестирование, как оно будет работать и есть ли разница. (Однорасовые рукопожатия не перекрашиваются, а хранятся — автотестирование бьёт тревогу, а я не понимаю, где косяк.)
Ещё одно необычное изменение эмодзи, связанное с инклюзивностью: пластырь из телесного стал белым.
Теперь белый, из-за инклюзивности
О балетных тапочках идут споры (они обычно бежевые), а пластырь хотя бы бывает белый.
Старые компьютеры
Ребекка Бетанкур, которая сейчас заведует Реестром искусственных письменностей, притащила много информации по старым компьютерам. Закинуть её в Юникодию автоматически — милое дело. До этого информация была перенесена вручную, с одной ошибкой, существовавшей в заявке 2021.
Кроме того, я написал несколько строк по каждому из старых компьютеров, например:
Описание ZX Spectrum
Да, добавил три компьютера, поддерживавшихся изначально (с 1.0): Spectrum, Мак и IBM.
Залез во внутреннюю структуру TTF-шрифта
Я и раньше в неё залезал, чтобы переименовать шрифт и имя не совпало ни с одним из системных (был такой глюк). Теперь залез глубже, с двумя целями:
определить, какие символы поддерживаются шрифтом (очень редко заглючивало и именно этот вопрос решало неверно);
расхинтовать символ «пунктирный кружок» (то есть лишить пиксельного выравнивания), чтобы не было вот такого.
Старая версия, 1.5×. Кружок в Noto выровнен, в моём шрифте нет
Ковыряние в формате TTF, возможно, уберёт парочку шрифтов-исправлений (деванагари, монгольский) — но уже задача 1 с поиском поддерживаемых символов сильно снижает шрифтовые глюки. А стоит?
Перенёс часть информации о языках в EXE-файл
Это уменьшило локализацию всего на 1 килобайт. Но очень сильно упростит перевод и обновление данных, позволит комментировать, откуда взялись цифры.
Не допускаю военного жаргона, ни на каком языке!
А вот так оно выглядит в программе
Комментарий по украинскому в коде. Сам я чистый L2 (изучивший).
Да, я начинаю с Википедии, но надо смотреть, что за источник и насколько надо огрублять его данные. Допустим, для монского (Мьянма) я указал: до 1 млн, это самая крупная оценка (UNSD 2012).
В 2022, с первой английской локализацией, я подобное сделал с информацией о датировке письменности.
Напоминаю загадку (чур, в справочники не смотреть!) В средние века латиница претерпела одно важное изменение. Письменность ол-онал претерпела обратное — можете догадаться, какое?
Спасибо за внимание!
Ответ на загадку:письменность ол-онал потеряла строчные буквы. Видите, что каждая буква обведена кружочком? Это нередко для заглавных, но строчные для простоты и разборчивости делают лаконичнее.
Напоминаю: я пишу программу под Windows — энциклопедию символов и самую лучшую замену стандартной Таблице символов. Качать тут. Выглядит примерно так.
Рандомный скриншот с новым эмодзиком
Что за это время изменилось…
Добавлена бета-версия Юникода 16
Новых блоков много, и я лишь скажу, где закрыл тофу.
Гарай: экспериментальная для языков волофал и мандинка (Сенегал), 1961 — нашёл корявый шрифт, закодированный в латиницу, и перевёл в Юникод
Сунвар: новая для языка сунвар (Непал), 1941 — нашёл корявый юникодный шрифт
Кират: новая для языка бантава (Индия, Непал), 1920 — нашёл отличный юникодный шрифт
8 новых эмодзи
Всякая мелочь вроде латиницы, кириллицы и стрелок
Гарай — необычный африканский алфавит
Заодно начал использовать не XML-базу Юникода, а текстовую: Консорциум рассматривал даже отказ от XML, но нашлось кому поддерживать, и всё равно вышла только в мае. Текстовая сложнее в разборе, зато быстрее, компактнее, больше информации, лучше совместима с системой управления версиями.
Семь новых эмодзиков, рисовал сам (восьмой — о. Сарк, новый код страны CQ)
Раньше было: куда ни ткни, попадёшь в китайский иероглиф — потому ККЯ сворачиваются. После того, как добавили 4000 египетских иероглифов, появилось то же чувство.
Свёрнутые иероглифы
Новая функциональность
Символ + эмодзи
И пешка-эмодзи, и пешка-символ
Простите, что сделано очень непоследовательно, но чтобы выяснить, делать ли, я отвечал на три вопроса.
Что по умолчанию: текст или эмодзи? В таком виде отображаются только VS16-эмодзи. Потому отпадают знаки зодиака, у которых первичен именно эмодзи.
Насколько важна текстовая версия? Отпадает компьютерная периферия: почти не бывает в текстовом виде. А пешка — часто встречается в шахматной нотации.
Насколько оно красиво на этой библиотеке эмодзи? Вы знаете, я много ругался на неконтрастную библиотеку Гугла, и именно из-за контраста отпадают череп и кости.
Ещё одно трудоёмкое и малозаметное, но важное изменение. Шрифты Гугла всеобъемлющие и потому у них габариты с запасом — а значит, раздвигали окошко «Образец». Теперь на очень многих письменностях не раздвигает.
Запросы
Рядом с некоторыми заголовками видна маленькая синяя лупа.
Маленькая синяя лупа…
При нажатии на эту лупу выводятся… как вы понимаете, все управляющие символы.
…и что она делает
Поскольку синтезированные иконки вроде L и ä после этого изменения отображаются часто, навёл небольшой порядок в них.
Ускорено передвижение по таблице в куче тофу
Рандомная куча тофу из ожидаемого Юникода 16
Юникод выходит в сентябре: повелось с КОВИДа и оказалось удачным. Примерно к Новому году что-то я сам затыкаю, что-то рисуют профессионалы, тормоза перестают быть проблемой, и я забываю о них — в мирное время до сентября-октября (выпуск Юникода + первый крупный шрифт), в военное до апреля-мая (бета-версия Юникода).
Я знал, кто источник замедления (поиск по всем доступным системным шрифтам), но как это правильно запрограммировать? Наконец придумал.
Улучшено отображение всплывающего окошка
То самое злосчастное окошко
Оказывается, если регулировать размер окна штатной автоматикой, предел по ширине и высоте ⅔ экрана. Но библиотека глючит и размер часто вылезает за этот предел — так что я просто спутал баг и фичу. Заглянул в документацию, увидел этот предел и начал писать, тестируя на барахольном ноуте FullHD 14″.
Решается, как и полагается Qt — залезаешь в исходники, копируешь кусок автоматики и переписываешь под свои нужды. Вот такая нехорошая архитектура.
Подтягиваются шрифты
Профессионалы нарисовали новый блок деванáгари.
Новый деванагари из U15
В таблице и в заметках требования к шрифту чуть разные: шрифт из таблицы должен поддерживать максимум символов, заметке нужен базовый набор, какая-то функциональность и качественный хинтинг (подгонка под пиксели). Деванáгари — это же главная брахмийская письменность и используется в пяти заметках, но Noto Devanagari плохо отхинтован. Раньше я использовал для заметок какой попало системный шрифт, но неявно полагал, что «какой попало» — это Arial Unicode MS из Microsoft Office. Теперь явно прописана цепочка из трёх шрифтов, и какой-то точно найдётся в W7, 10 или 11. Не лучший вариант (рано или поздно выйдет W12), но пусть поживёт так.
Да, W7 всё ещё поддерживается и иногда ей помогаю, и старые гарантии — без тофу базовая плоскость и три важных письменности — всё ещё выполняются, но тестирование под неё эпизодическое и теперь обещаю только запуск.
Коптский перекочевал в UnicodiaFunky и приобрёл кучу новой функциональности. Для Юникодии не важно, для коптского языка — важно.
Рандомная коптская буква
Начал писать про макасарский и выяснил, что вся функциональность шрифта написана на нестандартной системе Graphite и он в Юникодии совсем не работает. Сначала поступил как в коптском (перенёс глифы и написал функциональность), но потом и нарисовал более чистые глифы, оставив общий стиль тем же — стилем дневника тамошнего принца.
Дневник макасарского принца
Слева — мой шрифт, справа — образцовый юникодный
Функциональность моего шрифта
Что думаю сделать дальше?
Поиск по эмодзи. Эта функция требует большого исследования, и не знаю, когда будет.
Нарисовать какую-то из новых письменностей. Пока склоняюсь к албанскому Тодри.
Алфавит Тодри. Иногда его называют эльбасанским, но не путать с давно существующим в Юникоде!