Энциклопедия символов «Юникодия» v0.2: дневник разработки
Напоминаю: я пишу программу для Windows — энциклопедию символов и замену стандартной Таблице символов. Качать тут.
Выглядит примерно так.
Меня месяц не было. И за это время я добавил четыре письменности: соёмбо, анатолийские иероглифы, мру и кое-что ещё. Почему так мало и что четвёртое — об этом позже.
Народ просил HTML-мнемоники. Я разобрался, как выдрать данные с сайта W3C, и вот оно перед вами.
Обратите внимание, всё в каких-то серых ссылках. Действуют они просто: щелчок — копирование в буфер.
Также нажатие кнопки-стрелки → перенесёт курсор на следующую строку. Очень удобно, когда пробегаемся по неизвестной письменности, чтобы найти нужный символ.
Узнаёте зелёный символ? Он самый, беременный мужчина, главный смайлик этого сентября. В общем, встречайте Юникод 14!
В моей эмблеме есть пасхальное яйцо. Думал: заподозрит какой-нибудь японист или нет — оно осталось незамеченным.
• Розовый кубик — ККЯ, катакана Ю. (Хирагана красивее, но посчитал её неуместной, ведь она для чисто японских слов.)
• Зелёный — Тихий/Индийский океан, лонтара НИ. Это не один символ, но два, буква «на» с огласовкой.
• Коричневый — Африка, эфиопский КО.
• Красный — Америка, чероки ДИ.
• Синий — Европа, кириллический малый юс. Изначально был каким-то носовым звуком, но в поздней кириллице трансформировался в Я.
И подобных пасхальных яиц у меня немало. Скажем, иконка блока «Кириллица дополнительная» — буква ПЦ, а иконка алхимических символов — аква-вита, водно-спиртовая смесь.
Кто был на моём Гитхабе, те знают моё обещание: Юникод 14 я прописываю, когда хоть одну новую письменность реализуют шрифтом. Одна есть — виткутький алфавит.
Известны как минимум четыре местечковых алфавита XVIII–XIX века для записи албанского. Из них в Юникоде два — эльбасанский и виткутьский. Причин такого «зоопарка» две: конспирация от турок (Албания получила независимость в 1912 с распадом Турции) и желание албанских просвещённых умов иметь свой алфавит (просто посмотрите, что вокруг: Болгария с кириллицей, Греция со своим алфавитом…)
Я и своими силами закрыл несколько дырок Юникода 14 — в прошлой версии 1949 не-ККЯ тофу (так называют квадратики, когда в шрифте нет нужного символа), в этой 1878. Например, из строчной буквы «с» я как-то сделал киргизский сом.
(Простите, что «Стиль ОС» показывает российский рубль — в шрифте PT Sans рублём забили весь блок валютных символов, рассчитывая, что где-то рубль всё-таки поставят.)
Также из новых символов профессионалы сделали почти все ККЯ, треть арабского, эфиопскую и канадскую слоговую.
Строка ввода в верхнем правом углу перестала быть засеренной, и неспроста — появился минимальный поиск!
Пока есть четыре способа поиска: по шестнадцатеричному коду, по HTML-мнемонике, по ключевым словам и разбор на символы.
Разбор — очень интересная функция. Введём в строку поиска эмодзи «рыжий мужчина»…
…и видим, что оно состоит из трёх символов: мужчины, ZWJ и рыжих волос. Никакой подсказки по поиску нет, мне ещё придётся думать, как её сделать.
Я ещё много сделал по мелочам, но, думаю, пора закругляться. Спасибо за внимание!

















