10

Энциклопедия символов «Юникодия»: версия 3.0!

Я всё ещё продолжаю писать открытую энциклопедию Юникода и замену стандартной Таблице символов. Качать тут.

Скриншот

Скриншот

Вот отчёт за последние полгода.

Всплывающее окно: символ

Теперь, чтобы увидеть символ и скопировать тривиальную информацию по нему, можно просто ткнуть на ссылке.

Панель Подборок из синей стала зелёной: теперь это не переход.

Внизу ссылочка «◀◀◀ U+FE0F». Она во всех всплывающих окнах: если вдруг вы закрыли, или любопытство завело вас непонятно куда, вы легко можете вернуться туда, где были. История запоминается на целых 100 шагов.

Иероглифы разные

Эмодзи. Обратите внимание на балерину выше: подтянул свежую библиотеку Google Noto. Только косатку оставил свою: ну не получился у Гугла хищный зубатый кит.

Эмодзики Google Noto

Эмодзики Google Noto

Флаг Сирии заменил на бенладенский, вслед за Ябблом.

Бенладенский флаг Сирии

Бенладенский флаг Сирии

Египетские. Сейчас они обслуживаются тремя шрифтами.

  1. Google Noto: проверен египтологами. Низкие кегли совсем не держит. Покрывает базовый блок 2009 года.

  2. NewGardiner: нарисован египтологом, но единичные ошибки есть. Низкие кегли отлично держит. Коряв как чёрт. Покрывает подтверждённые иероглифы (600 расширенных намеренно опущены).

  3. Мой, основанный на JSesh (программе-редакторе египетских текстов). Низкие кегли неплохо держит. Покрытие рандомное. Пришлось проверять и перерисовывать, но такая красотища! Разногласия решались простым большинством из трёх источников: изображения Юникода, описания Юникода и NewGardiner.

Жанровые сцены (разные, но близкие) тремя шрифтами: Noto, GewGardiner, JSesh

Жанровые сцены (разные, но близкие) тремя шрифтами: Noto, GewGardiner, JSesh

Шрифт буду потихоньку расширять, пока буду жив, и последовательность такая.

Стадия 1. Три шрифта в сумме покрывают все египетские иероглифы. Выполнено в июле, нарисовано и перерисовано несколько десятков иероглифов.

Стадия 2. Все символы моего шрифта проверены на простейшую корректность. Выполнено только что, сделано более 600 иероглифов. Главный вопрос — борода: у египтян короткая, у фараонов длинная, у богов крючком.

Стадия 3. Шрифт растяну на 1100 символов основного блока. Будет ХЗ когда, предполагаемый срок — после Нового года. Рассчитываю на 200…300 иероглифов работы.

Стадия 4. Буду поддерживать все египетские иероглифы. Будет минимум через полтора года и 800 иероглифов.

Поставил на свой шрифт такие требования: 1) если человек держит что-то, оно всегда будет изображаться гипертрофированно; 2) если минимальная причёска и ничего не говорится про бороду — то бороды нет; 3) только очень близкие символы приводятся в единый стиль.

Тангутские. Просто нашёлся человек, нарисовавший всё, что было.

Новые тангутские иероглифы

Новые тангутские иероглифы

Арабский. Он же нарисовал временные изображения арабских лигатур.

И Сулейман ибн Дауд — мир с ними обоими! — приказал принести два сосуда: один медный, а — другой глиняный, и заточил меня в глиняном сосуде, а брата моего, Омара Хоттабовича, — в медном.

Лазарь Лагин. Старик Хоттабыч. — М: 1959

Вот такие стандартные фразы часто заменяются лигатурами (склейками), примерно такими.

Слева — профессиональная (Scheherezade New). Справа — затычка, сделанная тем китайцем

Слева — профессиональная (Scheherezade New). Справа — затычка, сделанная тем китайцем

Китайские. Китаевед Эндрю Уэст стал более публично работать над своим шрифтом, я с ним советовался, проверял его на ошибки… и вдруг он неожиданно помер! Что с ним дальше делать, просто не знаю: шрифт-то отличный, просто больше никем не поддерживается. Оставил небольшую «пасхалку» в его память, кто найдёт…

Нашёл более удачную библиотеку преобразования GlyphWiki→SVG, и теперь китайские подскочили в качестве.

Плохие новости для Windows 7 и необновлённой 10-ки: теперь самый-самый резервный китайский шрифт — новый стандартный SimSun-ExtG. Простите уж, и до этого были тофу — будет больше.

Турецкая локализация

Нашёлся турок, и мы с ним вместе сделали неплохой перевод.

Турецкий перевод

Турецкий перевод

А вот японский несколько застоялся: японец выхаживает серьёзно больную жену.

И тут получилась проблема: я не могу быстро изменить языки, которые не знаю. А ведь есть фразы типа «в базовой плоскости Юникода осталось 16 нераспределённых символов», или «изобретатель маджонг-пасьянса прикован к коляске, но жив» — пока истинны, но может измениться. Вот приходится писать что-то вроде «жив на 2025», и это 2025 — особый шаблон. Если узнаю, что умер,— напишу. А не известные мне языки продолжат гласить: жив на такой-то год.

Поиск

Обнаружилась ошибка: поиск неизвестного флага давал ошибочную строку. После разговоров с пользователем решил не убирать, только облагородил.

Поиск «XA»

Поиск «XA»

Докрутил поиск в египетских иероглифах. Иероглифы намеренно имеют пониженный приоритет.

Поиск «man»

Поиск «man»

Перебраны короткие словечки: где они играют роль, а где нет.

Поиск «by»

Поиск «by»

Почему сверху Белоруссия, понятно. Почему второй — именно этот слог письма и? А потому, что именно там BY — не предлог, а нечто значимое!

И… довольно странная просьба. Дело в том, что за обработку эмодзи отвечают сразу три подсистемы: вписанная в шрифт программа, типографский движок и высокоуровневая типографская библиотека где-то в прикладной проге. В результате такого разделения ответственности получается, что определённые нестандартные последовательности, тем не менее, корректно отображаются картинками-эмодзиками. Такие последовательности делятся на 1) минимально квалифицированные (скорее всего, отобразятся), 2) неквалифицированные (отобразятся, если будет угадан шрифт), и 3) странные (полагаются на особую реализацию эмодзи-шрифта).

Просили декодировать такие странные эмодзи.

Стандартный код для него — просто 1F46B

Стандартный код для него — просто 1F46B

Все такие нестандартные эмодзи у меня делятся на три категории: 1) поменяны местами мужчина/женщина, мальчик/девочка; 2) существует более короткая последовательность; 3) оба сразу.

Минимально квалифицированный: не хватает VS16 после сердечка

Минимально квалифицированный: не хватает VS16 после сердечка

Спасибо за внимание!

ИТ-проекты пикабушников

568 постов3.4K подписчиков

Правила сообщества

0. Запрещены посты вне тематики сообщества

1. Уважайте труд людей, пишите только конструктивную критику,

2. Не выкладывайте информацию по своему проекту чаще 2ух раз в месяц