Горячее
Лучшее
Свежее
Подписки
Сообщества
Блоги
Эксперты
Войти
Забыли пароль?
или продолжите с
Создать аккаунт
Регистрируясь, я даю согласие на обработку данных и условия почтовых рассылок.
или
Восстановление пароля
Восстановление пароля
Получить код в Telegram
Войти с Яндекс ID Войти через VK ID
ПромокодыРаботаКурсыРекламаИгрыПополнение Steam
Пикабу Игры +1000 бесплатных онлайн игр Перемещайте деревянные блоки и направляйте их в ворота, соответствующие их цвету! Это спокойная и расслабляющая головоломка без таймеров и ограничений — играйте в комфортном темпе.

Деревянные цветные блоки

Головоломки, Казуальные, Логическая

Играть

Топ прошлой недели

  • solenakrivetka solenakrivetka 7 постов
  • Animalrescueed Animalrescueed 53 поста
  • ia.panorama ia.panorama 12 постов
Посмотреть весь топ

Лучшие посты недели

Рассылка Пикабу: отправляем самые рейтинговые материалы за 7 дней 🔥

Нажимая «Подписаться», я даю согласие на обработку данных и условия почтовых рассылок.

Спасибо, что подписались!
Пожалуйста, проверьте почту 😊

Помощь Кодекс Пикабу Команда Пикабу Моб. приложение
Правила соцсети О рекомендациях О компании
Промокоды Биг Гик Промокоды Lamoda Промокоды МВидео Промокоды Яндекс Маркет Промокоды Пятерочка Промокоды Aroma Butik Промокоды Яндекс Путешествия Промокоды Яндекс Еда Постила Футбол сегодня
0 просмотренных постов скрыто
CryptoDefend0r
CryptoDefend0r

Биткоин появился намного раньше⁠⁠

2 года назад

Латинская заглавная буква b с чертой (биткоин) Ƀ

Ƀ U+0243

Этот символ используется, как один из альтернативных знаков биткоина.

В десятой версии Юникода введён другой символ биткоина: ₿.

Символ «Латинская заглавная буква b с чертой (биткоин)» был утвержден как часть Юникода версии 5.0 в 2006 г.


Старая скамина оказывается

Символика и символы Unicode Текст
0
53
f3681

Ответ на пост «Отличный каст!»⁠⁠1

2 года назад

Во время заседания консорциума Юникода (стандартизует компьютерную кодировку для всех видов письменности в мире) в 2016 году из светильника на стол вывалилась мышь, и её тоже включили в список присутствующих и в протокол встречи.

В списке участников: «Мышь — представляет саму себя»

В протоколе заседания: "Задача для владельца здания: поймать и изгнать мышь, которая только что вывалилась из светильника"

Источник: https://www.unicode.org/L2/L2016/16325.htm#149-A94

Показать полностью 1
Скриншот Мышь Unicode Заседание Протокол Ответ на пост
7
31
Mercury13
ИТ-проекты пикабушников
Серия Энциклопедия символов «Юникодия»

Энциклопедия символов «Юникодия»: год спустя⁠⁠

2 года назад

Напоминаю: я пишу программу под Windows — энциклопедию символов и замену стандартной Таблице символов. Качать тут. Выглядит примерно так.

И первое, что вы здесь видите…

Графические эмодзи

Я втянул библиотеку эмодзи Google Noto, и теперь все эмодзики гипертекстовые векторные. Честно, мне Noto не очень нравится: недостаточно контрастные. Но что делать, это пока лучшая из бесплатных библиотек эмодзи: Twemoji вообще блёклая, OpenMoji совсем уж вычурная.

Имеющийся SVG-движок не работает с контурами обрезки, и я где-то месяц находил чёрные пятна и устранял их сам, программой Inkscape.

Для чего я это делал?.. А для новой функции.

Подборки

Подборок пока не очень много. Две из них — «Эмодзи» и «Необычные ККЯ-иероглифы» — нашлись в таблицах Юникода, остальное моё собственное.

Пришлось решать и такую задачу: вот я подредактировал внерасовую жёлтую руку под ограниченный SVG-движок. Что делать с пятью расовыми руками от белой до чёрной? Написал программную перекраску в нужную расу.

Английский и украинский

Перевёл программу на все языки, какие знаю. Для этого написал целую программу редактирования языковых ресурсов. Небольшую и неполную, но учитывающую весь мой опыт коммерческой локализации «живой» программы. И потихоньку дописываю в эту программу все задачи, какие нужны: например, декодировать текст Си++ u8"раз\nдва"sv в «раз//два». Или найти, где я при переводе забыл абзац-другой (таких рассказов нашлось штук девять в английском и пять в украинском).

Задачи, не связанные с «Юникодией»,— например, поддержка посторонних языковых ресурсов вроде CSV — так и висят почти год. Хочу довести состояние «Юникодии» до production/stable, а переводчик так и останется вечной альфой — ну, если не придётся переводить что-то другое.

Юникод 15

Четыре основных новых блока Юникода 15.

  • Эмодзи — быстро появились у Гугла.

  • Алфавит Нага для языка мундари — сам намалевал корявый, но действующий шрифт. Не кучу глифов, а именно шрифт!

  • Кави (старояванский) — выпросил разрешение у индонезийца: существует великое множество стилей кави и даже есть открытый шрифт в стиле поздних каменных монументов, но я хочу именно канонический, шрифт ранних надписей на меди.

  • Китайские иероглифы — что-то сделал старый знакомый Эндрю Уэст. А остальные были загружены с GlyphWiki самодельным пакетом программ.

Для чего собственный загрузчик? Чтобы иметь уверенность в 146%, что шрифт получился технически корректный. Загрузчик состоит из трёх программ: собственно загрузчика (скачать иероглифы с GlyphWiki), переработчика (превратить ломаные в кривые, разрулить стандартные некорректности вроде задваивания вершин) и Python-скрипта для FontForge (собрать шрифт).

Старый чужой GlyphWiki-шрифт остался, ведь задача корректности решена не полностью.

Для остальных мелких блоков нарисовал недействующие глифы-затычки.

HD

Установил «Юникодию» на чей-то ноутбук и удивился (если не сказать покрепче). Программную часть сделал за неделю, а триста иконок — мучил почти два месяца, с декабря до февраля. Так долго, потому что заодно с HD делал и украинский: переделанные иконки оказались хорошим маркером, что уже вычитано.

Большинство иконок — просто SVG-графика, иногда с отметками, чтобы выровнять по пикселям доминирующую линию. Штук пятнадцать рисуются программно, особым движком: игральные карты — не смог зашить в SVG закруглённую рамку, символы со старых компьютеров — хочу пиксели, даже если рука и нога слегка вылезут из виду…

Программные штуки

Порядок сортировки. Было понятно, что триста блоков в исторически сложившемся порядке — это ужас, так что сделал три варианта сортировки: по алфавиту, континенту+алфавиту и коду. По умолчанию — континент+алфавит, ведь часто вы знаете, письмо европейское или африканское, или вообще международная нотация.

Из-за этого вместо «Игральные карты» написал «Карты игральные», как в справочниках. А вот «Пехлеви псалтырское» и «Шоу Бернарда алфавит» писать побоялся.

Развыделение комбобокса. Чисто визуальная, плавающая, но противная ошибка: выбираешь какой-то блок, и вдруг на экране оказываются два фокуса ввода: на таблице (истинный) и на выпадающем списке (ложный). Писал самые разные разглючки, ошибка затаивалась, но появлялась с новой силой. Начал уже прикручивать к списку собственную «шкурку», якобы решило проблему… — и как только к шкурке приделал «микро-фокус» от повисшего курсора, проблема вернулась! Источник понятен, шкурку тут же убрал, а разглючка заняла одну строку.

Поиск по числовому значению. Работают форматы 12, 1/4, 0.25, 0,25, 0/3. Последний ищет только символ 0/3 из бейсбольных сводок (запрещён на Пикабу в монолитном виде, потому пишу так). Арабские цифры всегда предпочтительнее остальных.

Альтернативные имена символов. Вы это уже видели на картинке «1.7 vs 1.9». А вот что творится в египетских иероглифах (выпросил базу у одного голландского любителя Египта).

В таблицах Юникода есть и другая интересная информация о символах — например, восклицательный знак имеет альтернативные названия «factorial» и «bang». Из-за HD всё это приостановлено. Может, после пары недель простоя начну снова — если буду жив. Спасибо.

Показать полностью 8
[моё] Unicode Windows Программа Таблица Шрифт Длиннопост
2
2509
stavropol
stavropol
IT-юмор

«Запрещенные» символы Юникода⁠⁠

3 года назад
«Запрещенные» символы Юникода

Заскринил я, но тег [моё] не ставлю, т.к. не автор. Источник: Хабр

IT юмор Картинка с текстом Unicode Программист
111
19
Onegai
Onegai
Наши 90-е
Серия Девяностые. День за днём. Год 1992

Девяностые. День за днём. 2 сентября 1992 года⁠⁠

3 года назад

✅ Создана компьютерная кодировка UTF-8 (в настоящее время распространённая кодировка, реализующая представление Юникода, совместимое с 8-битным кодированием текста)

🎥 Телевидение начало показ документального фильма Станислава Говорухина «Александр Солженицын». В нем показано многих уникальных материалов, фотографий и рукописей, но большую часть двухсерийной картины занимает интервью с писателем. Солженицын согласился на съемки с Говорухиным, поскольку ему понравился фильм режиссера «Так жить нельзя».

✅ Россияне будут без паспортов, но с удостоверениями личности
Россия предполагает полностью отказаться от паспортной системы.
Действующие сейчас на ее территории паспорта СССР будут заменяться удостоверениями личности гражданина РФ. Сообщив об этом, председатель подкомитета Комитета по правам человека Верховного Совета России Михаил Арутюнов сказал, что новый документ планируется ввести в начале 1994 года.
ИТАР-ТАСС.
«Известия» 2 сентября 1992 года

Материал проекта «30 лет назад», в котором я ежедневно рассказываю о событиях, произошедших в этот день, ровно 30 лет назад.

P.S. Проекту требуется помощник. Подробности туть

Показать полностью
[моё] История Прошлое 90-е Детство 90-х История России 1992 Александр Солженицын Паспорт Станислав Говорухин Unicode Видео YouTube
0
54
Mercury13
ИТ-проекты пикабушников
Серия Что нового в Юникоде

Что ожидается нового в Юникоде 15⁠⁠

3 года назад

Я уже писал с большим опозданием про Юникод 14. Время не стоит на месте, и вышла версия 15-бета. Поехали?


Добавлений мало: 2 новых письменности, 20 эмодзи и 4488 символов, большая часть — иероглифы. Будет 149. 185 символов, плюс 63 старых управляющих.


Эмодзи

Начнём с того, что больше всего интересует нас в новом Юникоде,— эмодзи. Появилась кханда — символ сикхизма, состоящий из меча, чакры (местного индийского сюрикена) и двух сикхских ножей. Кто не знает: сикх всегда носит специальный кривой нож.


Из музыкальных инструментов — флейта/дудка и маракасы, из животных — лось, осёл, гусь, медуза, крыло. Из растений — гиацинт, стручок, имбирь. Из «колобков» добавился трясущийся/дрожащий, из рук — толкающая влево/вправо. Сердечки добавились голубое, серое и розовое. Появился знак радиосети.


Интересная история с веером. На Востоке много танцев с веерами, некоторые веера — настоящие произведения искусства. Но дело не только в этом: в западном языке эмодзи много ребусов — например: (простите, в роли веера — танцовщица)


💩🎯💃 = shit hits the fan — вброс «нетонущего» на вентилятор

💃♣️ = fan club — фан-клуб


Я лично недоволен разве что афро-гребнем, которым негры из своих кудрей делают умопомрачительные причёски. Не стоит добавлять его, не добавив гребня обычного.


Кави

Кави (старояванское письмо) — мёртвое письмо индийского происхождения, использовавшееся на островах Индонезии с VIII до XVI века. Оттуда происходит современное яванское письмо.


Мундари (алфавит Нага)

Мундари — австроазиатский язык, использующийся в Индии, Бангладеш и Непале. Хочется сказать «небольшой», но какой он небольшой с 1,5 миллионами в одной только Индии? — Эстония поменьше будет.


Пишут кто на чём горазд: латиницей, ори́ей, деванáгари, бенгальским. С 23-мя согласными на латинице потребуются умляуты. Индийское письмо лучше приспособлено под широкие алфавиты — но оно полуслоговое (т.н. абугида), а мундари — язык не индоевропейский. Так что не удивительно, что около 1950 некто Рохидас Наг придумал новый алфавит, и он даже прижился.


Сверху на таблице написано «Мундари бани» — одно из названий нового алфавита.


И почему-то индийцы любят добавлять собственные цифры, в каждой письменности свои, мундари не исключение. Знаки препинания обычные международные.


ККЯ


4000 иероглифов самого разного происхождения, в основном старые вьетнамские (современный Вьетнам пишет латиницей), а также найденные британскими исследователями в старых китайских газетах. Ничего особенного.


Для четырёх имевшихся иероглифов перерисовано изображение, причём все их типограф Эндрю Уэст уже нарисовал правильные. (Я и сам с ним советовался, когда работал над своей «Юникодией».)


Форматирование египетских иероглифов

Расширили форматирование египетских иероглифов. Как ни странно, Юникод нужен, чтобы кодировать имеющиеся тексты — и добавили несколько символов для египетских источников. Где-то иероглиф развёрнут, где-то часть затёрта…

Когда-то давно в Юникоде 2 (1996) сделали так называемый «великий корейский бардак» — передвинули блок хангыля. Прошло 25 лет, и в Юникоде 14 (2021) сделали беспрецедентную вещь — расширили блок «Ахом» на 16 символов. Точно так же в Юникоде 15 расширили блок форматирующих символов для иероглифов.


Кактовикские цифры

Эскимосы (или инуиты, если политкорректно) Канады и Аляски считают двадцатками, 74 они произносят как «три двадцатки, пятнадцать без одного». Цифры придуманы школьниками из городка Кактовик (Аляска) в 1980-е годы. В эскимосском нет слова «ноль», однако решили делать настоящую позиционную систему с основанием 20.


Пользуясь только арабскими десятичными цифрами, эскимосы были в числе худших по математике из всех США — а пользуясь и теми, и другими, они стали выше среднего уровня, примерно как двуязычный часто смотрит на мир с двух разных сторон. Эскимосы Канады также рекомендуют новую систему.


Кириллица

Добавились более 60 модифицирующих символов для кириллической записи транскрипции. Нечто подобное — правда, не в таком страшном объёме, как в этих вузовских учебниках — нам преподавали и в школе.


И не могу не рассказать о замене одного редкого глифа для церковных книг — символ A66E «Cyrillic letter Multiocular O». Вот такая необычная буква иногда применялась в выражении «многоокие серафимы».

С 2008 года, когда этот символ появился, в глифе было семь букв О, стало десять. В моей «Юникодии», кстати, это уже отмечено, откорректированные глифы я стараюсь ловить оперативно, хотя не всегда выходит: несколько десятков египетских иероглифов устаревшие (до Юникода 14), и просто не знаю, что с ними делать.


На Украине война, в любой момент могу пропасть, и перехожу на военные правила выпуска программы: блоки Юникода 15 будут, когда будет хоть что-то без тофу («квадратиков»). Хоть эти самые эскимосские цифры. (Основная работа — локализация на английский, и пока ей края нет).


Остальное не заслуживает детального рассмотрения. Сменили пару глифов — для современной буквы сунданского языка (Индонезия) и для древних (около IX века) орхоно-енисейских (тюркских) рун. Добавили три символа из турецкого Корана. В деванáгари добавили несколько знаков из джайнизма XVII века. В лаосском добавили двойную крышку для передачи религиозного языка пали.


Напоминаю: я пишу программу «Юникодия» — энциклопедию символов Юникода. Качать тут.

Показать полностью 7
[моё] Unicode Эмодзи Длиннопост
51
699
Mercury13
ИТ-проекты пикабушников
Серия Энциклопедия символов «Юникодия»

Энциклопедия символов «Юникодия» v1.1: я это сделал!⁠⁠

3 года назад

Напоминаю: я пишу программу под Windows — энциклопедию символов и замену стандартной Таблице символов. Качать тут.


Я дошёл уже до версии 1.1, и вот что вышло. Пишу крупные изменения и 1.0, и 1.1.

Поддержка ВСЕГО Юникода 14


Вы правильно прочитали, не осталось ни одного тофу. Под Windows 10/11, разумеется — пользователям 7-ки больших обещаний не делаю. На картинке сверху — моя интерпретация кипро-минойской письменности, добавленной этой осенью. Да, сам рисовал шрифт, и вот откуда эта интерпретация взялась.


1. Реальный памятник, найденный где-то на Турецком Кипре.

2. Его факсимиле.

3. Прорисовка Майкла Эверсона (2020).

Египетские и анатолийские иероглифы


Вообще-то в коллекции Noto для них есть отличные шрифты. Анатолийские выше всяких похвал, а у египетских один недостаток: как отрендерить в маленькую клеточку Юникодии? Ларчик просто открывался: OTF, который я кое за какие технические подробности недолюбливал. Но тут сильно другой рендерер конкретно для этого шрифта сработал на все 146%.

Впоследствии выяснилась запара: символы счётных палочек иногда «проваливаются между пикселей». Нарисованы девять палочек, а видны только три! Их я просто скопировал в свой резервный TTF и прохинтовал, но тут случилось забавное: под Windows 7 я никак не мог прописать в заголовках резервного шрифта, что иероглифы поддерживаются. Я на подобный глючок натыкался и раньше, и под Windows 10 тоже — решилось просто, в Qt есть стандартный обход QRawFont.


А анатолийские — просто за компашку получили OTF-шрифт. Попробовал также заменить OTF’ом пахау хмонг, чей рендеринг мне тоже не нравился — не получилось.


Китайский, корейский, японский

ККЯ-символов всего 115 тысяч, или 79% всего Юникода. Из них 94 тысячи иероглифов, остальное — корейский, тангутский, спецсимволы, японский, киданьский, нюй-шу, примерно в таком порядке. И где достать шрифты, которые поддержат такую громадину?


Оказалось, есть сайт GlyphWiki, оперативно реагирующий на изменения в Юникоде, но тамошние SVG — а значит, все шрифты, сделанные из них — технически страшны. И есть типограф Эндрю Уэст, который потихоньку клепает шрифт Babelstone Han. Собственно, задача — собрать из того и другого подходящую коллекцию. Шрифт с GlyphWiki я заменил другим, и целую ночь торчал в FontForge, исправляя хоть самые страшные глюки. Заодно ушло 10 мегабайт архива. Но это значит, что для пользователей Windows 7 ушли несколько древних письменностей, в частности готский — были за компашку в одном шрифте и исчезли в другом. Простите уж, я и не обещал пользователям 7-ки полную поддержку всего.


Декапитализация


К сожалению, в стандартах Юникода символы называются большими буквами: CANADIAN SYLLABICS WOODS-CREE FINAL TH. Но у меня с самого начала всё няшно и цивильно, и за это отвечает декапитализация — система из 700 правил и 250 исключений. Это немало, но строк-то в Юникоде 45 тысяч — даже такая недоавтоматика лучше ручной работы.

«Canadian» — название письменности, сделать с большой буквы и включить следующий механизм.

«syllabics» — ключевое слово. Оставить с маленькой, но после сделать большую букву.

«Woods-Cree» и «final» — прилагательные. Если есть большая буква, она проталкивается по прилагательным дальше до Th. Так что получилось бы «Woods-cree final Th», но лесные кри — индейское племя и в английском с больших букв.


Уже четыре правила.


Не буду всё перечислять, но новых правил декапитализации я добавил очень много. Самое чувствительное — отыскал и отметил альтернативные написания имени Аллах. А также вручную перебрал все названия с «ligature» — никакая автоматика не расставит правильно большие буквы в каком-нибудь «Hebrew ligature Yiddish Yod Yod Patah».


Поиск


Уже следующей осенью моя программа устареет — появится Юникод 15, в котором будут веер, афро-гребень и WiFi. К тому же некоторые программы (и моя Юникодия тоже!) вовсю пользуются личными символами. Так что поиск по несуществующим символам стал более подробным. Вот, например, что увидим, когда поищем «590».

При том, что ближайший символ к 590 — это U+0591, какой-то еврейский умляут, я не стал его выводить, а коряво воспроизвёл иконку.


Видим ещё одну фишку — поиск не только по шестнадцатеричному коду, но и по десятичному. Нашло не только U+0590, но и 590₁₀=24E. Поиск по названиям существовал и ранее, причём достаточно адекватный.


Собственные изображения спецсимволов


Некоторым символам — форматирующим или с особой функциональностью — в общем, забранным в пунктир — приходится делать своё изображение. Эти изображения хранятся в моём резервном шрифте в пользовательских позициях (E001 и далее), налажен механизм отрисовки. Вот несколько штук.

Описания


Постарался проверить всё. Например, индийские письменности слоговые — как в каждой из них работает запись сложных слогов? Условный «стол» даже в родственных письменностях может писаться совершенно по-разному.


• са⸜ то ла⸜  (то, что я обозначил чертой, называется «вирама» или «халанта» и стирает букву «а» из слога) — исходная письменность брахми, а также некоторые малоразвитые письменности Юго-Восточной Азии

• сᵊ то лᵊ — гласная по умолчанию «а» стала немой или почти немой — пенджабский с письменностью гурмукхи

• сᵀо ла⸜ — во втором слоге знакомая нам вирама, а в первом «с» и «т» склеились в лигатуру — так работает хинди с письменностью деванагари

• с то л — лаосский в XX веке отказался от гласной по умолчанию


А правда ли, что юникодными знаками европейских нот можно записать «Кузнечика»? Оказалось, нет. Даже несмотря на то, что играется на одной гитарной струне.

В левосторонних письменностях кхароштхи и ханифи перед текстами-образцами для правильного рендеринга добавил знак RLM.

Теперь слог «дхик» закодирован именно так, как в описании, только перед ним RLM = right-to-left mark. Копируй, вставляй, разбирай на символы — всё честно, как и подобает энциклопедии Юникода. (Раньше было ка+вирама+дха+и — и неловкое объяснение: простите, по-другому не рендерит.)


Недоработал: когда писалась статья, уже нашёл пару незначительных ошибок в описаниях. Ничего критичного, исправлю в следующей версии. (А ещё в версии 1.1 допустил неудачный рендеринг десятка латинских умляутов — это уже критично, быстренько перевыпустил.)


Так что спасибо за внимание!

Показать полностью 9
[моё] Unicode Windows Программа Разработка Шрифт Приложение Программирование Таблица Длиннопост
59
16
Mercury13
Серия Что нового в Юникоде

Что нового в Юникоде 14?⁠⁠

4 года назад

В сентябре 2021 вышел Юникод версии 14. Постараюсь описать, что в нём нового.


Напоминаю: Юникод — это кодировка символов в наших компьютерах. Сейчас она содержит более 140 тысяч позиций, и ни один шрифт не поддерживает Юникод полностью.


Китайский, корейский, японский


Обычно в Юникод за раз добавляется от 2 до 6 тысяч иероглифов. В этот раз ККЯ-символов всего двадцать шесть. Зато много внутренних изменений в базах — например, для 6000 иероглифов уточнили кантонское начертание.


И самое интересное — создали базу необычных иероглифов: простых, сложных, симметричных… Приведу три рекордно-сложных иероглифа:

• U+30EDD бян (упрощённое написание), используется в количестве двух штук в названии китайской лапши бянбян.

• U+30EDE бян — он же, традиционное написание.

• U+3106C дайто/отодо — чисто японский иероглиф, означающий «вид дракона в полёте». Состоит из трёх иероглифов «облако» и трёх иероглифов «дракон». Long dragon is sooo loooong, как говорят (long — англ. «длинный», кит. «дракон»)…

Эти символы появились год назад в Юникоде 13, сейчас их просто отметили как необычные.


Бянбянная где-то в Сиане, Китай. Обратите внимание на иероглифы.

Арабский


Добавили в общей сложности 74 символа! — для арабского это рекорд.


Бошняцкий (диалект сербохорватского, который часто пишут арабицей), пегон (запись яванских языков арабскими буквами) — этим никого не удивишь. Где ислам, там арабица. Интереснее другое.


Добавлено 33 знака из комментариев к Корану — например, из Корана издания короля Фахда аль-Сауда (а это, извините, почти современность, этот мэн умер в 2005).

Декламирование Корана — важное занятие ардритов мусульман с планеты Земля, и это подсказки для чтеца, которые придумал некто Варш, живший в Египте, получивший своё прозвище за светлую кожу (варш — местное название какого-то молочного продукта) и умерший в 810.


Второе интересное добавление — четырнадцать символов — связано с деятелями ислама. Но разрешите сначала процитировать знаменитую сказку.

И Сулейман ибн Дауд — мир с ними обоими! — приказал принести два сосуда: один медный, а другой глиняный, и заточил меня в глиняном сосуде, а брата моего, Омара Хоттабовича,— в медном.

Подобных шаблонных фраз в исламе хватает, и их сокращают в лигатуры. Вот, например, «да будут освящены его тайны» — о суфийских святых.

Хотели добавить ещё подобных фраз, но… нашли в шрифтах, зато не обнаружили в печатных текстах. Ну и обратите внимание на развёрнутый вопросительный знак — это отдельный арабский символ U+061F, существовавший с самого первого Юникода.


После всех этих добавлений в базовой плоскости осталось 16 нераспределённых позиций. И я даже вангую, на что их пустят — в Юникоде 15 и 16 ни на что. А в дальнейшем — на символы разного назначения, которые кровь из носу должны быть именно в базовой плоскости (например, валютные).


Две новых письменности для умирающих языков


Тото — маленький сино-тибетский язык, используемый в деревне Тотопара (Восточная Индия) племенем тото (1400 человек на 2014). Пишут бенгальской или собственной алфавитной письменностью, которую придумал в 2015 старейшина Дханирам Тото. По интернету ходит очень красивый шрифт неизвестного авторства (SIL International? — авторы «Шехерезады», одного из лучших арабских шрифтов). Запись слева направо.


Одно и то же слово, записанное тото, бенгальским и латиницей.

Тангса или тасе-нага — семейство сино-тибетских языков на 100 тысяч человек (Мьянма, Северо-Восточная Индия). Письменность — различные виды латиницы (то есть нет стандарта на всех — видимо, связано с тем, что в языках четыре тона). В 1990 индиец Лакхум Моссанг создал алфавит и до смерти в 2020 обучил ему около 100 человек (напрашивается картинка с xkcd про стандарты). Запись слева направо.

Четыре с половиной исторических письменности


Кипро-минойское письмо — частично расшифрованная слоговая письменность с написанием слева направо, использовавшаяся во II тысячелетии до нашей эры. Шансы на исчерпывающую дешифровку призрачны: все известные надписи насчитывают 2500 символов. Для сравнения: нерасшифрованное линейное письмо А — 7 тысяч, линейное письмо Б на момент расшифровки — 30 тысяч.

Староуйгурское письмо — промежуточное между согдийским (консонантное, справа налево по строкам, при этом текст часто опрокидывали на 90° влево — получалось слева направо по столбцам) и старомонгольским (чистый алфавит, только слева направо по столбцам). Использовалось около 700…1800.


Компьютерное кодирование по согдийскому принципу — запись справа налево, на 90° влево опрокидывают программно. Вертикальный монгольский — как старо-, так и квадратный Пагба-ламы — наоборот, записывается слева направо и опрокидывается на 90° вправо.


В общем, видно, что вертикальное письмо сделано из заваленного горизонтального, писавшегося справа налево.

Знáменное пение — православная традиция одноголосого пения, появившаяся около XI века и сохранившаяся у старообрядцев (в современных церквях пение многоголосое). Знамёна указывают выпеваемую фигуру, а высота задаётся так называемыми признáками, часто красного цвета. Если европейские ноты в Юникоде нефункциональны, позволяют записать простым текстом разве что «Кузнечика» и служат в первую очередь для упрощения жизни программистам нотного ПО, уменьшения нотных PDF’ов, то для знаменного пения проект «Пономарь» сделал полностью рабочий шрифт. Это, видимо, и впечатлило Консорциум.


А ещё посмотрите, как смешно называются символы в таблице Юникода: Znamenny combining mark Nizko s kryzhem on left.

Виткутьский алфавит для албанского языка. В эпоху становления национальных государств (около 1800) известно как минимум четыре местечковых албанских алфавита. Причины две: конспирация от турок (Албания получила независимость в 1912 с распадом Турции) и желание местных просвещённых умов иметь свой алфавит, как у греков и славян.


Назван по селу Виткуть, родине изобретателя.

Ну а что за половинка? — сильно перерисовали египетские иероглифы по консенсусу египтологов. Например, женщина была с бородой, стала без, в пику Кончи́те Вурст. Причём видно, что случилось: исходные изображения 2009 года были достаточно историчными, но некачественными. В 2016 заменили изображениями, близкими к шрифту «Hieroglyphica» — красивыми, но не всегда правильными.

Эмодзи


Эмодзи, то есть картиночки для сокращения SMS и твитов — ну как без них?


Тролль — должен означать не столько сказочное существо, сколько интернет-провокатора. В транспортных символах добавили колесо и спасательный круг. В прочих — диско-шар, лотос, гнездо с яйцами и без, севшую батарейку.


Добавилась хамса — распространённый в иудаизме и исламе оберег в виде руки с глазом.

Ты нарисовал плакат с пальцем? — появился палец, указывающий на зрителя. А также руки сердцем.


Лицо с диагональным ртом — простой смайлик, набираемый текстовыми символами :-\ Даже удивительно, почему его не было раньше.


Лицо с открытыми глазами и рукой поверх рта — это попытка Консорциума как-то стабилизировать разнобой глифов. Дело в том, что Microsoft и Google отображают смайлик 1F92D «лицо с улыбающимися глазами и рукой поверх рта» правильно (сдерживает смех). А у Apple и Facebook глаза широко открыты — удивление или ужас. Этот самый ужас перенесли на другую кодовую позицию.


Ну и как я не мог упомянуть самый главный эмодзи Юникода 14 — беременного мужчину? Таковой действительно существовал — Томас Бити, Ж→М-транс, выносивший трёх детей, будучи по документам мужчиной. Хотя главной причиной была инклюзивность, автор «Эмодзипедии» — между прочим, член комитета Консорциума по эмодзи — заявляет, что англичане могут «наесться до беременности», то есть до такого отвала, что плохо себя чувствуют. А у нас «беременный» — это с пивным пузом.


Появился и просто «беременный человек» — как для тех, у кого тяжело с осознанием пола, так и для женщин с короткой причёской (большинство эмодзи бесполы, и чтобы сделать картинку мужчиной или женщиной, нужно добавить дополнительные символы).


Прочее


Из валютных символов добавился киргизский сом.


В эфиосемитском языке себат-бет (эфиопское письмо) в 2013 случилась орфографическая реформа, которая дала письменность всему семейству гураге. Канадская слоговая письменность захватила эскимосов инуитов племени наттилик. Несколько редких символов латиницы. Все три письменности впервые обзавелись блоками за пределами базовой плоскости.


Ну и напоследок немного самопиара. Я автор «Юникодии», справочника символов для Windows. Качать тут.

Показать полностью 12
[моё] Unicode Иероглифы Коран Длиннопост Эмодзи Шрифт
0
Посты не найдены
О нас
О Пикабу Контакты Реклама Сообщить об ошибке Сообщить о нарушении законодательства Отзывы и предложения Новости Пикабу Мобильное приложение RSS
Информация
Помощь Кодекс Пикабу Команда Пикабу Конфиденциальность Правила соцсети О рекомендациях О компании
Наши проекты
Блоги Работа Промокоды Игры Курсы
Партнёры
Промокоды Биг Гик Промокоды Lamoda Промокоды Мвидео Промокоды Яндекс Маркет Промокоды Пятерочка Промокоды Aroma Butik Промокоды Яндекс Путешествия Промокоды Яндекс Еда Постила Футбол сегодня
На информационном ресурсе Pikabu.ru применяются рекомендательные технологии