Транслитерация русского латиницей
Внимание: грёбаный пикабу съел все диактрические знаки, которые не были встроены в сами буквы.
Таблица транслитерации в конце поста.
Есть на моей свалке нереализованных идей одна про порно с драконами... но суть не в этом, а в том, что дело там происходило в псевдославянской части большого фентезийного мира. Но так как я давно продался буржуям и пишу на английском, то придётся записывать славянские имена и названия латиницей. В привычной со школы транслитерации ц это ts, щ это shch, ь и ъ это ' и ", а ы вообще непонятно как (потому что y занято за й). Посмотрел я на всё это дело и понял, что это ужас какой-то, особенно вот эти апострофы. И решил разработать свою систему транслитерации. Для порнорассказа, который всё равно никогда не напишу, да. Вот такой я странный зверёк.
Цели я себе поставил такие: по возможности избавиться от сочетаний, но самое главное - от апострофов.
Первым делом я сделал й -> j, чтобы высвободить y эксклюзивно для ы.
Потом я обратился к некоторым уже имеющимся системам транслитерации за альтернативами сочетаниям: ц -> с, ч -> č, ш -> š, щ -> šč (тут всё равно осталось сочетание, но хотя бы не shch).
Осталось самое сложное: ь и ъ. Тут я обратился к древнерусскому и праславянскому, где эти буквы произносились как сверхкраткие гласные. И стало: ь -> ĭ, ъ -> ŭ.
Однако, что делать, если мягкость сообщается буквами е, ё, ю, я? Подумав немного, я решил в таких случаях записывать их как ë, ö, ü, ä.
Итого получилось так: подъезд -> podŭjezd, вьюга -> vĭjuga, изъять -> izŭjatĭ, снег -> snëg, клён -> klön.
Выглядит, конечно, странно, но в принципе работает. От ŭ и ĭ внутри слов можно даже отказаться, если добавить символ ȷ, т.е. podjezd и vȷuga. Но от ĭ в конце слова так избавиться, увы, не получается.
Однако, некоторое время спустя меня посетила мысль лучше: а что, если мягкость согласного показывать значком над самим согласным? Например, акутом (символом ударения). Проблемой было то, что над некоторыми буквами у меня уже был гачек. Тогда я решил эти буквы заменить на ʂ (ш) и ʐ (ж), щ записывать как мягкую ш (ʂ), остаётся ч, её в принципе можно записать как мягкую ц (с), так как мягкая ц в русском языке не встречается, но встречается в других славянских языках (например был такой партийный деятель с украинской фамилией Цюрупа, если попробуете это произнести, то обнаружите, что мягкий ц - это совсем не ч). Да и другая проблема тут возникла: в юникоде не оказалось заглавных ʂ и ʐ (хотя есть запрос на них, так что может добавят ещё). Так что пришлось менять это всё на буквы с седилью, благо такой знак в юникоде и в отдельном виде есть, что позволяет его приписать к любой букве, в том числе к c для ч. Получилось: z (ж), ç (ч), ş (ш), ş (щ).
Самое главное, при этом необходимость записывать мягкий или твёрдый знак отдельной буквой (или, Боже упаси, апострофом) отпала.
Подведём итог.
Алфавит.
А а A a
Б б B b
В в V v
Г г G g
Д д D d
Е е Je je
Ё ё Jo jo
Ж ж Z z (Z z с седилью)
З з Z z
И и I i
Й й J j
К к K k
Л л L l
М м M m
Н н N n
О о O o
П п P p
Р р R r
С с S s
Т т T t
У у U u
Ф ф F f
Х х H h
Ц ц C c
Ч ч Ç ç (C c с седилью)
Ш ш Ş ş (S s с селилью)
Щ щ Ş ş (S s с седилью и акутом)
Ъ ъ (см. правила ниже)
Ы ы Y y
Ь ь (см. правила ниже)
Э э E e
Ю ю Ju ju
Я я Ja ja
Правила:
Во всех сочетаниях е, ё, ю, я, ь, ъ, гласные записываются в зависимости от звучания как je, jo, yo, ja либо e, o, u a, а мягкость согласного показывается акутом над ним. Таким образом необходимость в использовании отдельных букв для ь и ъ отпадает.
Примеры:
(т.к. пикабу съел все акуты, у меня не остаётся выбора, кроме как обозначить их апострофами, от которых я первоначально и пытался избавиться... но в юникоде всё должно работать)
снег -> sn'eg (мягкость н показана акутом)
гриб -> grib (согласный перед i всегда мягкий, поэтому отдельно мягкость не показывается)
изъять -> izjat' (твёрдость з показана отсутствием акута, мягкость т показана акутом)
вьюга -> v'juga (мягкость в показана акутом)
фильм -> fil'm (мягкость л показана акутом)