[{{mminutes}}:{{sseconds}}] X
Пользователь приглашает вас присоединиться к открытой игре игре с друзьями .

Форум «Пит-стоп» / Латинизация кириллицы от MMMAAANNN

MMMAAANNN Сообщение #1 1 февраля 2016 в 01:06
Супермен
36
Придумал как латинизировать русский алфавит без потери обратимости, при этом каждой русской букве будет сопоставляться не более двух символов латиницы.

Система основана на использовании двух букв-модификаторов (которые потенциально можно сделать "мертвыми клавишами" и превращать в диакритику, например).

Итак, модификаторы:

x добавляет циркумфлекс и преобразует латинскую букву в близко но неидентчно звучащую русскую (почти во всех случаях - согласную);
q добавляет умляут и преобразует латинскую букву в близко но неидентично звучащую русскую гласную, смягчая ее.

И соответствия остальных букв русского алфавита (криллица - латиница с диакритикой - порядок набора латиницы):

а     a     a
б     b     b
в     v     v
г     g     g
д     d     d
е     e     e
ё     ö    qo
ж     ẑ    xz
з     z     z
и     i     i
й     î    xi
к     k     k
л     l     l
м     m     m
н     n     n
о     o     o
п     p     p
р     r     r
с     s     s
т     t     t
у     u     u
ф     f     f
х     h     h
ц     c     c
ч     ĉ    xc
ш     w     w
щ     ŵ    xw
ь     j     j
ы     y     y
ъ     ĵ    xj
э     ê    xe
ю     ü    qu
я     ä    qa


Чем хороша данная система:

- Легко запоминается.
- Ни одна из букв не требует более двух латинских символов.
- Система полностью обратима - в обратную сторону (в кириллицу) преобразуется абсолютно однозначно, никаких тебе двузначностей типа sh - это ш или сх?
- На ее основе легко реализовать односимвольное преобразование, заменив модификаторы q и x соответствующей диакритикой, при этом результат будет очень легко читаться неподготовленным русскоязычным человеком.
- Потенциально на основе этой системы можно полностью отказаться от раскладки йцукен, нехитрым образом настроив AutoHotKey и используя полюбившуюся вам латинскую раскладку (QWERTY/DVORAK/COLEMAK).
- Не требует каких-либо пунктуационных знаков вроде апострофов.
Последний раз отредактировано 1 февраля 2016 в 11:59 пользователем MMMAAANNN
MMMAAANNN Сообщение #2 1 февраля 2016 в 01:49
Супермен
36
Унч любезно предоставил простенький транслитератор на java script:
http://pastebin.com/P3Wet9V1
Jovany Сообщение #3 1 февраля 2016 в 02:03
Новичок
80
Паспортные сервисы (в частности отделения, специализирующиеся на загранпаспортах) обращаю ваше внимание на данное изобретение =)
AlexeiD Сообщение #4 1 февраля 2016 в 07:24
Супермен
51
Сравнил с ГОСТовскими вариантами.

Транслит сабжа:
- Privet, krasavxcik, xeto samoe, uberi ka svoqu nepodxjemnuqu xzopku otsquda, i ne qornixcaxi tut, a to kak otxwuxcu tebqa, xehehe, wiwki svoi potom ne peresxcitaewj

Старый ГОСТ:
- Privet, krasavchik, ehto samoe, uberi ka svoju nepod''emnuju zhopku otsjuda, i ne jornichajj tut, a to kak otshhuchu tebja, ehkhekhe, shishki svoi potom ne pereschitaesh'

Новый ГОСТ:
- Privet, krasavchik, e'to samoe, uberi ka svoyu nepod''emnuyu zhopku otsyuda, i ne yornichaj tut, a to kak otshhuchu tebya, e'xexe, shishki svoi potom ne pereschitaesh'

Я бы не сказал, что вариант интуитивнее или легче читается.
Только что нет апострофов и букве "щ" не нужны три символа. Но это не убедило меня отказаться от использования старого госта у себя в программах )
Voronov Сообщение #5 1 февраля 2016 в 09:03
Кибергонщик
54
Согласен с AlexeiD, ГОСТ читается намного проще и логичнее.
MMMAAANNN Сообщение #6 1 февраля 2016 в 10:12
Супермен
36
Данная система не столько ориентирована на чтение текста, сколько на удобство его набора.

Для читабельности конвертируем x в циркумфлекс и q - в умляут:

Privet, krasavĉik, êto samoe, uberi ka svoü nepodĵemnuü ẑopku otsüda, i ne örniĉaî tut, a to kak otŵuĉu tebä, êhehe, wiwki svoi potom ne peresĉitaewj

Попробуйте из ГОСТа восстановить кириллический исходник - алгоритм будет существенно сложнее (например, если преобразовать sh раньше, чем shh, можно получить неприятности). Кроме того, апостроф дает некоторые проблемы (не воспринимается как буква и потому разбивает слово надвое; не может быть большой буквой/малой буквой и т. п.) плюс его несколько менее интуитивно удобно печатать. Ну и попробуйте ГОСТом преобразовать туда-обратно "О'Брайен" или "д'Артаньян", например.
Последний раз отредактировано 1 февраля 2016 в 11:07 пользователем MMMAAANNN
AlexeiD Сообщение #7 1 февраля 2016 в 13:37
Супермен
51
Долго писал сообщение, но убилось из-за ссылки.

С диакритикой стало понятнее, но тогда это по сути аналог того же ГОСТ, только варианта А (я писал про вариант Б). Серьезное отличие только в буквах "ъ" и "ь".
Замечание про регистр этих букв - верное, но с практической оговоркой. Всё-таки слова не могут начинаться с этих букв, а значит в художественном тексте можно спокойно заменять их аналоги на строчные буквы. В аббревиатурах они тоже не должны применяться. Ну а если мы говорим про запись фамилий, например, то там без вариантов и в оригинале, и в транслите, должны отображаться только заглавные буквы.
Фамилии с апострофами не будут проблемой, т.к. там не апострофы как символы применяются, а спец. символы типа грависа.
Хотя я согласен, что такая замена - странность варианта Б, наверное можно было подобрать двухсимвольные варианты замены.

Ну и плюсы варианта А я всё-таки для себя не вижу. Алгоритм обратного транслита простейший, хоть 10 символов использовать для замены одной буквы. Скорее умлауты принесут больше мороки, т.к. к сожалению не всегда есть возможность только с уникодом работать, как только всплывёт какой-нибудь KOI-8 (ага, ещё бывает) - проще потушить свет.
Последний раз отредактировано 1 февраля 2016 в 13:43 пользователем AlexeiD
sav1 Сообщение #8 1 февраля 2016 в 14:30
Маньяк
40
Отлично, удачные замены: визуально годные большей частью (ю,ж, ч, я). Давайте словарей, попробуем.

з.ы. тема думаю для раздела академии
Последний раз отредактировано 1 февраля 2016 в 14:31 пользователем sav1
MMMAAANNN Сообщение #9 1 февраля 2016 в 17:17
Супермен
36
Словарей это можно, автоматом нагенерю как-нибудь. Сейчас немного нет времени, если забудется - потормошите в личку.

Чтобы писать в форуме, нужно зарегистрироваться.


Связаться
Выделить
Выделите фрагменты страницы, относящиеся к вашему сообщению
Скрыть сведения
Скрыть всю личную информацию
Отмена