MMMAAANNN
|
Сообщение #1
1 февраля 2016 в 01:06
|
Супермен
36 |
Придумал как латинизировать русский алфавит без потери обратимости, при этом каждой русской букве будет сопоставляться не более двух символов латиницы. Система основана на использовании двух букв-модификаторов (которые потенциально можно сделать "мертвыми клавишами" и превращать в диакритику, например). Итак, модификаторы: x добавляет циркумфлекс и преобразует латинскую букву в близко но неидентчно звучащую русскую (почти во всех случаях - согласную); q добавляет умляут и преобразует латинскую букву в близко но неидентично звучащую русскую гласную, смягчая ее. И соответствия остальных букв русского алфавита (криллица - латиница с диакритикой - порядок набора латиницы): а a a б b b в v v г g g д d d е e e ё ö qo ж ẑ xz з z z и i i й î xi к k k л l l м m m н n n о o o п p p р r r с s s т t t у u u ф f f х h h ц c c ч ĉ xc ш w w щ ŵ xw ь j j ы y y ъ ĵ xj э ê xe ю ü qu я ä qa Чем хороша данная система: - Легко запоминается. - Ни одна из букв не требует более двух латинских символов. - Система полностью обратима - в обратную сторону (в кириллицу) преобразуется абсолютно однозначно, никаких тебе двузначностей типа sh - это ш или сх? - На ее основе легко реализовать односимвольное преобразование, заменив модификаторы q и x соответствующей диакритикой, при этом результат будет очень легко читаться неподготовленным русскоязычным человеком. - Потенциально на основе этой системы можно полностью отказаться от раскладки йцукен, нехитрым образом настроив AutoHotKey и используя полюбившуюся вам латинскую раскладку (QWERTY/DVORAK/COLEMAK). - Не требует каких-либо пунктуационных знаков вроде апострофов. Последний раз отредактировано 1 февраля 2016 в 11:59 пользователем MMMAAANNN
|
MMMAAANNN
|
Сообщение #2
1 февраля 2016 в 01:49
|
Супермен
36 |
Унч любезно предоставил простенький транслитератор на java script: http://pastebin.com/P3Wet9V1
|
Jovany
|
Сообщение #3
1 февраля 2016 в 02:03
|
Новичок
80 |
Паспортные сервисы (в частности отделения, специализирующиеся на загранпаспортах) обращаю ваше внимание на данное изобретение =)
|
AlexeiD
|
Сообщение #4
1 февраля 2016 в 07:24
|
Супермен
51 |
Сравнил с ГОСТовскими вариантами.
Транслит сабжа: - Privet, krasavxcik, xeto samoe, uberi ka svoqu nepodxjemnuqu xzopku otsquda, i ne qornixcaxi tut, a to kak otxwuxcu tebqa, xehehe, wiwki svoi potom ne peresxcitaewj
Старый ГОСТ: - Privet, krasavchik, ehto samoe, uberi ka svoju nepod''emnuju zhopku otsjuda, i ne jornichajj tut, a to kak otshhuchu tebja, ehkhekhe, shishki svoi potom ne pereschitaesh'
Новый ГОСТ: - Privet, krasavchik, e'to samoe, uberi ka svoyu nepod''emnuyu zhopku otsyuda, i ne yornichaj tut, a to kak otshhuchu tebya, e'xexe, shishki svoi potom ne pereschitaesh'
Я бы не сказал, что вариант интуитивнее или легче читается. Только что нет апострофов и букве "щ" не нужны три символа. Но это не убедило меня отказаться от использования старого госта у себя в программах )
|
Voronov
|
Сообщение #5
1 февраля 2016 в 09:03
|
Кибергонщик
54 |
Согласен с AlexeiD, ГОСТ читается намного проще и логичнее.
|
MMMAAANNN
|
Сообщение #6
1 февраля 2016 в 10:12
|
Супермен
36 |
Данная система не столько ориентирована на чтение текста, сколько на удобство его набора. Для читабельности конвертируем x в циркумфлекс и q - в умляут: Privet, krasavĉik, êto samoe, uberi ka svoü nepodĵemnuü ẑopku otsüda, i ne örniĉaî tut, a to kak otŵuĉu tebä, êhehe, wiwki svoi potom ne peresĉitaewj Попробуйте из ГОСТа восстановить кириллический исходник - алгоритм будет существенно сложнее (например, если преобразовать sh раньше, чем shh, можно получить неприятности). Кроме того, апостроф дает некоторые проблемы (не воспринимается как буква и потому разбивает слово надвое; не может быть большой буквой/малой буквой и т. п.) плюс его несколько менее интуитивно удобно печатать. Ну и попробуйте ГОСТом преобразовать туда-обратно "О'Брайен" или "д'Артаньян", например. Последний раз отредактировано 1 февраля 2016 в 11:07 пользователем MMMAAANNN
|
AlexeiD
|
Сообщение #7
1 февраля 2016 в 13:37
|
Супермен
51 |
Долго писал сообщение, но убилось из-за ссылки. С диакритикой стало понятнее, но тогда это по сути аналог того же ГОСТ, только варианта А (я писал про вариант Б). Серьезное отличие только в буквах "ъ" и "ь". Замечание про регистр этих букв - верное, но с практической оговоркой. Всё-таки слова не могут начинаться с этих букв, а значит в художественном тексте можно спокойно заменять их аналоги на строчные буквы. В аббревиатурах они тоже не должны применяться. Ну а если мы говорим про запись фамилий, например, то там без вариантов и в оригинале, и в транслите, должны отображаться только заглавные буквы. Фамилии с апострофами не будут проблемой, т.к. там не апострофы как символы применяются, а спец. символы типа грависа. Хотя я согласен, что такая замена - странность варианта Б, наверное можно было подобрать двухсимвольные варианты замены. Ну и плюсы варианта А я всё-таки для себя не вижу. Алгоритм обратного транслита простейший, хоть 10 символов использовать для замены одной буквы. Скорее умлауты принесут больше мороки, т.к. к сожалению не всегда есть возможность только с уникодом работать, как только всплывёт какой-нибудь KOI-8 (ага, ещё бывает) - проще потушить свет. Последний раз отредактировано 1 февраля 2016 в 13:43 пользователем AlexeiD
|
sav1
|
Сообщение #8
1 февраля 2016 в 14:30
|
Маньяк
42 |
Отлично, удачные замены: визуально годные большей частью (ю,ж, ч, я). Давайте словарей, попробуем. з.ы. тема думаю для раздела академии Последний раз отредактировано 1 февраля 2016 в 14:31 пользователем sav1
|
MMMAAANNN
|
Сообщение #9
1 февраля 2016 в 17:17
|
Супермен
36 |
Словарей это можно, автоматом нагенерю как-нибудь. Сейчас немного нет времени, если забудется - потормошите в личку.
|