(это для болгарского языка, посмотрите как для русского языка) |
Для кодирования болгарского языка латиницей есть две возможности. Первая - воспринять стандарт кодирования имен, введенный Советом Министров, хотя этот стандарт и не отвечает требованиям краткости и обратимости. Вторая возможность - кодирование, принятое МС. Его применять только для кодировки имен, а для коммуникации между болгарами воспринять второй, более краткий и обратимый стандарт.
В качестве второго, более краткого
и обратимого стандарта, мы предлагаем кодировать 30 букв кириллицы посредством
26 букв латиницы, при этом каждая буква кириллицы соответствует букве латиницы,
за исключением подвоенных (Ю, Я
и Щ) и Ь. Эти
четыре буквы кодируются как ЙУ, ЙА,
ШТ и Й.
А как же будут кодироваться
остальные 26 букв? В отношении 20 - все ясно, так, как в таблице вопросника.
Остается 6 букв, а именно: Й,
Ц, Ъ, Ш,
Ч, Ж. Мы предлагаем буквы Й,
Ц и Ъ кодировать
как J, C и Y,
потому что они звучат сходно и потому что так пишутся в тех славянских
языках, которые пользуются латиницей. И, наконец, потому, что так в существующем
фонетическом расположении клавиатуры.
Остается закодировать Ш,
Ч, Ж. Пока мы не задействовали такие
буквы латиницы, как w,
q, x , и поэтому предлагаем кодировать
их в такой же последовательности ввиду их графической схожести.
Описанный выше вариант кодирования представлен
в таблице ниже. Его можно оценить, нажав на желтую стрелку
и посмотрев второй вариант вопросника, который закодирован таким же образом.
а - a | е - e | к - k | п - p | ф - f | щ - wt |
б - b | ж - x | л - l | р - r | х - h | ъ - y |
в - v | з - z | м - m | с - s | ц - c | ь - j |
г - g | и - i | н - n | т - t | ч - q | ю - ju |
д - d | й - j | о - o | у - u | ш - w | я - ja |
Предложенный вариант имеет три преимущества:
Первое. Этот вариант сравнительно легко выучить, потому что кодирование почти всех букв - логичное, за исключением трех, где логика отсутствует. Речь идет о буквах, кодировку которых просто надо запомнить (Ш, Ч, Ж).
Второе преимущество - краткость. Большинство болгарских букв передается с помощью одной латинской. Исключение составляет только 3 буквы.
Третье преимущество - самое важное. Оно состоит в легкости декодирования. Это потому, что почти все буквы соответствуют друг другу. Ошибка возможна единственно при сдвоенных буквах и Ь. Например, Щека декодируется как Штека, что является ошибкой, но не грубой. Грубая ошибка - это когда Схема декодируется как Шема (т.е. Щека и Штека пишутся по разному, но произносятся почти одинаково). Такие ошибки, хотя и возможны, но допустить их трудно, так как сдвоенные буквы декодируются слитно, за исключением слов: пустошта, нашта, вашта, нашто, вашто. Ошибка возможна еще и потому, что Й, Ь и И с ударением кодируется одной и той же буквой J. Но есть простое правило: если слово отдельное, то - И с ударением, а если следует О и перед ним есть согласная, то - Ь. В остальных случаях - Й.
Одним словом, стандарт простой и обратимый для текста без орфографических ошибок. Мы добавим еще несколько правил, которые позволят включать в текст слова на латинице и сделают кодирование 100% обратимым для произвольного текста (даже если имеются орфографические ошибки). Эти дополнительные правила сделают стандарт несколько сложным, но потребителям не придется их выучивать, вместо них это сделает компьютерная программа.
1.
Дополнительное правило для текста, в который включается слова на латинице,
состоит в том, чтобы это слово бралось с двух сторон в апостроф. Если в
тексте есть апостроф, то его следует заменить двумя апострофами.
2.
Дополнительное правило по разделению сдвоенных букв состоит в том, что
между ними необходимо вставлять символ /.
Например, пустошта будет кодироваться как:
pustow/ta. Имя Майа
будет кодироваться таким образом: Maj/a (есть
такое имя, оно отличается от имени Мая).
3.
Дополнительное правило, связанное с тем, как различать буквы Й,
Ь и И с ударением: просто их надо писать
со знаками #, &
и * перед J.
Разумеется, они будут так писаться только в том случае, если соответствующая
буква используется не по правилам орфографии. Например, предложение: "Й
и Ь са букви" будет кодироваться следующим образом: "#J
i &J sa bukvi".
Для обратной транслитерации (кодирование
посредством кириллицы слова, написанного латиницей) мы рекомендует использовать
ту же таблицу, слово брать в апостроф с обеих сторон. Например, предложение:
"Аз си инсталирах Windows 98" будет кодироваться
как: "Аз си инсталирах 'Шиндошс' 98". Конечно,
о слове Windows, написанном таким образом,
могут догадаться только люди, знающие стандарт. Если же мы не будет настаивать
на спеллинге, а на способе произношения слов, то было бы лучше кодировать
по подражанию звуков. Например, Windows будет
выглядеть как 'Уиндолс'. Звукоподражательное
кодирование особенно рекомендуется в случае, если болгарину необходимо
прочитать речь на языке, которым он не владеет.