|
За кодиране на български език на латиница има две възможности. Първата е да се ползва стандартът за кодиране на имена, приет от Министерския съвет, макар този стандарт да не отговаря на изискванията за краткост и обратимост. Втората възможност е кодирането, прието от МС, да остане валидно само за кодиране на имена, а за комуникация между българи да се приеме втори, по-кратък и обратим стандарт.
За втори, по-кратък и обратим
стандарт предлагаме да се кодират 30-те букви на кирилицата чрез 26-те
букви на латиницата, като всяка буква си има съответствие на латиница,
с изключение на двойните (Ю, Я
и Щ) и на Ь.
Тези четири букви да се кодират като ЙУ, ЙА,
ШТ
и Й.
Как ще се кодират останалите
26 букви? За 20 е ясно - както в таблицата от въпросника. Остават 6, а
именно: Й, Ц,
Ъ, Ш, Ч,
Ж. Предлагаме буквите Й, Ц
и Ъ да се кодират като J,
C
и Y, защото звучат сходно, защото така се
изписват в славянските езици, използващи латиница и защото така е в съществуващата
фонетична подредба на клавиатурата.
Остава да се кодират Ш,
Ч, Ж. Неизползваните до момента букви
от латиницата са w,
q, x и предлагаме да се кодират в този
ред, заради леката графична прилика.
Така полученият вариант на кодиране
може да се види в таблицата, която следва, но е по-лесно да се оцени, ако
се натисне жълтата стрелка
и се погледне вторият вариант на въпросника, който е кодиран по този начин.
а - a | е - e | к - k | п - p | ф - f | щ - wt |
б - b | ж - x | л - l | р - r | х - h | ъ - y |
в - v | з - z | м - m | с - s | ц - c | ь - j |
г - g | и - i | н - n | т - t | ч - q | ю - ju |
д - d | й - j | о - o | у - u | ш - w | я - ja |
Предимствата на предложения вариант са три:
Първо, той е сравнително лесен за научаване, защото кодирането на почти всички букви е логично с изключение на три, при които е съвсем нелогично. Тоест, научаването се свежда до запомняне на кодирането на три букви (Ш, Ч, Ж).
Второто предимство е, че повечето български букви се предават с една латинска. Изключение правят само 3 букви.
Третото и най-важно предимство е, че декодирането е много лесно. Причината за това е, че почти всички букви съответстват едно към едно. Грешка може да се получи само при двойните букви и при Ь. Например Щека може да се декодира като Штека, което е грешка, но не така ужасна, каквато е декодирането на Схема като Шема (тоест Щека и Штека се пишат различно, но се произнасят почти еднакво). Дори такива грешки трудно биха се допуснали, защото двойните букви ще се декодират слято с изключение само на думите: пустошта, нашта, вашта, нашто, вашто. Грешка може да се допусне и от това, че Й, Ь и И ударено се кодират с една и съща буква J, но правилата са прости. Когато е отделна дума, е И ударено, когато е следвано от О и пред него има съгласна, е Ь, а в останалите случай е Й.
Дотук стандартът е прост и е
обратим за текст без правописни грешки. Ще добавим още правила, които ще
позволят в текста да има включени думи на латиница и ще направят кодирането
100%
обратимо за произволен текст (дори ако е с правописни грешки). Тези допълнителни
правила ще усложнят стандарта, но можем да предполагаме, че хората няма
да ги учат, а само компютърната програма ще ги знае.
Допълнителното правило за текст,
включващ думи на латиница, е тези думи да се заграждат в апострофи. Ако
в текста има апостроф, то той трябва да се замени с два апострофа.
Допълнително правило за разделяне
на двойни букви е да се пише | между тях.
Например името Майа ще се кодира така: Maj|a
(има такова име и то е различно от Мая). Допълнително
правило за сливане на двойни букви е да се пише ^
между тях. Например пустоща ще се кодира така:
pustow^ta
(това е правописна грешка, но ние може да пишем и грешно, ако поискаме).
Допълнително правило за различаване
на буквите Й, Ь
и И ударено е да се пишат знаците #,
& и * след
J.
Разбира се, те ще се пишат само ако съответната буква е използвана не по
правилата на правописа. Например изречението:
"Й
и Ь са букви" ще се кодира така: "J# i J&
sa bukvi".
За обратната транслитерация
(кодиране чрез кирилица на дума, написана на латиница) ще препоръчаме да
се използва същата таблица и думата да се огражда с апострофи. Например
изречението: "Аз си инсталирах Windows 98"
ще се кодира така: "Аз си инсталирах 'Шиндошс' 98".
Разбира се, че думата Windows, написана по
този начин, може да се познае само от хора, които знаят стандарта. Ако
не държим на спелинга, а на начина, по който думите се произнасят, то ще
е по-добре да кодираме звукоподражателно. Например Windows
ще изглежда като 'Уиндолс'. Звукоподражателното
кодиране е особено подходящо, когато българин трябва да прочете реч на
чужд език, който не владее.