(за български език) |
Има два различни вида транслитерации, между които трябва да правим разлика. В единия случай говорим за транслитериране, което е предназначено за чужденци (например имената ни в личните карти и географските наименования, изписани на карти, улични табели и пътни знаци). Във втория случай говорим за транслитериране, предназначено за българи (например когато пишем e-mail на български на друг българин, но поради технически проблеми не можем да използваме кирилицата и ни се налага да кодираме на латиница).
За да различи двете понятия, професор Владимир Успенски използва термина транскрипция, когато се касае за транслитериране за чужденци. Професор Любомир Иванов смята, че е по-правилно да се използва терминът транслитерация и в двата случая, но във втория той говори за обратима транслитерация, предназначена за технически цели.
Двата вида транслитерация не могат да бъдат обединени в една транслитерационна схема, защото изискванията към тях са коренно различни и дори противоречиви. Когато транслитерираме за чужденци, ние трябва да го направим звукоподражателно, като при това трябва да изберем определен чужд език и да се съобразим с правилата му. Когато транслитерираме за българи не е нужно да търсим звукоподражателност, защото нашите читатели знаят как да прочетат думите и дори знаят как тези думи се пишат на кирилица. Нужно е само да кодираме кирилския текст на латиница по някаква проста система, която е желателно да бъде обратима, за да може лесно и дори автоматично да може да се възстанови кирилският текст от кодираното на латиница.
За транслитерацията, предназначена за чужденци, смятаме, че трябва да се използва следната транслитерационна схема:
а - a | е - e | к - k | п - p | ф - f | щ - sht |
б - b | ж - zh | л - l | р - r | х - h | ъ - a |
в - v | з - z | м - m | с - s | ц - ts | ь - y |
г - g | и - i | н - n | т - t | ч - ch | ю - yu |
д - d | й - y | о - o | у - u | ш - sh | я - ya |
Горната таблицата е въведена през 1995 г. в Toponymic Guidelines for Antarctica. По-късно тази таблица е узаконена от постановления на МС 61/02.04.1999 и 10/11.02.2000 и се използва от паспортните служби. Също така, тази таблица е включена в българския правописен речник, който е издание на Института за български език към БАН. Ако искате да научите повече за основанията за въвеждането на тази транслитерационна таблица, ви препоръчваме да прочетете статията на професор Любомир Иванов - "On the Romanization of Bulgarian and English". Вижте също така предложенията направени от професор Иванов за обтекаемата транслитерация на руски, украински, белоруски, македонски и сръбски езици.
За обратима транслитерация, предназначена за технически цели, предлагаме
да се кодират 30-те букви на кирилицата чрез 26-те букви на латиницата, като всяка буква си има съответствие на латиница,
с изключение на двойните (Ю, Я
и Щ) и на Ь.
Тези четири букви да се кодират като ЙУ, ЙА,
ШТ
и Й.
Как ще се кодират останалите
26 букви? За 20 е ясно - както в таблицата от въпросника. Остават 6, а
именно: Й, Ц,
Ъ, Ш, Ч,
Ж. Предлагаме буквите Й, Ц
и Ъ да се кодират като J,
C
и Y, защото звучат сходно, защото така се
изписват в славянските езици, използващи латиница и защото така е в съществуващата
фонетична подредба на клавиатурата.
Остава да се кодират Ш,
Ч, Ж. Неизползваните до момента букви
от латиницата са w,
q, x и предлагаме да се кодират в този
ред, заради леката графична прилика.
Така полученият вариант на кодиране
може да се види в таблицата, която следва, но е по-лесно да се оцени, ако
се натисне жълтата стрелка
и се погледне вторият вариант на въпросника, който е кодиран по този начин.
а - a | е - e | к - k | п - p | ф - f | щ - wt |
б - b | ж - x | л - l | р - r | х - h | ъ - y |
в - v | з - z | м - m | с - s | ц - c | ь - j |
г - g | и - i | н - n | т - t | ч - q | ю - ju |
д - d | й - j | о - o | у - u | ш - w | я - ja |
Предимствата на предложения вариант са три:
Първо, той е сравнително лесен за научаване, защото кодирането на почти всички букви е логично, с изключение на три, при които е съвсем нелогично. Тоест, научаването се свежда до запомняне на кодирането на три букви (Ш, Ч, Ж).
Второто предимство е краткостта. Повечето български букви се предават с една латинска. Изключение правят само 3 букви.
Третото и най-важно предимство е, че декодирането е много лесно. Причината за това е, че почти всички букви съответстват едно към едно. Грешка може да се получи само при двойните букви и при Ь. Например Щека може да се декодира като Штека, което е грешка, но не така ужасна, каквато е декодирането на Схема като Шема (тоест Щека и Штека се пишат различно, но се произнасят почти еднакво). Дори такива грешки трудно биха се допуснали, защото двойните букви винаги ще се декодират слято. Грешка може да се допусне и от това, че Й, Ь и И ударено се кодират с една и съща буква J, но правилата са прости. Когато е отделна дума, е И ударено, когато е следвано от О и пред него има съгласна, е Ь, а в останалите случай е Й.
Дотук стандартът е прост и на практика е обратим за текстове без правописни грешки. Ще добавим още четири правила, които ще позволят в текста да има включени думи на латиница и ще направят кодирането 100% обратимо за произволен текст (дори ако е с правописни грешки). Тези четири допълнителни правила ще усложнят стандарта, но можем да предполагаме, че хората няма да ги учат и няма да ги ползват, а само компютърните програми ще ги прилагат.
1. Допълнителното правило за текст,
включващ думи на латиница, е тези думи да се заграждат в апострофи. Ако
в текста има апостроф, то той трябва да се замени с два апострофа.
(При декодирането няма да се прави разлика между символа апостроф и символите отварящ и затварящ апостроф, защото някои текстови редактори
автоматично заменят този символ с отварящи и затварящи апострофи. Затова петте отварящи и затварящи апострофи (‘ ’ ‚ ‹ ›)
също ще се удвояват. Unicode номерата на тези символи са U+2018, U+2019, U+201A, U+2039, U+203A.)
2. Допълнително правило за разделяне
на двойни букви е да се пише между тях символа / (наклонена черта).
Например пустошта ще се кодира като
pustow/ta, а
името Майа ще се кодира като Maj/a
(има такова име и то е различно от Мая).
Ако пишещият на латиница не знае това правило и напише пустошта като pustowta, то при декодирането ще се получи пустоща вместо пустошта.
Това не е голям проблем, защото членуваната форма на българската дума пустош е на практика единствената дума, която се кодира чрез това правило.
3. Допълнително правило за различаване
на буквите Й, Ь
и И ударено е да се пишат знаците #,
&
и * пред
J. Разбира
се, те ще се пишат само ако съответната буква е използвана не по правилата
на правописа. Например изречението:
"Й и Ь са букви"
ще се кодира така: "#J i &J sa bukvi".
(Правилата на правописа казват, че когато J е отделна дума, то тогава трябва да се декодира като
И ударено. Когато J е в началото на дума или след гласна,
то тогава трябва да се декодира като Й. В останалите случаи J
трябва да се декодира като Ь. Тези правила са за случая, в който не е изрично отбелязано
правилното декодиране чрез някой от символите #,
& или *.)
4. Допълнително правило за кодирането на символите
/, #, &
и *. Тези символи се заграждат в апострофи, когато в противен случай може да се получи колизия с правилата 2 и 3.
Например последователностите от символи ш/т и т#ьо се кодират съответно w'/'t и t'#'&jo.
За обратната транслитерация
(кодиране чрез кирилица на дума, написана на латиница) ще препоръчаме да
се използва същата таблица и думата да се огражда с апострофи. Например
изречението: "Аз си инсталирах Windows 98"
ще се кодира така: "Аз си инсталирах 'Шиндошс' 98".
Разбира се, че думата Windows, написана по
този начин, може да се познае само от хора, които знаят стандарта. Ако
не държим на спелинга, а на начина, по който думите се произнасят, то ще
е по-добре да кодираме звукоподражателно. Например Windows
ще изглежда като 'Уиндолс'. Звукоподражателното
кодиране е особено подходящо, когато българин трябва да прочете реч на
чужд език, който не владее.