Thursday, April 17, 2008

"Classical Mongolian to Latin" transliteration table contributed to Lingua::Translit package...

Хуучин Монгол бичгийн латин галигийн хүснэгт Lingua::Translit багцад орлоо...

Lingua::Translit багцийг хөгжүүлэгч Alex Linke-н туслалцаатайгаар Хуучин Монгол бичгийн латин галигийн хүснэгт Lingua::Translit багцийн 0.09 хувилбарт багтлаа.


Хуучин Монгол бичгийн латин галигийн хүснэгт үүсгэхэд тулгарсан асуудлууд, тэдгээрийг шийдвэрлэх нь:

1. Албан ёсны стандартыг хайгаад олоогүй болохоор:

- монголч эрдэмтэн N.Poppe-гийн хүснэгт (page25 Грамматика Письменно-Монгольского Языка, Академии Наук СССР, Ленинград,1937)
- М.Эрдэнэчимэг эгчийн Report-170 (UNU/IIST, Macao, 1999)
- википедиа дээрх хүснэгт болон T.Pederson-ы хүснэгт (Eesti Keele Instituut, Tallinn, 2006)
- LinguaMongolia.co.uk дээрх Emyr.P-н ажлуудын дотроос Д.Нацагдоржийн шүлгүүд, "Монголын Нууц Товчоо"-ны хятад болон монгол галигууд (2005-2006)
- mongolxel.webz.cz дээрх Б.Сумъяабаатар гуайн "Монголын нууц товчоон"-ны хятад болон монгол галигууд (ШУА, Улаанбаатар, 1990)
- mongolxel.webz.cz дээрх Lajos Ligeti-н "Монголын нууц товчоон"-ны монгол галиг (Akadémiai Kiadó, Budapest, 1971)
- Altaica.narod.ru дээрх E.Haenisch-н "Юан Улсын түүх"-н латин галиг (Abhandlungen der deutschen Akademie der Wissenschaften, Berlin, 1950)

зэргийг судалгааны материал болгон харицуулан судалж, common_classical_mon.xml дүрмийн файлыг үүсгэлээ.



2. Судалгааны ажилд ашиглах бэлэн галигласан текстийн ховор байдал...
Интернетээр хайж олдсон, дээр дурдсан электрон текстүүдийг common_classical_mon.xml дүрмийн файлыг шалгахад хэрэглэсэн. Судалгааны материалын хомсдмол байдлаас үүдэн манж, шивээ, тод, али гали үсгүүдийн латин галиг энэ файлд багтаагүй байгаа. Цаашид электрон бус, цаасан дээр хэвлэгдсэн материалуудыг ашиглан 1-рт илүү өргөн хэмжээний корпусаар дүрмийн файлыг шалгах, 2-рт дээрх үсгүүдийн латин галигийг цаашид нэмэх төлөвлөгөөтэй байна.

Ингээд Хуучин монгол бичгийн латин галигийн хүснэгтийг дараах байдалтай үүсгэлээ.

Эгшиг үсгүүд:

Үсгийн нэр

Галиг

Unicode (Basic Set)

Криллээр

Report170

char

char code

char

char code

1

Эгшиг үсэг А

Mongolian letter A

a

U+0061

U+1820

2

Эгшиг үсэг Э

Mongolian letter E

e

U+0065

U+1821

3

Эгшиг үсэг И

Mongolian letter I

i

U+0069

U+1822

4

Эгшиг үсэг О

Mongolian letter O

o

U+006F

U+1823

5

Эгшиг үсэг У

Mongolian letter U

u

U+0075

U+1824

6

Эгшиг үсэг Ө

Mongolian letter OE

ö

U+00F6

U+1825

7

Эгшиг үсэг Ү

Mongolian letter UE

ü

U+00FC

U+1826

8

Эгшиг үсэг Е

Mongolian letter EE

ē

U+0113

U+1827


Гийг
үүлэгч үсгүүд:


Үсгийн нэр

Галиг

Unicode (Basic Set)


Криллээр

Report170

char

char code

char

char code

1

Гийгүүлэгч үсэг Н

Mongolian letter NA

n

U+006E

U+1828

2

Гийгүүлэгч үсэг НГ

Mongolian letter ANG

ng

(U+006E)(U+0067)

U+1829

3

Гийгүүлэгч үсэг Б

Mongolian letter BA

b

U+0062

U+182A

4

Гийгүүлэгч үсэг П

Mongolian letter PA

p

U+0070

U+182B

5

Гийгүүлэгч үсэг Х
(эр
үгийн)

Mongolian letter QA

q

U+0071

U+182C


Гийгүүлэгч үсэг Х
(эм
үгийн)

Mongolian letter QA

k

U+006B

U+182C

6

Гийгүүлэгч үсэг Г
(эр
үгийн)

Mongolian letter GA

ɣ

U+0263

U+182D


Гийгүүлэгч үсэг Г
(эм
үгийн)

Mongolian letter GA

g

U+0067

U+182D

7

Гийгүүлэгч үсэг М

Mongolian letter MA

m

U+006D

U+182E

8

Гийгүүлэгч үсэг Л

Mongolian letter LA

l

U+006C

U+182F

9

Гийгүүлэгч үсэг С

Mongolian letter SA

s

U+0073

U+1830

10

Гийгүүлэгч үсэг Ш

Mongolian letter SHA

š

U+0161

U+1831

11

Гийгүүлэгч үсэг Т

Mongolian letter TA

t

U+0074

U+1832

12

Гийгүүлэгч үсэг Д

Mongolian letter DA

d

U+0064

U+1833

13

Гийгүүлэгч үсэг Ц, Ч

Mongolian letter CHA

č

U+010D

U+1834

14

Гийгүүлэгч үсэг Ж, З

Mongolian letter JA

j

U+006A

U+1835

15

Гийгүүлэгч үсэг Й, Я

Mongolian letter YA

y

U+0079

U+1836

16

Гийгүүлэгч үсэг Р

Mongolian letter RA

r

U+0072

U+1837

17

Гийгүүлэгч үсэг В

Mongolian letter WA

w,v

U+0077, U+0076

U+1838

18

Гийгүүлэгч үсэг Ф

Mongolian letter FA

f

U+0066

U+1839

19

Гийгүүлэгч үсэг К

Mongolian letter KA

U+1E33

U+183A

20

Гийгүүлэгч үсэг К

Mongolian letter KHA

ǩ

U+01E9

U+183B

21

Гийгүүлэгч үсэг Ц

Mongolian letter TSA

c

U+0063

U+183C

22

Гийгүүлэгч үсэг З

Mongolian letter ZA

z

U+007A

U+183D

23

Гийгүүлэгч үсэг Х

Mongolian letter HAA

h

U+0068

U+183E

24

Гийгүүлэгч үсэг Ж

Mongolian letter ZRA

ž

U+017E

U+183F

25

Гийгүүлэгч үсэг ЛХ

Mongolian letter LHA

lh

(U+006C)(U+0068)

U+1840

26

Гийгүүлэгч үсэг

Mongolian letter ZHI

zh

(U+007A)(U+0068)

U+1841

27

Гийгүүлэгч үсэг

Mongolian letter CHI

ch

(U+0063)(U+0068)

U+1842



Туслах тэмдэгт
үүд:

Тэмдэгтийн нэр

Галиг

Unicode (Basic Set)

Криллээр

Report170

char

char code

char

char code

1

Бирга

Mongolian Birga

§

U+00A7

U+1800

2

Тодорхойлох гурван цэг

Mongolian Ellipsis

U+2026

U+1801

3

Таслал

Mongolian Comma

,

U+002C

U+1802

4

Цэг

Mongolian Full Stop

.

U+002E

U+1803

5

Тодорхойлох хоёр цэг

Mongolian Colon

:

U+003A

U+1804

6

Бүлгийн төгсгөл

Mongolian Four Dots

U+00B6

U+1805

7

Эгшиг тусгаарлагч

Mongolian Vowel Seperator

-

U+002D

U+180E


Цифр
үүд:

Цифрийн нэр

Галиг

Unicode (Basic Set)

Криллээр

Report170

char

char code

char

char code

1

тэг

Mongolian Digit Zero

0

U+0030

U+1810

2

нэг

Mongolian Digit One

1

U+0031

U+1811

3

хоёр

Mongolian Digit Two

2

U+0032

U+1812

4

гурав

Mongolian Digit Three

3

U+0033

U+1813

5

дөрөв

Mongolian Digit Four

4

U+0034

U+1814

6

тав

Mongolian Digit Five

5

U+0035

U+1815

7

зургаа

Mongolian Digit Six

6

U+0036

U+1816

8

долоо

Mongolian Digit Seven

7

U+0037

U+1817

9

найм

Mongolian Digit Eight

8

U+0038

U+1818

10

ес

Mongolian Digit Nine

9

U+0039

U+1819





Lingua::Translit багцын өөрийгөө тестлэх тест файлд оруулсан хуучин монгол текстүүд:

1. Д.Нацагдоржийн "Миний нутаг", http://www.linguamongolia.co.uk/ дээрх галигаар.

Үндсэн тэмдэгтийн олонлог:
"ᠬᠡᠨᠲᠡᠢ ᠂ ᠬᠠᠩᠭᠠᠢ ᠂ ᠰᠣᠶᠣᠨ᠎ᠤ ᠥᠨᠳᠦᠷ ᠰᠠᠶᠢᠬᠠᠨ ᠨᠢᠷᠤᠭᠤᠨ᠎ᠤᠳ " .
"ᠬᠣᠶᠢᠲᠤ ᠵᠦᠭ᠎ᠦᠨ ᠴᠢᠮᠡᠭ ᠪᠣᠯᠤᠭᠰᠠᠨ ᠣᠢ ᠬᠥᠪᠴᠢ᠎ᠶᠢᠨ ᠠᠭᠤᠯᠠᠨ᠎ᠤᠳ " .
"ᠮᠡᠨᠡᠨ ᠂ ᠱᠠᠷᠭ᠎ᠠ ᠂ ᠨᠣᠮᠢᠨ᠎ᠤ ᠥᠷᠭᠡᠨ ᠶᠡᠬᠡ ᠭᠣᠪᠢ᠎ᠤᠳ " .
"ᠡᠮᠦᠨ᠎ᠡ ᠵᠦᠭ᠎ᠦᠨ ᠮᠠᠩᠯᠠᠢ ᠪᠣᠯᠤᠭᠰᠠᠨ ᠡᠯᠡᠰᠦᠨ ᠮᠠᠩᠬᠠᠨ ᠳᠠᠯᠠᠢ᠎ᠤᠳ " .
"ᠡᠨᠡ ᠪᠣᠯ ᠮᠢᠨᠤ ᠲᠥᠷᠦᠭᠰᠡᠨ ᠨᠤᠲᠤᠭ ᠮᠣᠩᠭᠣᠯ᠎ᠤᠨ ᠰᠠᠶᠢᠬᠠᠨ ᠣᠷᠣᠨ ᠃";

Латин галиг: "kentei , qangɣai , soyon-u öndür sayiqan niruɣun-ud " .
"qoyitu jüg-ün čimeg boluɣsan oi köbči-yin aɣulan-ud " .
"menen , šarɣ-a , nomin-u örgen yeke ɣobi-ud " .
"emün-e jüg-ün manglai boluɣsan elesün mangqan dalai-ud " .
"ene bol minu törügsen nutuɣ mongɣol-un sayiqan oron .";


2. "Монголын Нууц Товчоо"-ны хэсгээс, Б.Сумъяабаатар гуайн галигаар.

Үндсэн тэмдэгтийн олонлог:
"ᠬᠠᠷᠴᠤ᠎ᠶᠢᠨ ᠬᠥᠪᠡᠭᠦᠨ ᠪᠣᠷᠵᠢᠭᠢᠳᠠᠢ᠎ᠮᠡᠷᠭᠡᠨ᠂ ᠮᠣᠩᠭᠣᠯᠵᠢᠨ᠎ᠭᠣᠣ᠎ᠠ ᠭᠡᠷᠭᠡᠢᠲᠦ ᠠᠵᠤᠭᠤ᠃ ᠪᠣᠷᠵᠢᠭᠢᠳᠠᠢ᠎ᠮᠡᠷᠭᠡᠨ᠎ᠤ ᠬᠥᠪᠡᠭᠦᠨ ᠲᠣᠷᠣᠭᠣᠯᠵᠢᠨ᠎ᠪᠠᠶᠠᠨ᠂ ᠪᠣᠷᠣᠭᠴᠢᠨ᠎ᠭᠣᠣ᠎ᠠ ᠭᠡᠷᠭᠡᠢᠲᠦ᠂ ᠪᠣᠷᠣᠯᠳᠠᠢ ᠰᠤᠶᠠᠯᠪᠢ ᠵᠠᠯᠠᠭᠤᠲᠤ᠂ ᠳᠠᠶᠢᠷ ᠪᠣᠷᠣ ᠬᠣᠶᠠᠷ ᠬᠦᠯᠦᠭᠦᠳ ᠠᠭᠲᠠᠰᠲᠤ ᠪᠦᠯᠡᠭᠡ᠃ ᠲᠣᠷᠣᠭᠣᠯᠵᠢᠨ᠎ᠤ ᠬᠥᠪᠡᠭᠦᠨ ᠳᠤᠸᠠ᠎ᠰᠣᠬᠣᠷ ᠳᠣᠪᠤᠨ᠎ᠮᠡᠷᠭᠡᠨ ᠬᠣᠶᠠᠷ ᠪᠦᠯᠡᠭᠡ᠃";

Латин галиг:
"qarču-yin köbegün borjiɣidai-mergen, mongɣoljin-ɣoo-a gergeitü ajuɣu. borjiɣidai-mergen-u köbegün toroɣoljin-bayan, boroɣčin-ɣoo-a gergeitü, boroldai suyalbi jalaɣutu, dayir boro qoyar külügüd aɣtastu bülege. toroɣoljin-u köbegün duva-soqor dobun-mergen qoyar bülege.";


PS: xml дүрмийн файлыг хөрвүүлэхэд нэг асуудал гарсан нь MVS(Mongolian Vowel Selector), U+180E тэмдэгтийг XML::Simple ба XML::SAX::PurePerl багцууд танихгүй байсан юм. Багцийг хөгжүүлэгчид мэдэгдсэн бөгөөд удахгүй засагдах байх.