Thursday, April 17, 2008

"Classical Mongolian to Latin" transliteration table contributed to Lingua::Translit package...

Хуучин Монгол бичгийн латин галигийн хүснэгт Lingua::Translit багцад орлоо...

Lingua::Translit багцийг хөгжүүлэгч Alex Linke-н туслалцаатайгаар Хуучин Монгол бичгийн латин галигийн хүснэгт Lingua::Translit багцийн 0.09 хувилбарт багтлаа.


Хуучин Монгол бичгийн латин галигийн хүснэгт үүсгэхэд тулгарсан асуудлууд, тэдгээрийг шийдвэрлэх нь:

1. Албан ёсны стандартыг хайгаад олоогүй болохоор:

- монголч эрдэмтэн N.Poppe-гийн хүснэгт (page25 Грамматика Письменно-Монгольского Языка, Академии Наук СССР, Ленинград,1937)
- М.Эрдэнэчимэг эгчийн Report-170 (UNU/IIST, Macao, 1999)
- википедиа дээрх хүснэгт болон T.Pederson-ы хүснэгт (Eesti Keele Instituut, Tallinn, 2006)
- LinguaMongolia.co.uk дээрх Emyr.P-н ажлуудын дотроос Д.Нацагдоржийн шүлгүүд, "Монголын Нууц Товчоо"-ны хятад болон монгол галигууд (2005-2006)
- mongolxel.webz.cz дээрх Б.Сумъяабаатар гуайн "Монголын нууц товчоон"-ны хятад болон монгол галигууд (ШУА, Улаанбаатар, 1990)
- mongolxel.webz.cz дээрх Lajos Ligeti-н "Монголын нууц товчоон"-ны монгол галиг (Akadémiai Kiadó, Budapest, 1971)
- Altaica.narod.ru дээрх E.Haenisch-н "Юан Улсын түүх"-н латин галиг (Abhandlungen der deutschen Akademie der Wissenschaften, Berlin, 1950)

зэргийг судалгааны материал болгон харицуулан судалж, common_classical_mon.xml дүрмийн файлыг үүсгэлээ.



2. Судалгааны ажилд ашиглах бэлэн галигласан текстийн ховор байдал...
Интернетээр хайж олдсон, дээр дурдсан электрон текстүүдийг common_classical_mon.xml дүрмийн файлыг шалгахад хэрэглэсэн. Судалгааны материалын хомсдмол байдлаас үүдэн манж, шивээ, тод, али гали үсгүүдийн латин галиг энэ файлд багтаагүй байгаа. Цаашид электрон бус, цаасан дээр хэвлэгдсэн материалуудыг ашиглан 1-рт илүү өргөн хэмжээний корпусаар дүрмийн файлыг шалгах, 2-рт дээрх үсгүүдийн латин галигийг цаашид нэмэх төлөвлөгөөтэй байна.

Ингээд Хуучин монгол бичгийн латин галигийн хүснэгтийг дараах байдалтай үүсгэлээ.

Эгшиг үсгүүд:

Үсгийн нэр

Галиг

Unicode (Basic Set)

Криллээр

Report170

char

char code

char

char code

1

Эгшиг үсэг А

Mongolian letter A

a

U+0061

U+1820

2

Эгшиг үсэг Э

Mongolian letter E

e

U+0065

U+1821

3

Эгшиг үсэг И

Mongolian letter I

i

U+0069

U+1822

4

Эгшиг үсэг О

Mongolian letter O

o

U+006F

U+1823

5

Эгшиг үсэг У

Mongolian letter U

u

U+0075

U+1824

6

Эгшиг үсэг Ө

Mongolian letter OE

ö

U+00F6

U+1825

7

Эгшиг үсэг Ү

Mongolian letter UE

ü

U+00FC

U+1826

8

Эгшиг үсэг Е

Mongolian letter EE

ē

U+0113

U+1827


Гийг
үүлэгч үсгүүд:


Үсгийн нэр

Галиг

Unicode (Basic Set)


Криллээр

Report170

char

char code

char

char code

1

Гийгүүлэгч үсэг Н

Mongolian letter NA

n

U+006E

U+1828

2

Гийгүүлэгч үсэг НГ

Mongolian letter ANG

ng

(U+006E)(U+0067)

U+1829

3

Гийгүүлэгч үсэг Б

Mongolian letter BA

b

U+0062

U+182A

4

Гийгүүлэгч үсэг П

Mongolian letter PA

p

U+0070

U+182B

5

Гийгүүлэгч үсэг Х
(эр
үгийн)

Mongolian letter QA

q

U+0071

U+182C


Гийгүүлэгч үсэг Х
(эм
үгийн)

Mongolian letter QA

k

U+006B

U+182C

6

Гийгүүлэгч үсэг Г
(эр
үгийн)

Mongolian letter GA

ɣ

U+0263

U+182D


Гийгүүлэгч үсэг Г
(эм
үгийн)

Mongolian letter GA

g

U+0067

U+182D

7

Гийгүүлэгч үсэг М

Mongolian letter MA

m

U+006D

U+182E

8

Гийгүүлэгч үсэг Л

Mongolian letter LA

l

U+006C

U+182F

9

Гийгүүлэгч үсэг С

Mongolian letter SA

s

U+0073

U+1830

10

Гийгүүлэгч үсэг Ш

Mongolian letter SHA

š

U+0161

U+1831

11

Гийгүүлэгч үсэг Т

Mongolian letter TA

t

U+0074

U+1832

12

Гийгүүлэгч үсэг Д

Mongolian letter DA

d

U+0064

U+1833

13

Гийгүүлэгч үсэг Ц, Ч

Mongolian letter CHA

č

U+010D

U+1834

14

Гийгүүлэгч үсэг Ж, З

Mongolian letter JA

j

U+006A

U+1835

15

Гийгүүлэгч үсэг Й, Я

Mongolian letter YA

y

U+0079

U+1836

16

Гийгүүлэгч үсэг Р

Mongolian letter RA

r

U+0072

U+1837

17

Гийгүүлэгч үсэг В

Mongolian letter WA

w,v

U+0077, U+0076

U+1838

18

Гийгүүлэгч үсэг Ф

Mongolian letter FA

f

U+0066

U+1839

19

Гийгүүлэгч үсэг К

Mongolian letter KA

U+1E33

U+183A

20

Гийгүүлэгч үсэг К

Mongolian letter KHA

ǩ

U+01E9

U+183B

21

Гийгүүлэгч үсэг Ц

Mongolian letter TSA

c

U+0063

U+183C

22

Гийгүүлэгч үсэг З

Mongolian letter ZA

z

U+007A

U+183D

23

Гийгүүлэгч үсэг Х

Mongolian letter HAA

h

U+0068

U+183E

24

Гийгүүлэгч үсэг Ж

Mongolian letter ZRA

ž

U+017E

U+183F

25

Гийгүүлэгч үсэг ЛХ

Mongolian letter LHA

lh

(U+006C)(U+0068)

U+1840

26

Гийгүүлэгч үсэг

Mongolian letter ZHI

zh

(U+007A)(U+0068)

U+1841

27

Гийгүүлэгч үсэг

Mongolian letter CHI

ch

(U+0063)(U+0068)

U+1842



Туслах тэмдэгт
үүд:

Тэмдэгтийн нэр

Галиг

Unicode (Basic Set)

Криллээр

Report170

char

char code

char

char code

1

Бирга

Mongolian Birga

§

U+00A7

U+1800

2

Тодорхойлох гурван цэг

Mongolian Ellipsis

U+2026

U+1801

3

Таслал

Mongolian Comma

,

U+002C

U+1802

4

Цэг

Mongolian Full Stop

.

U+002E

U+1803

5

Тодорхойлох хоёр цэг

Mongolian Colon

:

U+003A

U+1804

6

Бүлгийн төгсгөл

Mongolian Four Dots

U+00B6

U+1805

7

Эгшиг тусгаарлагч

Mongolian Vowel Seperator

-

U+002D

U+180E


Цифр
үүд:

Цифрийн нэр

Галиг

Unicode (Basic Set)

Криллээр

Report170

char

char code

char

char code

1

тэг

Mongolian Digit Zero

0

U+0030

U+1810

2

нэг

Mongolian Digit One

1

U+0031

U+1811

3

хоёр

Mongolian Digit Two

2

U+0032

U+1812

4

гурав

Mongolian Digit Three

3

U+0033

U+1813

5

дөрөв

Mongolian Digit Four

4

U+0034

U+1814

6

тав

Mongolian Digit Five

5

U+0035

U+1815

7

зургаа

Mongolian Digit Six

6

U+0036

U+1816

8

долоо

Mongolian Digit Seven

7

U+0037

U+1817

9

найм

Mongolian Digit Eight

8

U+0038

U+1818

10

ес

Mongolian Digit Nine

9

U+0039

U+1819





Lingua::Translit багцын өөрийгөө тестлэх тест файлд оруулсан хуучин монгол текстүүд:

1. Д.Нацагдоржийн "Миний нутаг", http://www.linguamongolia.co.uk/ дээрх галигаар.

Үндсэн тэмдэгтийн олонлог:
"ᠬᠡᠨᠲᠡᠢ ᠂ ᠬᠠᠩᠭᠠᠢ ᠂ ᠰᠣᠶᠣᠨ᠎ᠤ ᠥᠨᠳᠦᠷ ᠰᠠᠶᠢᠬᠠᠨ ᠨᠢᠷᠤᠭᠤᠨ᠎ᠤᠳ " .
"ᠬᠣᠶᠢᠲᠤ ᠵᠦᠭ᠎ᠦᠨ ᠴᠢᠮᠡᠭ ᠪᠣᠯᠤᠭᠰᠠᠨ ᠣᠢ ᠬᠥᠪᠴᠢ᠎ᠶᠢᠨ ᠠᠭᠤᠯᠠᠨ᠎ᠤᠳ " .
"ᠮᠡᠨᠡᠨ ᠂ ᠱᠠᠷᠭ᠎ᠠ ᠂ ᠨᠣᠮᠢᠨ᠎ᠤ ᠥᠷᠭᠡᠨ ᠶᠡᠬᠡ ᠭᠣᠪᠢ᠎ᠤᠳ " .
"ᠡᠮᠦᠨ᠎ᠡ ᠵᠦᠭ᠎ᠦᠨ ᠮᠠᠩᠯᠠᠢ ᠪᠣᠯᠤᠭᠰᠠᠨ ᠡᠯᠡᠰᠦᠨ ᠮᠠᠩᠬᠠᠨ ᠳᠠᠯᠠᠢ᠎ᠤᠳ " .
"ᠡᠨᠡ ᠪᠣᠯ ᠮᠢᠨᠤ ᠲᠥᠷᠦᠭᠰᠡᠨ ᠨᠤᠲᠤᠭ ᠮᠣᠩᠭᠣᠯ᠎ᠤᠨ ᠰᠠᠶᠢᠬᠠᠨ ᠣᠷᠣᠨ ᠃";

Латин галиг: "kentei , qangɣai , soyon-u öndür sayiqan niruɣun-ud " .
"qoyitu jüg-ün čimeg boluɣsan oi köbči-yin aɣulan-ud " .
"menen , šarɣ-a , nomin-u örgen yeke ɣobi-ud " .
"emün-e jüg-ün manglai boluɣsan elesün mangqan dalai-ud " .
"ene bol minu törügsen nutuɣ mongɣol-un sayiqan oron .";


2. "Монголын Нууц Товчоо"-ны хэсгээс, Б.Сумъяабаатар гуайн галигаар.

Үндсэн тэмдэгтийн олонлог:
"ᠬᠠᠷᠴᠤ᠎ᠶᠢᠨ ᠬᠥᠪᠡᠭᠦᠨ ᠪᠣᠷᠵᠢᠭᠢᠳᠠᠢ᠎ᠮᠡᠷᠭᠡᠨ᠂ ᠮᠣᠩᠭᠣᠯᠵᠢᠨ᠎ᠭᠣᠣ᠎ᠠ ᠭᠡᠷᠭᠡᠢᠲᠦ ᠠᠵᠤᠭᠤ᠃ ᠪᠣᠷᠵᠢᠭᠢᠳᠠᠢ᠎ᠮᠡᠷᠭᠡᠨ᠎ᠤ ᠬᠥᠪᠡᠭᠦᠨ ᠲᠣᠷᠣᠭᠣᠯᠵᠢᠨ᠎ᠪᠠᠶᠠᠨ᠂ ᠪᠣᠷᠣᠭᠴᠢᠨ᠎ᠭᠣᠣ᠎ᠠ ᠭᠡᠷᠭᠡᠢᠲᠦ᠂ ᠪᠣᠷᠣᠯᠳᠠᠢ ᠰᠤᠶᠠᠯᠪᠢ ᠵᠠᠯᠠᠭᠤᠲᠤ᠂ ᠳᠠᠶᠢᠷ ᠪᠣᠷᠣ ᠬᠣᠶᠠᠷ ᠬᠦᠯᠦᠭᠦᠳ ᠠᠭᠲᠠᠰᠲᠤ ᠪᠦᠯᠡᠭᠡ᠃ ᠲᠣᠷᠣᠭᠣᠯᠵᠢᠨ᠎ᠤ ᠬᠥᠪᠡᠭᠦᠨ ᠳᠤᠸᠠ᠎ᠰᠣᠬᠣᠷ ᠳᠣᠪᠤᠨ᠎ᠮᠡᠷᠭᠡᠨ ᠬᠣᠶᠠᠷ ᠪᠦᠯᠡᠭᠡ᠃";

Латин галиг:
"qarču-yin köbegün borjiɣidai-mergen, mongɣoljin-ɣoo-a gergeitü ajuɣu. borjiɣidai-mergen-u köbegün toroɣoljin-bayan, boroɣčin-ɣoo-a gergeitü, boroldai suyalbi jalaɣutu, dayir boro qoyar külügüd aɣtastu bülege. toroɣoljin-u köbegün duva-soqor dobun-mergen qoyar bülege.";


PS: xml дүрмийн файлыг хөрвүүлэхэд нэг асуудал гарсан нь MVS(Mongolian Vowel Selector), U+180E тэмдэгтийг XML::Simple ба XML::SAX::PurePerl багцууд танихгүй байсан юм. Багцийг хөгжүүлэгчид мэдэгдсэн бөгөөд удахгүй засагдах байх.

10 comments:

sanakae said...

Энийг файлаар нь авъя. Char-ууд нь асуулт болчиж

sanakae said...

mailee бичихээ мартаж sanakae@gmail.com

baynaa said...

Хуучин монгол үсгүүдийг харахын тулд зохих фонтыг өөрийн компьютер дээр суулгасан байх хэрэгтэй. ЭНЭ хуудасны хамгийн дор байгаа фонтыг татаж аваад хараарай. Windows Vista дээр фонтууд суусан ирэх тул шууд харагдах ёстой.

dusal said...

http://blogmn.net/dusal/14485/
ийшээ орж зөвлөгөө өгнө үү.

Amgaa said...

Бичлэгээс тэс хөндлөн сэтгэгдэл бичиж байгаад уучлаарай.
Nagios-р дотоод сүлжээний компьютерүүд хэрхэн хянах талаар бичлэг бичиж өгч болох уу?
Сайт дээр дэлгэрэнгүй байгаа ч хэлний мэдлэг бага зэрэг дутаад байх юм.

Anonymous said...

Sain bna uu?

Mongol helnii usegiin galig ni bna uu?

Bi mongolian text to speech on Java deer hiih sanaatai uzeed bna.

Tus bolno uu.

bhdg@gmail.mn or gangaad@yahoo.com

xvv said...

Энэ хүснэгтэнд байгаа Report 170-г ашиглаж галиглах гэсэн юм. Тэгээд нэг асуудал гарлаа.

Гийгүүлэгч үсэг Г (эм үгийн) Mongolian letter GA g U+0067 ᠭ U+182D

Энд гийгүүлэгч эм үсгийг 2 цэгтэй бичсэн байх юм? Тэгээд GA биш GE гэмээр санагдана. Ямартай ч эргэлзээд Цагаан толгойн ном эргүүлж харлаа. Цэггүй бичсэн байна. Энэ талаар аль болох хурдан хариу өгөөч.
Баярлалаа.

baynaa said...

Тиймээ урдаа цэгтэй байгаа юм. Энэ бол тухайн тэмдэгтэд харгалзуулсан дүрс байгаа юм. Түүнээс бидний бичихдээ хэрэглэх үсэг биш юм. Үндсэн тэмдэгтийн олонлог нь текстийг дүрсээр харахад зориулагдаагүй гэдгийг анхаараарай.

xvv said...

Харин тийм юм байна. Одоо л учрыг олох тийшээгээ хандаад сууж байна :)
:-D Хариулж байгаад, бас ийм зүйл бэлдэж блогтоо тавьсанд их баярлалаа. :) Таны ажил үйлсэд өндөр амжилт хүсье!

mondy said...
This comment has been removed by a blog administrator.