Lingua::Translit багцийг хөгжүүлэгч Alex Linke-н туслалцаатайгаар Хуучин Монгол бичгийн латин галигийн хүснэгт Lingua::Translit багцийн 0.09 хувилбарт багтлаа.
Хуучин Монгол бичгийн латин галигийн хүснэгт үүсгэхэд тулгарсан асуудлууд, тэдгээрийг шийдвэрлэх нь:
1. Албан ёсны стандартыг хайгаад олоогүй болохоор:
- монголч эрдэмтэн N.Poppe-гийн хүснэгт (page25 Грамматика Письменно-Монгольского Языка, Академии Наук СССР, Ленинград,1937)
- М.Эрдэнэчимэг эгчийн Report-170 (UNU/IIST, Macao, 1999)
- википедиа дээрх хүснэгт болон T.Pederson-ы хүснэгт (Eesti Keele Instituut, Tallinn, 2006)
- LinguaMongolia.co.uk дээрх Emyr.P-н ажлуудын дотроос Д.Нацагдоржийн шүлгүүд, "Монголын Нууц Товчоо"-ны хятад болон монгол галигууд (2005-2006)
- mongolxel.webz.cz дээрх Б.Сумъяабаатар гуайн "Монголын нууц товчоон"-ны хятад болон монгол галигууд (ШУА, Улаанбаатар, 1990)
- mongolxel.webz.cz дээрх Lajos Ligeti-н "Монголын нууц товчоон"-ны монгол галиг (Akadémiai Kiadó, Budapest, 1971)
- Altaica.narod.ru дээрх E.Haenisch-н "Юан Улсын түүх"-н латин галиг (Abhandlungen der deutschen Akademie der Wissenschaften, Berlin, 1950)
зэргийг судалгааны материал болгон харицуулан судалж, common_classical_mon.xml дүрмийн файлыг үүсгэлээ.
2. Судалгааны ажилд ашиглах бэлэн галигласан текстийн ховор байдал...
Интернетээр хайж олдсон, дээр дурдсан электрон текстүүдийг common_classical_mon.xml дүрмийн файлыг шалгахад хэрэглэсэн. Судалгааны материалын хомсдмол байдлаас үүдэн манж, шивээ, тод, али гали үсгүүдийн латин галиг энэ файлд багтаагүй байгаа. Цаашид электрон бус, цаасан дээр хэвлэгдсэн материалуудыг ашиглан 1-рт илүү өргөн хэмжээний корпусаар дүрмийн файлыг шалгах, 2-рт дээрх үсгүүдийн латин галигийг цаашид нэмэх төлөвлөгөөтэй байна.
Ингээд Хуучин монгол бичгийн латин галигийн хүснэгтийг дараах байдалтай үүсгэлээ.
Эгшиг үсгүүд:
№ | Үсгийн нэр | Галиг | Unicode (Basic Set) | |||
Криллээр | Report170 | char | char code | char | char code | |
1 | Эгшиг үсэг А | Mongolian letter A | a | U+0061 | ᠠ | U+1820 |
2 | Эгшиг үсэг Э | Mongolian letter E | e | U+0065 | ᠡ | U+1821 |
3 | Эгшиг үсэг И | Mongolian letter I | i | U+0069 | ᠢ | U+1822 |
4 | Эгшиг үсэг О | Mongolian letter O | o | U+006F | ᠣ | U+1823 |
5 | Эгшиг үсэг У | Mongolian letter U | u | U+0075 | ᠤ | U+1824 |
6 | Эгшиг үсэг Ө | Mongolian letter OE | ö | U+00F6 | ᠥ | U+1825 |
7 | Эгшиг үсэг Ү | Mongolian letter UE | ü | U+00FC | ᠦ | U+1826 |
8 | Эгшиг үсэг Е | Mongolian letter EE | ē | U+0113 | ᠧ | U+1827 |
Гийгүүлэгч үсгүүд:
| Үсгийн нэр | Галиг | Unicode (Basic Set) | |||
Криллээр | Report170 | char | char code | char | char code | |
1 | Гийгүүлэгч үсэг Н | Mongolian letter NA | n | U+006E | ᠨ | U+1828 |
2 | Гийгүүлэгч үсэг НГ | Mongolian letter ANG | ng | (U+006E)(U+0067) | ᠩ | U+1829 |
3 | Гийгүүлэгч үсэг Б | Mongolian letter BA | b | U+0062 | ᠪ | U+182A |
4 | Гийгүүлэгч үсэг П | Mongolian letter PA | p | U+0070 | ᠫ | U+182B |
5 | Гийгүүлэгч үсэг Х | Mongolian letter QA | q | U+0071 | ᠬ | U+182C |
Гийгүүлэгч үсэг Х | Mongolian letter QA | k | U+006B | ᠬ | U+182C | |
6 | Гийгүүлэгч үсэг Г | Mongolian letter GA | ɣ | U+0263 | ᠭ | U+182D |
Гийгүүлэгч үсэг Г | Mongolian letter GA | g | U+0067 | ᠭ | U+182D | |
7 | Гийгүүлэгч үсэг М | Mongolian letter MA | m | U+006D | ᠮ | U+182E |
8 | Гийгүүлэгч үсэг Л | Mongolian letter LA | l | U+006C | ᠯ | U+182F |
9 | Гийгүүлэгч үсэг С | Mongolian letter SA | s | U+0073 | ᠰ | U+1830 |
10 | Гийгүүлэгч үсэг Ш | Mongolian letter SHA | š | U+0161 | ᠱ | U+1831 |
11 | Гийгүүлэгч үсэг Т | Mongolian letter TA | t | U+0074 | ᠲ | U+1832 |
12 | Гийгүүлэгч үсэг Д | Mongolian letter DA | d | U+0064 | ᠳ | U+1833 |
13 | Гийгүүлэгч үсэг Ц, Ч | Mongolian letter CHA | č | U+010D | ᠴ | U+1834 |
14 | Гийгүүлэгч үсэг Ж, З | Mongolian letter JA | j | U+006A | ᠵ | U+1835 |
15 | Гийгүүлэгч үсэг Й, Я | Mongolian letter YA | y | U+0079 | ᠶ | U+1836 |
16 | Гийгүүлэгч үсэг Р | Mongolian letter RA | r | U+0072 | ᠷ | U+1837 |
17 | Гийгүүлэгч үсэг В | Mongolian letter WA | w,v | U+0077, U+0076 | ᠸ | U+1838 |
18 | Гийгүүлэгч үсэг Ф | Mongolian letter FA | f | U+0066 | ᠹ | U+1839 |
19 | Гийгүүлэгч үсэг К | Mongolian letter KA | ḳ | U+1E33 | ᠺ | U+183A |
20 | Гийгүүлэгч үсэг К | Mongolian letter KHA | ǩ | U+01E9 | ᠻ | U+183B |
21 | Гийгүүлэгч үсэг Ц | Mongolian letter TSA | c | U+0063 | ᠼ | U+183C |
22 | Гийгүүлэгч үсэг З | Mongolian letter ZA | z | U+007A | ᠽ | U+183D |
23 | Гийгүүлэгч үсэг Х | Mongolian letter HAA | h | U+0068 | ᠾ | U+183E |
24 | Гийгүүлэгч үсэг Ж | Mongolian letter ZRA | ž | U+017E | ᠿ | U+183F |
25 | Гийгүүлэгч үсэг ЛХ | Mongolian letter LHA | lh | (U+006C)(U+0068) | ᡀ | U+1840 |
26 | Гийгүүлэгч үсэг | Mongolian letter ZHI | zh | (U+007A)(U+0068) | ᡁ | U+1841 |
27 | Гийгүүлэгч үсэг | Mongolian letter CHI | ch | (U+0063)(U+0068) | ᡂ | U+1842 |
Туслах тэмдэгтүүд:
№ | Тэмдэгтийн нэр | Галиг | Unicode (Basic Set) | |||
Криллээр | Report170 | char | char code | char | char code | |
1 | Бирга | Mongolian Birga | § | U+00A7 | ᠀ | U+1800 |
2 | Тодорхойлох гурван цэг | Mongolian Ellipsis | … | U+2026 | ᠁ | U+1801 |
3 | Таслал | Mongolian Comma | , | U+002C | ᠂ | U+1802 |
4 | Цэг | Mongolian Full Stop | . | U+002E | ᠃ | U+1803 |
5 | Тодорхойлох хоёр цэг | Mongolian Colon | : | U+003A | ᠄ | U+1804 |
6 | Бүлгийн төгсгөл | Mongolian Four Dots | ¶ | U+00B6 | ᠅ | U+1805 |
7 | Эгшиг тусгаарлагч | Mongolian Vowel Seperator | - | U+002D | | U+180E |
Цифрүүд:
№ | Цифрийн нэр | Галиг | Unicode (Basic Set) | |||
Криллээр | Report170 | char | char code | char | char code | |
1 | тэг | Mongolian Digit Zero | 0 | U+0030 | ᠐ | U+1810 |
2 | нэг | Mongolian Digit One | 1 | U+0031 | ᠑ | U+1811 |
3 | хоёр | Mongolian Digit Two | 2 | U+0032 | ᠒ | U+1812 |
4 | гурав | Mongolian Digit Three | 3 | U+0033 | ᠓ | U+1813 |
5 | дөрөв | Mongolian Digit Four | 4 | U+0034 | ᠔ | U+1814 |
6 | тав | Mongolian Digit Five | 5 | U+0035 | ᠕ | U+1815 |
7 | зургаа | Mongolian Digit Six | 6 | U+0036 | ᠖ | U+1816 |
8 | долоо | Mongolian Digit Seven | 7 | U+0037 | ᠗ | U+1817 |
9 | найм | Mongolian Digit Eight | 8 | U+0038 | ᠘ | U+1818 |
10 | ес | Mongolian Digit Nine | 9 | U+0039 | ᠙ | U+1819 |
Lingua::Translit багцын өөрийгөө тестлэх тест файлд оруулсан хуучин монгол текстүүд:
1. Д.Нацагдоржийн "Миний нутаг", http://www.linguamongolia.co.uk/ дээрх галигаар.
Үндсэн тэмдэгтийн олонлог:
"ᠬᠡᠨᠲᠡᠢ ᠂ ᠬᠠᠩᠭᠠᠢ ᠂ ᠰᠣᠶᠣᠨᠤ ᠥᠨᠳᠦᠷ ᠰᠠᠶᠢᠬᠠᠨ ᠨᠢᠷᠤᠭᠤᠨᠤᠳ " .
"ᠬᠣᠶᠢᠲᠤ ᠵᠦᠭᠦᠨ ᠴᠢᠮᠡᠭ ᠪᠣᠯᠤᠭᠰᠠᠨ ᠣᠢ ᠬᠥᠪᠴᠢᠶᠢᠨ ᠠᠭᠤᠯᠠᠨᠤᠳ " .
"ᠮᠡᠨᠡᠨ ᠂ ᠱᠠᠷᠭᠠ ᠂ ᠨᠣᠮᠢᠨᠤ ᠥᠷᠭᠡᠨ ᠶᠡᠬᠡ ᠭᠣᠪᠢᠤᠳ " .
"ᠡᠮᠦᠨᠡ ᠵᠦᠭᠦᠨ ᠮᠠᠩᠯᠠᠢ ᠪᠣᠯᠤᠭᠰᠠᠨ ᠡᠯᠡᠰᠦᠨ ᠮᠠᠩᠬᠠᠨ ᠳᠠᠯᠠᠢᠤᠳ " .
"ᠡᠨᠡ ᠪᠣᠯ ᠮᠢᠨᠤ ᠲᠥᠷᠦᠭᠰᠡᠨ ᠨᠤᠲᠤᠭ ᠮᠣᠩᠭᠣᠯᠤᠨ ᠰᠠᠶᠢᠬᠠᠨ ᠣᠷᠣᠨ ᠃";
Латин галиг: "kentei , qangɣai , soyon-u öndür sayiqan niruɣun-ud " .
"qoyitu jüg-ün čimeg boluɣsan oi köbči-yin aɣulan-ud " .
"menen , šarɣ-a , nomin-u örgen yeke ɣobi-ud " .
"emün-e jüg-ün manglai boluɣsan elesün mangqan dalai-ud " .
"ene bol minu törügsen nutuɣ mongɣol-un sayiqan oron .";
2. "Монголын Нууц Товчоо"-ны хэсгээс, Б.Сумъяабаатар гуайн галигаар.
Үндсэн тэмдэгтийн олонлог:
"ᠬᠠᠷᠴᠤᠶᠢᠨ ᠬᠥᠪᠡᠭᠦᠨ ᠪᠣᠷᠵᠢᠭᠢᠳᠠᠢᠮᠡᠷᠭᠡᠨ᠂ ᠮᠣᠩᠭᠣᠯᠵᠢᠨᠭᠣᠣᠠ ᠭᠡᠷᠭᠡᠢᠲᠦ ᠠᠵᠤᠭᠤ᠃ ᠪᠣᠷᠵᠢᠭᠢᠳᠠᠢᠮᠡᠷᠭᠡᠨᠤ ᠬᠥᠪᠡᠭᠦᠨ ᠲᠣᠷᠣᠭᠣᠯᠵᠢᠨᠪᠠᠶᠠᠨ᠂ ᠪᠣᠷᠣᠭᠴᠢᠨᠭᠣᠣᠠ ᠭᠡᠷᠭᠡᠢᠲᠦ᠂ ᠪᠣᠷᠣᠯᠳᠠᠢ ᠰᠤᠶᠠᠯᠪᠢ ᠵᠠᠯᠠᠭᠤᠲᠤ᠂ ᠳᠠᠶᠢᠷ ᠪᠣᠷᠣ ᠬᠣᠶᠠᠷ ᠬᠦᠯᠦᠭᠦᠳ ᠠᠭᠲᠠᠰᠲᠤ ᠪᠦᠯᠡᠭᠡ᠃ ᠲᠣᠷᠣᠭᠣᠯᠵᠢᠨᠤ ᠬᠥᠪᠡᠭᠦᠨ ᠳᠤᠸᠠᠰᠣᠬᠣᠷ ᠳᠣᠪᠤᠨᠮᠡᠷᠭᠡᠨ ᠬᠣᠶᠠᠷ ᠪᠦᠯᠡᠭᠡ᠃";
Латин галиг:
"qarču-yin köbegün borjiɣidai-mergen, mongɣoljin-ɣoo-a gergeitü ajuɣu. borjiɣidai-mergen-u köbegün toroɣoljin-bayan, boroɣčin-ɣoo-a gergeitü, boroldai suyalbi jalaɣutu, dayir boro qoyar külügüd aɣtastu bülege. toroɣoljin-u köbegün duva-soqor dobun-mergen qoyar bülege.";
PS: xml дүрмийн файлыг хөрвүүлэхэд нэг асуудал гарсан нь MVS(Mongolian Vowel Selector), U+180E тэмдэгтийг XML::Simple ба XML::SAX::PurePerl багцууд танихгүй байсан юм. Багцийг хөгжүүлэгчид мэдэгдсэн бөгөөд удахгүй засагдах байх.