Қарақалпақ тилиниң сақланып қалыныўы тек технология қолында ма?
1-декабр — Қарақалпақ тилине мәмлекетлик тил бийлиги берилген күн. Бул күн тап Жаңа жыл байрамы сыяқлы жылына бир рет есленетуғын, дерлик пайдасы жоқ ҳәр қыйлы флешмоб, ушырасыў ҳәм соған уқсаған илажлар менен өтип кететуғын, ертеңине болса барлығы умытылатуғын күн. Басқалар ушын қандай билмедим, бирақ мен ушын 1-декабр тәшўишлер күни.
Мениң жеке пикиримше, бул күнди байрам деп есаплаўға тийкар аз сыяқлы. Егер қарақалпақ тили, ҳақыйқатында да, раўажланып атырған болғанда, онда гәп сөзсиз, бул күнди белгилеўге болар еди. Деген менен, UNESCOның World Atlas of Languages жойбарында қарақалпақ тилине Potentially vulnerable (шамалы әззи) статусы берилген. Бул қарақалпақ тилиниң жарқын келешегин көз алдымызға келтириўимиз қыйын дегени.
Тил байрамы мүнәсибети менен 4 жыл алдын да темаға байланыслы бир пост жазған едим. Ол жерде әпиўайы адамлар тилдиң раўажланыўына қандай үлес қоса алыўы ҳаққында идеяларым менен бөлискенмен. Мине, арадан төрт жыл ўақыт өтти, лекин мен, дерлик, бул мәселеде өзгерис көрмедим. YouTube, Instagram, Telegram сыяқлы платформаларда бираз контент шығып атырғандай, бирақ сапа жағынан еле дым төмен.
Улыўма алғанда, тилдиң раўажланыўы мәселесин, биринши нәўбетте, мәмлекет өз мойнына алыўы керек. Бирақ, бизде, негедур, олай емес — тил мәселеси күн тәртибинде турған жоқ. Сонлықтан, «тилди раўажландырыў» демей-ақ қояйық, ҳеш болмағанда, оны өз қәдири дәрежесинде услап турыў ҳәзирде тек тил ықласбентлери ҳәм энтузиастлардың ғана қолында ма деп ойлайман. Тилекке қарсы, бундай адамлардың саны да жүдә ҳәм азшылықты қурайды.
Соңғы жыллары жасалма интеллект (artificial intelligence) тараўы әдеўир раўажланып атыр. Буның нәтийжесинде, алдын имканияты көп болмаған аз ресурслы тиллер (low resource languages) буның арқасында көп пайдалы нәтийжелер алмақта. Мәселен, Google Translate’тиң ақырғы версиясына жаңа 110 тил қосылды. Тиллер арасында абхаз (сөйлеўшилер саны 190 000), коми (100 000), тува (130 000) сыяқлы тиллер де бар. Yandex компаниясы да өз аўдармашысына Россиядағы көплеген басқа халықлар тиллерин қосып атыр.
Бул тиллер қатарына қарақалпақ тилин қосыўдың илажы жоқ па еди? Неге технологиялық прогресс нәтийжелеринен басқа киши тиллер сыяқлы қарақалпақ тили де пайдалана алмайды? Буған тийкарғы себеп, қарақалпақ тилиниң санлы дүньяда дерлик жоқ екенлиги. Қарақалпақ тилиндеги ресурсларды электронластырыў жумыслары усы ўақытқа шекем исленбеген. Сканерленген китаплар бар, деген менен олар текст көринисине өткизилмеген.
Жасалма интеллект мүмкиншиликлеринен пайдаланыў ушын, үлкен көлемли мағлыўмат керек. Мысалы, Google Translate сыяқлы онлайн аўдармашы ислеўи ушын кеминде 100 000 гәпти өз ишине алған параллель тил корпусы зәрүр (жақсы, сапалы болыўы ушын, бир миллион гәп), яғный 100 000 қарақалпақша гәп ҳәм оның аўдармасы керек болады (қәлеген кең тарқалған тилге; баспадан шыққан китаплар санын есапқа алсақ, ең оптималы рус тили шығар). Бул корпус пенен машиналық үйрениў (machine learning) технологияси жәрдеминде, аўдармашыны «шынықтырыўға» болады.
Енди әдеттеги сораў, не ислеў керек? Тилди электронластырыў бул жеке энтузиастлардың қолынан келетуғын ис емес, сол ушын мәмлекет, әлбетте, өзи араласыўы керек. Китапларды электронластырыў, параллель ҳәм моно корпуслар жаратыў — бул тийкарынан инсан ресурсларын талап ететуғын процесс. Мәмлекетте бул ресурслар бар. Бәлким, оларды дурыс жолда пайдаланыў ўақты келген шығар? Егер инсан ресурсын жеткерип бере алмаса, грант яки соған уқсас қаржы жағынан болса да жәрдем бериўи мүмкин.
Мәмлекет тилдиң раўажланыўына үлес қоса алмайды яки буны қәлемейди екен, итимал, мағлыўмат жыйнаў жағынан жәрдем бериўге күши жетер? Технология жағын энтузиастлар жыйналысып бир нәрсе ислей алыўына көзим жетеди.