Жасанды интеллект дәуіріндегі қазақ тілінің мәселелері – қазақ мәтінін автоматты тану

16.10.2023, 12:10
1117
Жасанды интеллект дәуіріндегі қазақ тілінің мәселелері – қазақ мәтінін автоматты тану Halyq Uni

Қазақ тілінің өміршеңдігін арттыру үшін жасанды интеллектіні қазақша жазуға, ойлауға, сөйлеуге үйрету керек. Астанада өткен Digital Bridge 2023 форумында алғаш рет қазақ тіліне арналған жеке панельдік сессия өтті

«Цифрлық әлемдегі қазақ тілі» атты сессияда қазақ тілі мен жасанды интеллект арасындағы мүмкіндіктер мен қиындықтар қарастырылды. Сессияда түрлі аспектілер аясында цифрлық әлемде қазақ тілінің практикалық қолданылуы туралы айтылып, қатысушылар жасанды интеллектке бейімделген алгоритмдерді қолданудың нақты әдістемелерімен, соның ішінде пайдалану, салыстыру және бағалау алгоритмдерімен, олардың мақсаттары мен көрсеткіштерін тұжырымдаумен танысты. 

Панельдік сессияны халықаралық «Қазақ тілі» қоғамының президенті Рауан Кенжеханұлы жүргізді. Сессия барысында Цифрлық даму, инновациялар және аэроғарыш өнеркәсібі министрі Бағдат Мусин өз сөзінде бүгінде ел инфрақұрылымды, цифрлық үкіметті, инновацияларды дамытуға және кадрларды даярлауға баса назар аудара отырып, цифрландыру саласындағы айтарлықтай жетістіктерге қол жеткізіп отырғанын атап өтті. Ол бұл күш-жігер Қазақстанды Орталық Азиядағы цифрлық даму саласында табысты елге айналдыра алатынын атап өтті.

Қазір қарап отырсақ «Яндекс» сынды ірі компания Алисаны қазақ тіліне үйретіп жатыр. Сондықтан оны өзіміз де жасауымыз керек. Президент Тоқаев Назарбаев Университетінің базасында Ақылды жүйелер және жасанды интеллект институты құрылатынын айтты. Соның ішінде зерттеулердің ішінде қазақ тілі мен жасанды интеллектіні ықпалдастыру алдыңғы қатарда болса деп ойлаймын, - деді министр. 

Панельдік сессияда жасанды интеллект дәуіріндегі қазақ тілінің мәселелері – қазақ мәтінін автоматты тану, әлемдік компаниялармен серіктестік орнату, интернет контентті қазақшалау, қазақ тіліне қатысты IT шешімдер талқыланды. Microsoft компаниясының IT-маманы Санжар Мырзағалым, «Тіл-қазына» орталығының бас директоры Мақпал Жұмабай, IT-аналитик Тимур Бектұр, Beeline Kazakhstan компаниясының маманы Андрей Остафичук сынды түрлі саланың беткеұстарлары спикер болды.

Мен өзім қазақ болған соң, тіл мәселесіне жанашырлықпен қараймын. Негізінде, әр мекемеде, әр үйде, әр мектепте компьютер бар болса, онда Microsoft бағдарламасы орнатылған. Яғни, оның өзінде қазір қазақ тілі жақсы қолданыста. Қазақ тілінде интерфейс бар. Дегенмен бұл – тек қана бағдарламалар. Қазір замануи ЖИ технологиялары қарқынды дамып жатыр, соның ішінде қазақ тілінің қолданысын арттыру біздің қолданысымызда. Мәселен, ауызекі сөйлеген сөзді мәтінге, мәтіннен ауызекі сөзге айналдыру дегендей ЖИ бірнеше тармақтардан тұрады. Мысалы, аударма сервистері ЖИ тармақтары болып саналады. Генеративті ЖИ бойынша үлкен компаниялар үлкен тіл корпустарын қолданды, олардың ішінде қазақ тілінің үлесі көп емес. Сапалы тіл корпустарын қарастыруымыз үшін, оның басты көздері әдеби, ғылыми әдебиеттерді цифрландырып, сол корпустарға енгізу керек. Осыдан үш жыл бұрын біз қазақ тілін Microsoft аударма сервисіне енгізген едік, - дейді Microsoft компаниясының IT-маманы Санжар Мырзағалым. 

IT-маманының айтуынша, Microsoft  өнімдеріне, сервистеріне қазақ тілін интеграциялау бойынша «Тіл-Қазына» ұлттық ғылыми-практикалық орталығымен жүйелі жұмыстар атқарылмақ. 

Автоматты түрде ақпарат жинайтын роботтар ауқымды ақпарат жинай алмай қалады. «Тіл-Қазына» базасында өте үлкен тіл корпусы бар екендігін білдік, ары қарай нақты қадамдары жасауға дайынбыз, - деді Microsoft компаниясының өкілі Санжар Мырзағалым. 

Бұдан бөлек сессия спикерлері жасанды интеллект үшін қазақ тілінің түсінікті болуын қамтамасыз ету стратегиялары мен ЖИ сапасын арттыру үшін контент әзірлеу мен оны енгізудің маңыздылығын талқылады. 

Ш.Шаяхметов атындағы «Тіл-Қазына» ұлттық ғылыми-практикалық орталығының Бас директоры Мақпал Жұмабай халықаралық басқосуда инновациялық шешімдерді қазақ тілінің мүддесіне дұрыс қолдану туралы ойын білдірді.

Қазақ тіліне байланысты технологияларды, соның ішінде сөйлеу синтезін әзірлеуге басымдық беріп отырмыз. Сондай-ақ, әлемдік тілдік модельдерде қазақ тілінің сапалы деңгейде қолданылуына атсалысу – басты мақсатымыздың бірі. Ол үшін біз осы бағытта жұмыс істеп жатқан отандық және шетелдік жетекші компаниялармен ынтымақтастық орнатудамыз. Яғни жасанды интеллектінің қазақ тілін толық игеруіне қол жеткізу. Бұл мемлекеттік ұйымдар мен басқа да компаниялардың өз сервистік өнімдеріне қазақ тілін оңай әрі қолжетімді интеграциялауына жол ашады. Әрі тілімізді цифрлық мүмкіндіктер арқылы жаңа сатыға шығаруды көздейміз. Технологиялық шешімдер, яғни жасанды интеллект тіліміздің әлеуетін арттырып, оның қоғамдық өмірдің барлық саласында кеңінен қолданылуына негіз болады. Осы маңызды межені бағындыру үшін отандық IT мамандар мен компьютерлік лингвистерді, ғылыми-зерттеу ұйымдары мен барлық тіл жанашырларын ортақ іске жұмылуға шақырамыз, – деді Мақпал Жұмабай.

Сарапшылар мен сала көшбасшылары еліміздің  IT-саласын дамытудың өзекті мәселелерін қозғап, инвестициялық ахуалды талқылады, стартаптарды дамытудың әлеуеті мен перспективаларын бағамдап, цифрлық технологиялар саласындағы мемлекеттік реттеу мәселелерін көтерді.

Digital Bridge 2023 өз алаңында 300-ден астам IT-компания, 100-ден аса инвестор, әлемнің түкпір-түкпірінен жиналған 400 спикер мен бизнес-періштелерді, әлемнің 30 елінен 100-ден астам стартаптарды біріктірді.

Украина мен НАТО шұғыл кеңес өткізеді «Балғамен ұрып өлтірмек болды»: ер адам әйелінің жұмысына келіп, оны ұрып өлтірмек болған (ВИДЕО) Мұнайшылар ереуілі: Жұмыскерлерге қысым көрсетіліп жатқаны рас па? Жаңа жылда 4 қаңтарға дейін демалыс болмақ eGov қосымшасы арқылы қазақстандықтардың несие тарихы қадағаланады Елімізде банан емес, адам саудасы «қызып» тұр Журналист Гүлмира Әбіқай елден ақша жинайтын тағы бір қайырымдылық қорының былығын ашты Бокстан Азия чемпионатында ел намысын кімдер қорғайды? Нұрбике Нұрқаділова өмірден өтті: Заманбек Нұрқаділовтің бірінші жары соңғы сұхбатында қандай шындықты айтып кетті? Майқайыңдағы масқара: Ағасы мен қарындасы зорланған «Зорлады» деп жалған арыз жазатын нәзік жандылар азаймай тұр «Бейбітшілікті қалайтындарға түкіргені бар»: Зеленский Путиннің мәлімдемесіне жауап қатты Путин Украинаға атқылаған «Орешник» зымыраны сәтті сыналғанына сүйінші сұрады Украинадағы жағдай ушықты: Бектенов шұғыл жиын өткізді «Еліміздің барлық аймағында дерлік күн бұзылады»: 22 қарашаға арналған ауа райы болжамы жарияланды Желіде Перизат Қайраттың жалған сұхбаты тарады Ұлттық ұлан факультетінде ғылыми-теориялық конференция өтті «Әр баланың өз бөлмесі бар»: Блогер Дархан Жолшыбеков көпбалалы әйелге үй сыйлады «Қатты ауырып жатыр»: Жанқош Тұраровтың әлі күнге дейін тергеуге бармағаны белгілі болды «5 млн дейін береді»: Ләйлә Сұлтанқызы Шымкент өңіріндегі қалың малдың қанша екенін жариялады