Жасанды интеллект дәуіріндегі қазақ тілінің мәселелері – қазақ мәтінін автоматты тану

16.10.2023, 12:10
564
Жасанды интеллект дәуіріндегі қазақ тілінің мәселелері – қазақ мәтінін автоматты тану Halyq Uni

Қазақ тілінің өміршеңдігін арттыру үшін жасанды интеллектіні қазақша жазуға, ойлауға, сөйлеуге үйрету керек. Астанада өткен Digital Bridge 2023 форумында алғаш рет қазақ тіліне арналған жеке панельдік сессия өтті

«Цифрлық әлемдегі қазақ тілі» атты сессияда қазақ тілі мен жасанды интеллект арасындағы мүмкіндіктер мен қиындықтар қарастырылды. Сессияда түрлі аспектілер аясында цифрлық әлемде қазақ тілінің практикалық қолданылуы туралы айтылып, қатысушылар жасанды интеллектке бейімделген алгоритмдерді қолданудың нақты әдістемелерімен, соның ішінде пайдалану, салыстыру және бағалау алгоритмдерімен, олардың мақсаттары мен көрсеткіштерін тұжырымдаумен танысты. 

Панельдік сессияны халықаралық «Қазақ тілі» қоғамының президенті Рауан Кенжеханұлы жүргізді. Сессия барысында Цифрлық даму, инновациялар және аэроғарыш өнеркәсібі министрі Бағдат Мусин өз сөзінде бүгінде ел инфрақұрылымды, цифрлық үкіметті, инновацияларды дамытуға және кадрларды даярлауға баса назар аудара отырып, цифрландыру саласындағы айтарлықтай жетістіктерге қол жеткізіп отырғанын атап өтті. Ол бұл күш-жігер Қазақстанды Орталық Азиядағы цифрлық даму саласында табысты елге айналдыра алатынын атап өтті.

Қазір қарап отырсақ «Яндекс» сынды ірі компания Алисаны қазақ тіліне үйретіп жатыр. Сондықтан оны өзіміз де жасауымыз керек. Президент Тоқаев Назарбаев Университетінің базасында Ақылды жүйелер және жасанды интеллект институты құрылатынын айтты. Соның ішінде зерттеулердің ішінде қазақ тілі мен жасанды интеллектіні ықпалдастыру алдыңғы қатарда болса деп ойлаймын, - деді министр. 

Панельдік сессияда жасанды интеллект дәуіріндегі қазақ тілінің мәселелері – қазақ мәтінін автоматты тану, әлемдік компаниялармен серіктестік орнату, интернет контентті қазақшалау, қазақ тіліне қатысты IT шешімдер талқыланды. Microsoft компаниясының IT-маманы Санжар Мырзағалым, «Тіл-қазына» орталығының бас директоры Мақпал Жұмабай, IT-аналитик Тимур Бектұр, Beeline Kazakhstan компаниясының маманы Андрей Остафичук сынды түрлі саланың беткеұстарлары спикер болды.

Мен өзім қазақ болған соң, тіл мәселесіне жанашырлықпен қараймын. Негізінде, әр мекемеде, әр үйде, әр мектепте компьютер бар болса, онда Microsoft бағдарламасы орнатылған. Яғни, оның өзінде қазір қазақ тілі жақсы қолданыста. Қазақ тілінде интерфейс бар. Дегенмен бұл – тек қана бағдарламалар. Қазір замануи ЖИ технологиялары қарқынды дамып жатыр, соның ішінде қазақ тілінің қолданысын арттыру біздің қолданысымызда. Мәселен, ауызекі сөйлеген сөзді мәтінге, мәтіннен ауызекі сөзге айналдыру дегендей ЖИ бірнеше тармақтардан тұрады. Мысалы, аударма сервистері ЖИ тармақтары болып саналады. Генеративті ЖИ бойынша үлкен компаниялар үлкен тіл корпустарын қолданды, олардың ішінде қазақ тілінің үлесі көп емес. Сапалы тіл корпустарын қарастыруымыз үшін, оның басты көздері әдеби, ғылыми әдебиеттерді цифрландырып, сол корпустарға енгізу керек. Осыдан үш жыл бұрын біз қазақ тілін Microsoft аударма сервисіне енгізген едік, - дейді Microsoft компаниясының IT-маманы Санжар Мырзағалым. 

IT-маманының айтуынша, Microsoft  өнімдеріне, сервистеріне қазақ тілін интеграциялау бойынша «Тіл-Қазына» ұлттық ғылыми-практикалық орталығымен жүйелі жұмыстар атқарылмақ. 

Автоматты түрде ақпарат жинайтын роботтар ауқымды ақпарат жинай алмай қалады. «Тіл-Қазына» базасында өте үлкен тіл корпусы бар екендігін білдік, ары қарай нақты қадамдары жасауға дайынбыз, - деді Microsoft компаниясының өкілі Санжар Мырзағалым. 

Бұдан бөлек сессия спикерлері жасанды интеллект үшін қазақ тілінің түсінікті болуын қамтамасыз ету стратегиялары мен ЖИ сапасын арттыру үшін контент әзірлеу мен оны енгізудің маңыздылығын талқылады. 

Ш.Шаяхметов атындағы «Тіл-Қазына» ұлттық ғылыми-практикалық орталығының Бас директоры Мақпал Жұмабай халықаралық басқосуда инновациялық шешімдерді қазақ тілінің мүддесіне дұрыс қолдану туралы ойын білдірді.

Қазақ тіліне байланысты технологияларды, соның ішінде сөйлеу синтезін әзірлеуге басымдық беріп отырмыз. Сондай-ақ, әлемдік тілдік модельдерде қазақ тілінің сапалы деңгейде қолданылуына атсалысу – басты мақсатымыздың бірі. Ол үшін біз осы бағытта жұмыс істеп жатқан отандық және шетелдік жетекші компаниялармен ынтымақтастық орнатудамыз. Яғни жасанды интеллектінің қазақ тілін толық игеруіне қол жеткізу. Бұл мемлекеттік ұйымдар мен басқа да компаниялардың өз сервистік өнімдеріне қазақ тілін оңай әрі қолжетімді интеграциялауына жол ашады. Әрі тілімізді цифрлық мүмкіндіктер арқылы жаңа сатыға шығаруды көздейміз. Технологиялық шешімдер, яғни жасанды интеллект тіліміздің әлеуетін арттырып, оның қоғамдық өмірдің барлық саласында кеңінен қолданылуына негіз болады. Осы маңызды межені бағындыру үшін отандық IT мамандар мен компьютерлік лингвистерді, ғылыми-зерттеу ұйымдары мен барлық тіл жанашырларын ортақ іске жұмылуға шақырамыз, – деді Мақпал Жұмабай.

Сарапшылар мен сала көшбасшылары еліміздің  IT-саласын дамытудың өзекті мәселелерін қозғап, инвестициялық ахуалды талқылады, стартаптарды дамытудың әлеуеті мен перспективаларын бағамдап, цифрлық технологиялар саласындағы мемлекеттік реттеу мәселелерін көтерді.

Digital Bridge 2023 өз алаңында 300-ден астам IT-компания, 100-ден аса инвестор, әлемнің түкпір-түкпірінен жиналған 400 спикер мен бизнес-періштелерді, әлемнің 30 елінен 100-ден астам стартаптарды біріктірді.

Әбдіжаппар Әлқожа ұстазына ерекше сыйлық тарту етті (ВИДЕО) Әнші Kalifarniya-ны танымай қалған такси жүргізушісі елді тәнті етті (ВИДЕО) Астанада балабақша қызметкері балаға тамақтың қалдығын берген (ВИДЕО) «Астанаға өңшең намыссыз қазақтар жиналады»: Депутат Абзал Құспан елордалықтарға шүйлікті «7 жыл тергеуші болып жұмыс істедім»: Айдар Асқарбек кино әлеміне қалай келгенін айтып берді Иран президенті мінген тікұшақ апатты жағдайда қонды (ВИДЕО) «Енді маған жазбаңыз»: Сәдуақасова желіде жасын сынап жатқандарға жауап берді «Үндемей шығарып салған ғой»: Нұрлан Қоянбаев мейрамханада қызық жағдайға тап болды (ВИДЕО) "Ішетін адамдармен араласпаймын": Олжас Абай өзі туралы ел білмейтін жайтты айтты Біз оны Тасқынбай деп атаймыз: Құлсары тұрғыны ТЖ кезінде алғашқы сәбиін өмірге әкелді Жас ғалымдар әлемнің озық зертханаларында тәжірибе алмасып жатыр Дзюдодан әлем чемпионаты: Елдос Сметов пен Ғалия Тынбаева алғашқы белдесуінде жеңіске жетті Алдағы бес айда үшінші дүниежүзілік соғыс басталуы мүмкін – Трамп "Көліктің терезесін сындырып, мені алып шықты": Баян Мақсатқызы қызының өзін қалай құтқарғанын айтып берді (ВИДЕО) Павлодарда әйелін кілт жоғалтқаны үшін ұрып-соққан ер адам ұсталды (ВИДЕО) Fitch рейтингі: Қазақстанның тәуелсіз кредиттік деңгейі "тұрақты" деп бағаланды Elorda Cup: 14 боксшымыз алтын медаль алды Тойда Құран сүрелерін қосуға бола ма? – ҚМДБ жауап берді (ВИДЕО) Үш жасар бүлдіршіннің денесі көршісінің әжетханасынан табылды Нөсер жаңбыр, бұршақ: 19 мамырға арналған ауа райы болжамы