Ғалымдар ЖИ үлгілеріне алдауды үйретуге болатынын анықтады

17.01.2024, 09:50
920
Ғалымдар ЖИ үлгілеріне алдауды үйретуге болатынын анықтады freepik.com

Жасанды интеллект модельдеріне алдауды үйретуге болады, ал одан қорғану әзірге «тиімсіз» дейді жаңа зерттеулер. Kazinform бұл туралы Euronews-ке сілтеме жасап хабарлап отыр.

 

АҚШ-тың Anthropic компаниясының зерттеушілері жасанды интеллект үлгілеріне алдауды үйретуге болатынын және қауіпсіздікті оқытудың қолданыстағы әдістері мұның алдын алуда «тиімсіз» екенін анықтады.

Зерттеудің мақсаты — жасанды интеллект (ЖИ) модельдеріне адамдар сияқты алдауды үйретуге болатынын анықтау.

Зерттеу барысында қатысушылар ЖИ модельдеріне алдауды үйретуге болатынын білді. Олар белгілі бір кіріс сигналдарынан туындайтын және айтарлықтай қауіпту болуы мүмкін «бэкдор» деп аталатын әрекетті жасау арқылы ЖИ үлгілеріне алдауды үйрете алды.

Зерттеуге қатысушылар ЖИ модельдерінің алдауды үйреніп қана қоймай, алдауға бейімділігін жасыра алатынын да анықтады.

Зерттеу авторлары тілдік модельдерге (LLM) үлкен қауіп тудыруы мүмкін екі нақты қауіпті қарастырды: алаяқтардың триггерлі модель ойлап табуы және алдаушы модельдің табиғи пайда болуы.

Зерттеушілер бұл екі қауіп те «мүмкін және олармен күресу өте қиын болатынын» айтты.

Зерттеушілердің пікірінше, ЖИ үлгілеріне арналған қауіпсіздікті оқытудың қолданыстағы әдістері алдауға үйретілген генеративті ЖИ жүйелерін тоқтатуға «қауқарсыз». Олар қолданыстағы әдістерді жетілдіру қажет деген қорытындыға келді.

Өткен жылдың басында кейбір технология жетекшілері, соның ішінде Илон Маск «адамзат үшін үлкен қауіп болуы мүмкін» деген себеппен ЖИ эксперименттерін тоқтатуға шақырды.

2023 жылдың қараша айында 28 елдің, соның ішінде ҚХР, АҚШ және ЕО мемлекеттерінің өкілдері жасанды интеллектті қауіпсіз пайдалану бойынша бірінші саммит өткізді, онда олар ЖИ-дің "шекаралық" деп аталатын модельдерімен байланысты тәуекелдермен күресуге бағытталған пактіге қол қойды.

Қытайдан көлік алған қазақтардың шоттары жаппай бұғатталып жатыр Қазақстан армиясы жаңа соғыс форматына бейімделіп жатыр «Миллион теңге де жетпейді»: Бақытжан Базарбек депутаттардың айлығы неге жетпейтінін түсіндірді Трамп Си Цзиньпинді «Голливуд фильмдеріне лайық образ» деп атады Шетел азаматтығын жасырған отбасы Қазақстаннан қуылды «Человек в маске» ауыр дертке шалдыққан жігіттің өмірін бір күнде өзгертті (ВИДЕО) Теңге тағы қысымда: 15 мамырдағы валюта бағамы жарияланды Шаңды дауыл, найзағай, аптап ыстық: 15 мамырда елді қолайсыз ауа райы күтіп тұр «Әкімдікке кіріп көрмегенмін»: Мақпал Жүнісова Роза Рымбаеваға жауап берді «35 жастан кейін басталды»: тойда билеген әйелдің видеосы вирусқа айналды Алматыда үйленген ер адамды аңдыған әйелге қылмыстық іс қозғалды «Өзімді Ресейдегі өзбектей сезіндім»: Алматыға келген ресейлік қыз дауға қалды Ердоған Қазақстанға үндеу жасады: Түркі бірлігі жаңа кезеңге өтті UMC Назарбаевтың жүрек операциясы туралы ақпаратты жоққа шығармады Ресейде аулада намаз оқыған өзбекстандық елден қуылды Оралда полицей қыз зорлады деген күдікпен қамауға алынды Әкімнің орынбасары даулы видеодан кейін қызметінен кетті (ВИДЕО) Ақтауда полиция көлігі 1,5 жасар баланы қағып өлтірді Bloomberg: Қазақстан маусымда мұнай тасымалын азайтады Павлодарда ер адам сүйіктісін көлікпен қабырғаға қысып, аяғынан айырды