Ғалымдар ЖИ үлгілеріне алдауды үйретуге болатынын анықтады

17.01.2024, 09:50
774
Ғалымдар ЖИ үлгілеріне алдауды үйретуге болатынын анықтады freepik.com

Жасанды интеллект модельдеріне алдауды үйретуге болады, ал одан қорғану әзірге «тиімсіз» дейді жаңа зерттеулер. Kazinform бұл туралы Euronews-ке сілтеме жасап хабарлап отыр.

 

АҚШ-тың Anthropic компаниясының зерттеушілері жасанды интеллект үлгілеріне алдауды үйретуге болатынын және қауіпсіздікті оқытудың қолданыстағы әдістері мұның алдын алуда «тиімсіз» екенін анықтады.

Зерттеудің мақсаты — жасанды интеллект (ЖИ) модельдеріне адамдар сияқты алдауды үйретуге болатынын анықтау.

Зерттеу барысында қатысушылар ЖИ модельдеріне алдауды үйретуге болатынын білді. Олар белгілі бір кіріс сигналдарынан туындайтын және айтарлықтай қауіпту болуы мүмкін «бэкдор» деп аталатын әрекетті жасау арқылы ЖИ үлгілеріне алдауды үйрете алды.

Зерттеуге қатысушылар ЖИ модельдерінің алдауды үйреніп қана қоймай, алдауға бейімділігін жасыра алатынын да анықтады.

Зерттеу авторлары тілдік модельдерге (LLM) үлкен қауіп тудыруы мүмкін екі нақты қауіпті қарастырды: алаяқтардың триггерлі модель ойлап табуы және алдаушы модельдің табиғи пайда болуы.

Зерттеушілер бұл екі қауіп те «мүмкін және олармен күресу өте қиын болатынын» айтты.

Зерттеушілердің пікірінше, ЖИ үлгілеріне арналған қауіпсіздікті оқытудың қолданыстағы әдістері алдауға үйретілген генеративті ЖИ жүйелерін тоқтатуға «қауқарсыз». Олар қолданыстағы әдістерді жетілдіру қажет деген қорытындыға келді.

Өткен жылдың басында кейбір технология жетекшілері, соның ішінде Илон Маск «адамзат үшін үлкен қауіп болуы мүмкін» деген себеппен ЖИ эксперименттерін тоқтатуға шақырды.

2023 жылдың қараша айында 28 елдің, соның ішінде ҚХР, АҚШ және ЕО мемлекеттерінің өкілдері жасанды интеллектті қауіпсіз пайдалану бойынша бірінші саммит өткізді, онда олар ЖИ-дің "шекаралық" деп аталатын модельдерімен байланысты тәуекелдермен күресуге бағытталған пактіге қол қойды.

«Бар болғаны 85 шаршы метр»: Мәдина Сәдуақасова Алматының ең қымбат ауданынан қымбат пәтер сатып алғанын айтты Дариға Назарбаева Дубай әуежайында жүр «Жағдайын көре тұра, көмектеспеген»: 25 жастағы жүкті әйелдің өліміне кінәлі аурухана дәрігерлері жазасын алды Елімізде әрбір бесінші әйел қатерлі ісіктен қайтыс болады Алматыда жүк көлігі 7 жасар қызды басып өлтірді (ВИДЕО) «Біреуі домбыраны харам дейді, біреуі туды қорлайды» – депутат Ермұрат Бәпи Абай облысындағы мектеп директоры мұғалімдеріне сарай мен монша салдырған Forbes әлемдік рейтиңінде қанша Қазақстан миллиардері жүргені анықталды Таиландта жұмыс істейтін Қазақстан азаматы жантүршігерлік жол апатынан қаза болды «Тіктіріп үлгермей жатырмын»: Гүлзира Айдарбекова ұлының сахнада костюмін сыйлап жібере беретінін айтты «Түнімен тігіп едім»: Түркиядағы митингке байланысты Динара Сәтжанның той көйлегі жете алмай қалды Астанада әкімдік жанындағы саябақтан Назарбаевтың суреттері алып тасталды «Күйеуге шыққанда қоямын»: Назым Қызайбай тұрмыс құрғасын боксты қоятынын айтты Екі жақты татуластыруға тыраштанып жүрген Трамп Ресей мен Украина президенттерінен көңілі қалғанын айтты Елімізде алдағы күндері ауа райы +35 градусқа дейін ыстық болмақ Forte Kulanshi Art Space: Астаналық арт-ортаның жаңа белесі Словения президенті Димаштың жанкүйері болып шықты «Qoslike» бағдарламасының жүргізушісі ұзатуында өзіне тілек айтып, халықтан сөз естіді (ВИДЕО) Енді жеке куәлікті онлайн алуға болады «Chanel, Dolce & Gabbana және Prada»: Тұрсынбек Қабатовтың әйелі туған күніне келген сыйлықтарды көрсетті