Ғалымдар ЖИ үлгілеріне алдауды үйретуге болатынын анықтады

17.01.2024, 09:50
807
Ғалымдар ЖИ үлгілеріне алдауды үйретуге болатынын анықтады freepik.com

Жасанды интеллект модельдеріне алдауды үйретуге болады, ал одан қорғану әзірге «тиімсіз» дейді жаңа зерттеулер. Kazinform бұл туралы Euronews-ке сілтеме жасап хабарлап отыр.

 

АҚШ-тың Anthropic компаниясының зерттеушілері жасанды интеллект үлгілеріне алдауды үйретуге болатынын және қауіпсіздікті оқытудың қолданыстағы әдістері мұның алдын алуда «тиімсіз» екенін анықтады.

Зерттеудің мақсаты — жасанды интеллект (ЖИ) модельдеріне адамдар сияқты алдауды үйретуге болатынын анықтау.

Зерттеу барысында қатысушылар ЖИ модельдеріне алдауды үйретуге болатынын білді. Олар белгілі бір кіріс сигналдарынан туындайтын және айтарлықтай қауіпту болуы мүмкін «бэкдор» деп аталатын әрекетті жасау арқылы ЖИ үлгілеріне алдауды үйрете алды.

Зерттеуге қатысушылар ЖИ модельдерінің алдауды үйреніп қана қоймай, алдауға бейімділігін жасыра алатынын да анықтады.

Зерттеу авторлары тілдік модельдерге (LLM) үлкен қауіп тудыруы мүмкін екі нақты қауіпті қарастырды: алаяқтардың триггерлі модель ойлап табуы және алдаушы модельдің табиғи пайда болуы.

Зерттеушілер бұл екі қауіп те «мүмкін және олармен күресу өте қиын болатынын» айтты.

Зерттеушілердің пікірінше, ЖИ үлгілеріне арналған қауіпсіздікті оқытудың қолданыстағы әдістері алдауға үйретілген генеративті ЖИ жүйелерін тоқтатуға «қауқарсыз». Олар қолданыстағы әдістерді жетілдіру қажет деген қорытындыға келді.

Өткен жылдың басында кейбір технология жетекшілері, соның ішінде Илон Маск «адамзат үшін үлкен қауіп болуы мүмкін» деген себеппен ЖИ эксперименттерін тоқтатуға шақырды.

2023 жылдың қараша айында 28 елдің, соның ішінде ҚХР, АҚШ және ЕО мемлекеттерінің өкілдері жасанды интеллектті қауіпсіз пайдалану бойынша бірінші саммит өткізді, онда олар ЖИ-дің "шекаралық" деп аталатын модельдерімен байланысты тәуекелдермен күресуге бағытталған пактіге қол қойды.

Жігер Ауыпбаев әйелімен ажыраса сала бір қызға қатты ғашық болғанын айтты Журналист Мысырда қаза тапқан Ақмарал Мұқанова туралы айтып берді Джо Байденге қатерлі ісік диагнозы қойылды Каспий теңізінде жер сілкінісі болды Антикор Ермек Тұрсыновқа қатысты тергеу жүргізіліп жатпағанын айтты «Бір қоңыраумен-ақ соғысты тоқтатамын»: Трамп Путин мен Зеленскийге хабарласпақ Бүгін ауа райына байланысты бірқатар өңірде ескерту жарияланды Рим папасы Путин мен Зеленскийге келіссөзді Ватиканда өткізуді ұсынды Атыраулық еркек бес жыл бойы өгей қызын зорлап келген «Соғыс тоқтамайды»: Украина мен Ресей арасындағы келіссөз екі сағатқа да созылмады Путин Қасым-Жомарт Тоқаевты туған күнімен құттықтады Ақтөбеде бизнесмендерді бопсалаған «Антикор қызметкері» ұсталды Бүгін бірнеше өңірде ауа райына байланысты ескерту жарияланды «Қыздың бәрін ғашық қылған»: Тамара Асар тәлімгер Мұхамеджан Тазабектің серілігін айтты (ВИДЕО) «Мәдинаға келіп-кетіп жүретін»: марқұм әншіге Болат Назарбаев зәулім үй сыйлағаны белгілі болды Free Fire алаяқтығы: Шымкенттік оқушы «үздік» ойын аккаунты үшін 2 миллион теңгеден айырылған Назарбаев мектебіне түскен оқушы қуаныштан жылап қалды (ВИДЕО) «Шоколад орнына телефон»: Павлодардағы түрмеге телефон жасырып кіргізбек болған Астанада жеңіл көлік жолдан өтіп бара жатқан баланы қағып кетті Жапонияда қылмыстық топ құрған өзбек жігіттер ұсталды (ВИДЕО)