Ғалымдар ЖИ үлгілеріне алдауды үйретуге болатынын анықтады

17.01.2024, 09:50
658
Ғалымдар ЖИ үлгілеріне алдауды үйретуге болатынын анықтады freepik.com

Жасанды интеллект модельдеріне алдауды үйретуге болады, ал одан қорғану әзірге «тиімсіз» дейді жаңа зерттеулер. Kazinform бұл туралы Euronews-ке сілтеме жасап хабарлап отыр.

 

АҚШ-тың Anthropic компаниясының зерттеушілері жасанды интеллект үлгілеріне алдауды үйретуге болатынын және қауіпсіздікті оқытудың қолданыстағы әдістері мұның алдын алуда «тиімсіз» екенін анықтады.

Зерттеудің мақсаты — жасанды интеллект (ЖИ) модельдеріне адамдар сияқты алдауды үйретуге болатынын анықтау.

Зерттеу барысында қатысушылар ЖИ модельдеріне алдауды үйретуге болатынын білді. Олар белгілі бір кіріс сигналдарынан туындайтын және айтарлықтай қауіпту болуы мүмкін «бэкдор» деп аталатын әрекетті жасау арқылы ЖИ үлгілеріне алдауды үйрете алды.

Зерттеуге қатысушылар ЖИ модельдерінің алдауды үйреніп қана қоймай, алдауға бейімділігін жасыра алатынын да анықтады.

Зерттеу авторлары тілдік модельдерге (LLM) үлкен қауіп тудыруы мүмкін екі нақты қауіпті қарастырды: алаяқтардың триггерлі модель ойлап табуы және алдаушы модельдің табиғи пайда болуы.

Зерттеушілер бұл екі қауіп те «мүмкін және олармен күресу өте қиын болатынын» айтты.

Зерттеушілердің пікірінше, ЖИ үлгілеріне арналған қауіпсіздікті оқытудың қолданыстағы әдістері алдауға үйретілген генеративті ЖИ жүйелерін тоқтатуға «қауқарсыз». Олар қолданыстағы әдістерді жетілдіру қажет деген қорытындыға келді.

Өткен жылдың басында кейбір технология жетекшілері, соның ішінде Илон Маск «адамзат үшін үлкен қауіп болуы мүмкін» деген себеппен ЖИ эксперименттерін тоқтатуға шақырды.

2023 жылдың қараша айында 28 елдің, соның ішінде ҚХР, АҚШ және ЕО мемлекеттерінің өкілдері жасанды интеллектті қауіпсіз пайдалану бойынша бірінші саммит өткізді, онда олар ЖИ-дің "шекаралық" деп аталатын модельдерімен байланысты тәуекелдермен күресуге бағытталған пактіге қол қойды.

«Кешірім сұрайтындай ешкімді атқан жоқпын»: Мақпал Жүнісова қас дұшпандарыма мереке сыйлап тұрамын деп мәлімдеме жасады Біреудің қаңсығы біреуге таңсық «Қыз болғанша тоқтамаймын»: Тәуекел Мүсілім қызы болғанын қатты армандап жүргенін айтты «Қазір қыз іздеп жүрмін»: боксшы Нұрбек Оралбай жеке өміріндегі құпияларын айтты Анамды жұмыс істеткізбеймін, бар жағдайын жасадым – Әбиба Әбужақынова Қайрат Боранбаев Қазақстанға әкелген футболшы Украинада опасыздық жасады деп айыпталды Таразда прокуратура қызметкері алаяқтық жасады деген күдікпен ұсталды 2-ақ адам қалған: Солтүстікте жыл соңына дейін 45 ауыл картадан жойылатыны белгілі болды «45 тәулікке қамалады»: Әйелі мен балаларын ұрып-соққан ақтөбелік жеңіл жазамен құтылды Екібастұзда 9-сынып оқушысы жоғалып кетті Тағы бір мерзімді әскери қызметші Ақтөбеде қайтыс болды Бақыт Сәрсекбаевтың әкесі қайтыс болды Әкем сырт көзге суық көрінгенімен жүрегі өте жұмсақ болды – Мұстафа Өзтүріктің үлкен қызы Прагада өткен Димаштың концертінде 9 жасар қыз тыңдармандарды тәнті қылды Қазақстанда бір күнде үш рет жер сілкінісі тіркелді Бүгін еліміздің 4 өңірінде ауа сапасы нашарлайды «Дауылды ескерту!»: 24 қарашаға арналған ауа райы болжамы жарияланды Баян Мақсатқызы кішкентай екі қызымен Дубайға демалысқа аттанды (ФОТО, ВИДЕО) «Шөмішбай Сариев үйімізге жиі келетін»: Жұлдыз Әбдікәрімова еске алу кешіне арнайы шақыртумен келген (ВИДЕО) «Қуырдақты былқылдатып, әңгімеміз жарасатын қыздарыма ысқырдым»: Қарақат Әбілдина өнердегі құрбыларын қонақ қылды (ФОТО)