Ғалымдар ЖИ үлгілеріне алдауды үйретуге болатынын анықтады

17.01.2024, 09:50
420
Ғалымдар ЖИ үлгілеріне алдауды үйретуге болатынын анықтады freepik.com

Жасанды интеллект модельдеріне алдауды үйретуге болады, ал одан қорғану әзірге «тиімсіз» дейді жаңа зерттеулер. Kazinform бұл туралы Euronews-ке сілтеме жасап хабарлап отыр.

 

АҚШ-тың Anthropic компаниясының зерттеушілері жасанды интеллект үлгілеріне алдауды үйретуге болатынын және қауіпсіздікті оқытудың қолданыстағы әдістері мұның алдын алуда «тиімсіз» екенін анықтады.

Зерттеудің мақсаты — жасанды интеллект (ЖИ) модельдеріне адамдар сияқты алдауды үйретуге болатынын анықтау.

Зерттеу барысында қатысушылар ЖИ модельдеріне алдауды үйретуге болатынын білді. Олар белгілі бір кіріс сигналдарынан туындайтын және айтарлықтай қауіпту болуы мүмкін «бэкдор» деп аталатын әрекетті жасау арқылы ЖИ үлгілеріне алдауды үйрете алды.

Зерттеуге қатысушылар ЖИ модельдерінің алдауды үйреніп қана қоймай, алдауға бейімділігін жасыра алатынын да анықтады.

Зерттеу авторлары тілдік модельдерге (LLM) үлкен қауіп тудыруы мүмкін екі нақты қауіпті қарастырды: алаяқтардың триггерлі модель ойлап табуы және алдаушы модельдің табиғи пайда болуы.

Зерттеушілер бұл екі қауіп те «мүмкін және олармен күресу өте қиын болатынын» айтты.

Зерттеушілердің пікірінше, ЖИ үлгілеріне арналған қауіпсіздікті оқытудың қолданыстағы әдістері алдауға үйретілген генеративті ЖИ жүйелерін тоқтатуға «қауқарсыз». Олар қолданыстағы әдістерді жетілдіру қажет деген қорытындыға келді.

Өткен жылдың басында кейбір технология жетекшілері, соның ішінде Илон Маск «адамзат үшін үлкен қауіп болуы мүмкін» деген себеппен ЖИ эксперименттерін тоқтатуға шақырды.

2023 жылдың қараша айында 28 елдің, соның ішінде ҚХР, АҚШ және ЕО мемлекеттерінің өкілдері жасанды интеллектті қауіпсіз пайдалану бойынша бірінші саммит өткізді, онда олар ЖИ-дің "шекаралық" деп аталатын модельдерімен байланысты тәуекелдермен күресуге бағытталған пактіге қол қойды.

Астаналықтар сұранысқа ие мамандықтарды тегін оқи алады Қазақстандық дипломаттың әйелі күйеуі 10 жыл бойы азаптағанын мәлімдеді: СІМ жауап берді Тоқаев Сербия астанасы Белградқа барады Ақтөбеде тасқыннан жапа шеккен 268 отбасының материалдық шығыны төленді "6-сыныпта өзіме көйлек тіктім": Айжан Нұрмағамбетова балалық шағын есіне алды Елордада Run for Autism қайырымдылық жарысы өтеді Жаңа адамдар оқу орындарда су тасқынынан зардап шеккендерге көмек беру орталықтарын ашты. Бразилияда су тасқынынан қаза тапқандар саны 78 адамға жетті Ұлттық банк жаңа коллекциялық монеталарды айналымға шығарады Михаил Ломтадзе әлемдік деңгейдегі балалар футбол академиясын құрады БАӘ-дегі елшінің кеңесшісі әйелін 10 жыл бойы азаптаған: Карина Мамаш үндеу жариялады (видео) Алматыдағы Әзербайжан-Армения келіссөзінің қашан өтетіні белгілі болды Биыл Уругвайда Қазақстанның консулдығы ашылады «Айбын» орденінің І дәрежесіне неге Бауыржан Момышұлы емес, Сағадат Нұрмағамбетовтің есімі берілді SpaceX ғарышқа саяхат билеттерін сатуды 2024 жылы бастайды Мемлекет басшысының жарлығымен бірқатар азамат арнаулы әскери атақ алды ШҚО-да қараусыз қалған 2 жасар бала суға батып кетті Димаштың Будапешт қаласындағы концертін тамашалауға әлемнің 77 елінен адам келді Қазақстан алтын сатып алу бойынша әлемде үшінші орында тұр Еліміздің қай өңірінде құрғақшылық болуы мүмкін