Технологии

ИИ переходит на синтетические данные для обучения

10.01.2025, 09:40

712

ИИ переходит на синтетические данные для обучения

Из-за истощения человеческих знаний в качестве базы для ИИ, технологические компании адаптируются к использованию контента, созданного искусственным интеллектом, несмотря на риски.

Илон Маск заявил, что технологическим компаниям придётся использовать синтетические данные, созданные искусственным интеллектом, для обучения новых моделей. По его словам, человеческие знания, доступные для обучения ИИ, исчерпаны. Этот переход связан с необходимостью генерировать и перерабатывать данные системами ИИ, что Маск назвал процессом самообучения.

Компании, такие как Meta, Microsoft, Google и OpenAI, уже применяют синтетические данные для настройки своих моделей. Однако Маск предупредил, что «галлюцинации» ИИ — неточные или бессмысленные результаты — усложняют этот процесс, так как затрудняют проверку достоверности.

Эксперты предупреждают о рисках зависимости от синтетических данных. Эндрю Дункан из Института Алана Тьюринга отметил, что это может привести к снижению качества работы моделей, их предвзятости и недостатку креативности. Также возникает риск включения контента, созданного ИИ, в наборы данных, что ухудшит результаты.

Вопросы авторского права остаются актуальными: компании, такие как OpenAI, признают, что без использования защищённых материалов создание современных моделей было бы невозможно, что вызывает требования компенсации со стороны творческих индустрий.

#Илон Маск #Искусственный интеллект #синтетические данные #ChatGPT