Илон Маск заявил, что технологическим компаниям придётся использовать синтетические данные, созданные искусственным интеллектом, для обучения новых моделей. По его словам, человеческие знания, доступные для обучения ИИ, исчерпаны. Этот переход связан с необходимостью генерировать и перерабатывать данные системами ИИ, что Маск назвал процессом самообучения.
Компании, такие как Meta, Microsoft, Google и OpenAI, уже применяют синтетические данные для настройки своих моделей. Однако Маск предупредил, что «галлюцинации» ИИ — неточные или бессмысленные результаты — усложняют этот процесс, так как затрудняют проверку достоверности.
Эксперты предупреждают о рисках зависимости от синтетических данных. Эндрю Дункан из Института Алана Тьюринга отметил, что это может привести к снижению качества работы моделей, их предвзятости и недостатку креативности. Также возникает риск включения контента, созданного ИИ, в наборы данных, что ухудшит результаты.
Вопросы авторского права остаются актуальными: компании, такие как OpenAI, признают, что без использования защищённых материалов создание современных моделей было бы невозможно, что вызывает требования компенсации со стороны творческих индустрий.