Использование контента YouTube для обучения ИИ Google > 2025-06-20

Компания Google активно использует контент из огромной библиотеки YouTube для обучения своих технологий искусственного интеллекта, таких как Gemini и новый генератор видео и аудио Veo 3. Об этом сообщает CNBC, ссылаясь на свои источники.

Один из источников издания отметил, что для обучения используется набор из 20 миллиардов видео. Google подтвердила эту информацию, но уточнила, что речь идет только о части контента в рамках соглашений с авторами и медиа-компаниями.

Представитель YouTube объяснил, что компания всегда использовала свой контент для улучшения своих сервисов - появление генеративного ИИ не изменило эту практику. "Мы понимаем важность гарантий, поэтому разработали надежные механизмы защиты для авторов", - заявили в компании.

Тем не менее, эксперты выражают опасения относительно последствий для авторских прав. Они считают, что использование чужих видео для обучения ИИ без ведома их создателей может привести к кризису в сфере интеллектуальной собственности. Хотя YouTube утверждает, что ранее информировал об этом, большинство авторов даже не догадывались, что их контент используется для обучения.

Google не раскрывает, сколько видео использовано для обучения моделей. Но даже если речь идет о 1% библиотеки, это больше 2,3 миллиарда минут контента - в 40 раз больше, чем у конкурентов.

Авторы, загружая видео, предоставляют YouTube широкие права на использование контента. Однако возможности отказаться от обучения своих видео для моделей Google нет.

Представители организаций, защищающих цифровые права, считают, что многолетний труд авторов используется для разработки ИИ без вознаграждения или даже уведомления. Например, компания Vermillio создала сервис Trace ID, который определяет сходство созданных ИИ роликов с оригинальным контентом. В некоторых случаях соответствие превышало 90%.

Некоторые авторы не против использования их контента для обучения, рассматривая новые инструменты как возможность для экспериментов. Однако большинство считает, что ситуация непрозрачна и требует более четких правил.

YouTube даже заключил соглашение с Creative Artists Agency для разработки системы управления ИИ-контентом, который имитирует известных людей. Однако механизмы удаления или отслеживания похожего контента все еще несовершенны.

Тем временем в США уже звучат призывы предоставить авторам юридическую защиту, которая позволила бы им контролировать использование их творчества в мире генеративного ИИ.

Напомним, что недавно компания Google изменила свои внутренние правила модерации контента на YouTube - теперь видео, которые частично нарушают правила, могут оставаться онлайн, если их считают социально важными.