НВСПОСТ » exclusive » Apple обучала собственный ИИ на субтитрах с YouTube без разрешения авторов

Apple обучала собственный ИИ на субтитрах с YouTube без разрешения авторов

10:15, 17 июль 2024
В мире
Компании Apple, Nvidia, Anthropic и Salesforce незаконно использовали субтитры сотен тысяч видеороликов с YouTube для обучения своих ИИ-моделей, не получив разрешения от авторов. Это выяснилось в ходе расследования, проведенного каналом Proof News.

В базу данных под названием The Pile были включены 172,5 тыс. видео с более чем 48 тыс. каналов, включая такие гиганты, как MrBeast, PewDiePie, Jacksepticeye, MKBHD, а также популярные ток-шоу.

Для анализа использовались только субтитры, без видео и звука. В датасет попали субтитры образовательных каналов Массачусетского технологического института и Гарвардского университета.

Apple, Anthropic, Nvidia и Salesforce признали, что использовали The Pile в своих исследованиях и для обучения ИИ-моделей. Первая организация применяла его для Apple Intelligence и OpenELM, представленной в апреле.

The Pile принадлежит некоммерческой организации EleutherAI, которая не запрашивала разрешения на использование видеороликов с YouTube. При этом датасет "доступен любому с доступом в интернет".

Anthropic и Salesforce заявили, что использовали The Pile для академических целей, считая его общедоступным.

Ctrl
Enter
Заметили ошЫбку
Выделите текст и нажмите Ctrl+Enter


[/smartphone]