Перехват — это одно из многих средств массовой информации, которые в прошлом году подали в суд на OpenAI и Microsoft за использование работы журналистов для обучения ChatGPT без разрешения или кредита. Дело, которое OpenAI и Microsoft пытаются отклонить из федерального суда, показывает, почему цифровые новостные агентства особенно уязвимы перед мошенниками, работающими с искусственным интеллектом.
Чтобы внести ясность: не только такие торговые точки подвергаются риску. Актриса Скарлетт Йоханссон в понедельник обвинила OpenAI в том, что она имитирует ее голос в своем новом виртуальном помощнике, несмотря на то, что, как сообщается, дважды отклоняла предложения генерального директора Сэма Альтмана. Более крупные публикации также подняли вопросы о подходе OpenAI к человеческому труду. Но в отличие от голливудских звезд и печатных изданий, цифровые издания сталкиваются с некоторыми уникальными препятствиями в защите своей работы.
Точно так же, как OpenAI отрицает выбор актера с голосом, «устрашающе похожим» на голос Йоханссон, OpenAI и Microsoft попытались проигнорировать иск The Intercept.
В иске, поданном в феврале, The Intercept утверждала, что OpenAI и Microsoft нарушили федеральный закон, Закон об авторском праве в цифровую эпоху, используя истории, защищенные авторским правом, для обучения ChatGPT без уплаты каких-либо лицензионных сборов издателям и удаления базовой информации об авторстве. (Полное раскрытие: я не только пишу репортажи для The Intercept, но и являюсь одним из их адвокатов.)
«У Open AI и Microsoft есть экономический стимул пылесосить тяжелую работу новостных онлайн-изданий, игнорируя обучение, курирование, исследования и ресурсы, которые эти организации посвящают обеспечению своевременного и точного информирования общественности», — сказал Дэвид Бралоу. , главный юрисконсульт The Intercept. «Они хотели бы, чтобы мы заблудились в алгоритме, чтобы они могли продолжать ездить бесплатно».
Точно так же, как OpenAI отрицает выбор актера с голосом, «устрашающе похожим» на голос Йоханссон, OpenAI и Microsoft попытались проигнорировать иск The Intercept. В прошлом месяце они подали ходатайство о прекращении дела, которое будет рассмотрено федеральным судьей на Манхэттене 3 июня.
В прошлом году OpenAI подписала соглашения со многими изданиями о лицензировании их контента, в том числе с Associated Press, Le Monde, Financial Times и Axel Springer, немецким издательством, владеющим Politico и Business Insider.
Множество других СМИ подали в суд на OpenAI за различные нарушения авторских прав. В декабре иск подала газета New York Times, за ней в прошлом месяце последовали Chicago Tribune, New York Daily News и шесть других ежедневных газет, принадлежащих Alden Global Capital. Цифровые магазины Raw Story и AlterNet, представленные той же фирмой, что и The Intercept, подали отдельный иск в феврале.
Все истцы — как традиционные, так и цифровые — отметили в судебных документах, что их веб-сайты занимают видное место в собственных списках OpenAI, страницы которых были очищены для обучения более ранним версиям ChatGPT. Веб-сайт Intercept входит в список OpenAI «1000 самых популярных доменов» по данным, используемым для обучения GPT-2; Согласно описанию OpenAI, один из наборов данных содержит текст, взятый с более чем 6400 отдельных страниц домена The Intercept.
Но OpenAI и Microsoft призвали окружной суд отклонить иски The Intercept по многочисленным причинам, включая то, что The Intercept не может указать на каждую статью, которая когда-либо была загружена в ChatGPT.
В заявлении, поданном на прошлой неделе, OpenAI заявила, что The Intercept не смогла идентифицировать «ни одну работу, из которой OpenAI предположительно удалила информацию об управлении авторскими правами».
Как возражает The Intercept, только OpenAI и Microsoft могут знать, какие конкретные статьи входят в обучающие наборы ChatGPT, если только суд не разрешит дело перейти к раскрытию.
Благодаря тому, как работают современные средства защиты авторских прав, New York Times и другие печатные издания выдвигают гораздо более прямые претензии, чем The Intercept и другие цифровые издания. Чтобы претендовать на возмещение ущерба, причиненного нарушением авторских прав, авторы должны зарегистрировать свои работы в Бюро регистрации авторских прав США. Регистрировать массовые печатные новостные статьи относительно просто; Используя онлайн-портал, издания могут одновременно зарегистрировать печатные выпуски за целый месяц.
Но подобного массового процесса не существует для онлайн-изданий, которые должны регистрировать каждую статью индивидуально в Бюро авторских прав. Ранее в этом году Бюро регистрации авторских прав опубликовало новый процесс регистрации новостных веб-сайтов, который все еще находится на рассмотрении. Но нынешние регистрационные требования являются дорогостоящими и отнимают много времени и, следовательно, непрактичны для некоммерческих организаций с ограниченным бюджетом, таких как The Intercept.
Не имея возможности ссылаться на традиционные иски о нарушении авторских прав, The Intercept обратилась к несколько новым аргументам в рамках DMCA, который Конгресс принял в 1998 году. Как резюмирует Бюро регистрации авторских прав, DMCA был призван «переместить национальный закон об авторском праве в цифровую эпоху».
Согласно DMCA, незаконно намеренно удалять «информацию об управлении авторскими правами», такую как название произведения и автора, а также распространять это произведение, зная, что информация была удалена. The Intercept и другие истцы утверждают, что OpenAI и Microsoft нарушили оба этих положения, обучая ChatGPT статьям журналистов без этой информации об авторстве.
«The Intercept — не первая компания, которая бросает вызов этой технологии, предъявляя претензии в соответствии с положением Закона о защите авторских прав в цифровую эпоху, касающимся удаления информации об управлении авторскими правами», — написали адвокаты Microsoft в своем заявлении, назвав иск The Intercept «самым скудным из множества подобных исков».
В следующем месяце окружной суд рассмотрит вопрос о том, будет ли продолжен иск The Intercept.
Если дело будет отклонено, OpenAI сможет продолжить обучение ChatGPT извергать слова, которые «устрашающе похожи» на работу цифровых изданий, таких как The Intercept, не платя за эту работу.
источник: theintercept.com