Вообще, конечно, занятно, как технологический прогресс преображает морально-этический ландшафт и баланс власти и доминирования. В частности, это касается копирайта.
Ещё лет 20 назад всё было предельно ясно. #Копирайт есть инструмент капитализма и господства, свободное копирование - это лучший способ подрыва основ Системы и путь к свободе. Идеи, тексты и программы не должны быть проприетарными (собственническими), они должны принадлежать всем, потому что в конечном итоге вдохновение нельзя присвоить. Information wants to be free. На этой волне зародились свободные лицензии типа #CreativeCommons и т.п.
А что же теперь? Мы живём в мире, где горстка сверхбогатых олигополистических бигтех-корпораций непрестанно обкачивает Веб, чтобы обучать на скачанных текстах большие генеративные модели. Исследователи из академии тоже обкачивают и обучают, но у них не так много ресурсов, так что модели получаются похуже. Корпоративные модели же уже достигли качества, при котором их можно монетизировать (что #OpenAI и #Google уже успешно делают). При этом сами модели остаются по большей части закрытыми и проприетарными (даже типа "опенсорсная" #Llama от #Meta на самом деле имеет очень запретительную лицензию).
Неудивительно, что мы видим волну судебных исков к этим самым корпорациям от разнообразных "ассоциаций авторов и художников". Общий смысл один и тот же: дорогой бигтех, вы не имеете права "красть" наши произведения и обучать на них хоть сколько-нибудь коммерческие продукты. То есть, фактически, заявляется "я _владею_ этими идеями и текстами, а вы - нет, так что платите мне за использование". Чистый копирайт.
Так что же сейчас этично и что подрывает фундамент Системы?
Ревностное охранение "авторских прав" на последовательности символов от коммерческого использования? Но это закрепляет собственническую концепцию "копирайта" и с высокой вероятностью потребует введения драконовских мер контроля, включая массовую слежку и пэйволлы на каждом углу.
А может быть, сейчас самое субверсивное - это по-прежнему продолжать топить за #антикопирайт, свободную информацию и "идеи принадлежат всему человечеству"? Но в существующих условиях это объективно создаёт преимущества для больших корпораций, которые могут практически бесплатно использовать огромные массивы данных, а затем "закрепощать" их в проприетарных моделях, которые, в свою очередь, закрепощают пользователей в vendor lock-ins. Ну и вдобавок генерируют мегатонны не-человеческих текстов, как указано по ссылке в исходном посте. В конечном итоге это вероятно приведет к дальнейшей концентрации власти и капитала в руках Google/Microsoft/Amazon/Apple/Meta/Nvidia.
Что делать, непонятно. Действительно, у каждого поколения своя #Революция
#LLM #bigtech #copyright #web #GenAI #модели