Lmst

Apple Intelligence uczone na pirackich książkach? Gigant pozwany przez naukowców

Apple musi zmierzyć się z poważnymi oskarżeniami, które uderzają w fundamenty ich nowej (wciąż niedostępnej w Polsce) platformy AI.

Naukowcy złożyli pozew zbiorowy przeciwko firmie, twierdząc, że ich książki zostały nielegalnie wykorzystane do trenowania modeli językowych Apple Intelligence bez żadnej licencji ani zgody.

Sprawa, wytoczona przez profesorów Susanę Martinez-Conde i Stephena Macknika, dotyczy dwóch publikacji naukowych. Autorzy zarzucają, że ich prace znalazły się w ogromnym zbiorze danych „Books3”, który był częścią większej biblioteki „The Pile”, oficjalnie wykorzystanej przez Apple do szkolenia swoich modeli, w tym OpenELM. Problem w tym, że „Books3” był zbiorem znanym z tego, że zawierał około 186 tysięcy pirackich kopii książek, a dzieła powodów znajdowały się na liście tychże tytułów.

100 milionów miejsc pracy zagrożonych. Bernie Sanders proponuje „podatek od robotów”

W pozwie złożonym w piątek po południu czytamy, że Apple, korzystając z tego zbioru, w całości skopiowało chronione prawem autorskim prace i bezpośrednio naruszyło prawa ich oraz innych twórców. Co istotne, zbiór „Books3” został usunięty z publicznego dostępu w październiku 2023 roku właśnie z powodu masowego łamania praw autorskich, jednak zdążył już posłużyć jako „pożywka” dla wielu modeli AI. W tym, jak się okazuje, także Apple Intelligence.

Sprawa jest daleka od prostej i wpisuje się w szerszą, nierozstrzygniętą jeszcze debatę prawną dotyczącą tego, czy trenowanie AI na publicznie dostępnych, ale chronionych prawem danych, mieści się w ramach tzw. dozwolonego użytku („fair use”). Sądy w Stanach Zjednoczonych wydawały dotąd różne, często sprzeczne orzeczenia. Kluczowe dla autorów będzie udowodnienie, że Apple faktycznie wykorzystało ich konkretne książki w procesie treningowym, co może być trudne, gdyż firma nie ujawnia szczegółowej listy przetworzonych dokumentów.

Autorzy pozwu domagają się procesu z udziałem ławy przysięgłych, odszkodowania pieniężnego oraz sądowego zakazu dalszego wykorzystywania ich prac przez Apple. Jeśli naruszenie zostanie uznane za umyślne, amerykańskie prawo przewiduje kary sięgające nawet 150 000 dolarów za każde pojedyncze dzieło. Wyrok w tej sprawie może stać się ważnym precedensem dla całej branży technologicznej i zdefiniować na nowo zasady gry na rynku sztucznej inteligencji. O ile w ogóle kiedykolwiek zapadnie.

Kolejne trzęsienie ziemi w Apple? Firma ma aktywnie szukać następcy szefa od AI

#AI #Apple #AppleIntelligence #Books3 #fairUse #naukowcy #news #OpenELM #piractwo #pozew #prawaAutorskie #proces #sztucznaInteligencja #ThePile

Dwóch autorów oskarża Apple o nielegalne szkolenie AI na pirackich książkach

Dwóch autorów, Grady Hendrix i Jennifer Robertson, wniosło pozew zbiorowy przeciwko Apple w północnej Kalifornii, donosi Reuters.

Twierdzą, że Apple użyło pirackiego zestawu danych Books3, zawierającego ich publikacje, do trenowania modeli językowych OpenELM i prawdopodobnie także Foundation Language Models.

Pozew żąda m.in.:

uznania sprawy za pozew zbiorowy,
odszkodowań i zwrotów strat,
zakazu dalszego używania nielegalnych materiałów,
zniszczenia wszystkich modeli i zestawów treningowych wykorzystujących pirackie książki,
zwrotu kosztów prawnych.

Z pozwu:

Ale Apple buduje część nowego przedsięwzięcia przy użyciu Books3, zbioru danych pirackich książek chronionych prawem autorskim, który zawiera opublikowane dzieła Powodów i Klasy. Apple wykorzystało Books3 do szkolenia swoich modeli językowych OpenELM. Apple prawdopodobnie trenowało również swoje modele językowe Foundation przy użyciu tego samego pirackiego zbioru danych.

Sprawa przypomina wcześniejsze procesy: Anthropic zapłacił 1,5 mld USD w podobnym przypadku, podczas gdy Meta wygrała w sądzie, bo użycie książek uznano za fair use.

Potężny cios dla branży AI. Anthropic zapłaci 1,5 mld dolarów i zniszczy dane z pirackich książek

#AITrainingDataset #AppleAI #AppleIntelligence #Books3Dataset #FoundationLanguageModels #OpenELM #pirackieKsiążkiAI #pozewZbiorowyApple #prawaAutorskie #sprawySądoweAI

Apple faces a new class action lawsuit as Grady Hendrix and Jennifer Roberson claim their books were used without consent to train AI models. The suit, filed in Northern California, follows similar actions against tech giants over unauthorized use of copyrighted content in AI development. Discover the ongoing battle over IP rights in AI: https://www.cnbc.com/2025/09/05/apple-sued-by-authors-over-use-of-books-in-ai-training.html #Apple #AI #Copyright #Lawsuit #GradyHendrix #JenniferRoberson #IntellectualProperty #OpenELM #Publishing #Technology

#shownotes for @gamesatwork_biz #podcast e473 are done and publication set for tomorrow, Monday 22 July on https://www.gamesatwork.biz , YouTube and all your favorite podcast feeds! This episode has #TheSphere in fabulous #LasVegas, #AI, #OpenELM, #OpenSCAD, #OpenSource, #UnderWare #CableManagement, #FloppyDisks still in productive use, and even more. Be sure to subscribe on https://www.gamesatwork.biz so you don’t miss an episode!

Number 13 billiard ball on an orange background
Photo by Atypeek Dgn: https://www.pexels.com/photo/billiard-ball-on-bright-orange-surface-5986316/

on the #shownotes #grind for @gamesatwork_biz in preparation for Monday’s posting of e473. Stories about #TheSphere, #AI #OpenELM, #OpenSCAD, #CableManagement, the science of #BoardGames and more! Check out earlier episodes, chock full of #AI #metaverse #AR #VR #gamification and so much more on https://www.gamesatwork.biz

Photo of a billiard ball on a bright orange background by Atypeek Dgn: https://www.pexels.com/photo/billiard-ball-on-bright-orange-surface-5986316/

Apple 否認以 YouTube 訓練 AI 強調並未使用於 Apple Intelligence 之上
昨日我們報導過包括 Apple 在內的多間科技企業，被指在沒有獲得創作者同意下，利用對方的 YouTube 影片內容文本去訓練 AI。作出該項調查報導的媒體《Wired》指超過 17 萬段影片內容成為了訓練 AI 模型數據集的一部分，Apple 於 4 月公開的開源 OpenELM 模型亦有使用。事隔一日，Apple 就事件開腔回應。
The post Apple 否認以 YouTube 訓練 AI 強調並未使用於 Apple Intelligence 之上 appeared first on 香港 unwire.hk 玩生活．樂科技.
#人工智能 #Apple Intelligence #OpenELM #youtube
https://unwire.hk/2024/07/20/apple-%e5%90%a6%e8%aa%8d%e4%bb%a5-youtube-%e8%a8%93%e7%b7%b4-ai-%e5%bc%b7%e8%aa%bf%e4%b8%a6%e...

Na początku tego tygodnia głośno zrobiło się o dochodzeniu, które wykazało, że Apple i inni giganci technologiczni używali napisów YouTube do trenowania swoich modeli sztucznej inteligencji.

Obejmowało to ponad 170 000 filmów twórców takich, jak MKBHD, Mr. Beast oraz innych zasięgowych kanałów. Apple miało wykorzystać ten zestaw danych do trenowania swoich modeli OpenELM o otwartym kodzie źródłowym, które zostały wydane w kwietniu.

Apple publikuje rodzinę wydajnych modeli językowych open source

Apple potwierdziło jednak serwisowi 9to5Mac, że OpenELM nie zasila żadnej z jego funkcji Apple Intelligence ani nie wspiera Machine Learning stosowanego naurządzaniach firmy.

Ta twierdzi, że stworzyła model OpenELM jako sposób na wniesienie wkładu w społeczność badawczą i rozwój dużych modeli językowych typu open source. W przeszłości badacze Apple opisywali OpenELM jako „najnowocześniejszy otwarty model językowy”.

Według Apple, OpenELM został stworzony wyłącznie do celów badawczych, a nie do wykorzystania w celu zasilania jakichkolwiek funkcji Apple Intelligence. Model został opublikowany jako open-source i jest szeroko dostępny, w tym na stronie Apple Machine Learning Research.

Ponieważ OpenELM nie jest używany jako część Apple Intelligence, oznacza to, że zbiór danych o nazwie „Napisy YouTube” nie jest używany do zasilania Apple Intelligence.

Wreszcie, Apple powiedziało 9to5Mac również, że nie planuje tworzyć żadnych nowych wersji modelu OpenELM.

Jak podał Wired na początku tego tygodnia, firmy takie jak Apple, Anthropic i NVIDIA wykorzystały zestaw danych „Napisy YouTube” do trenowania swoich modeli sztucznej inteligencji. Ten zbiór danych jest częścią większej kolekcji o nazwie „The Pile”, stworzonej przez organizację non-profit EleutherAI.

Sprawa ma być dalej badana.

https://imagazine.pl/2024/07/18/apple-twierdzi-ze-ich-model-openelm-nie-byl-trenowany-na-youtubie/

#AI #AppleIntelligence #generatywnaSztucznaInteligencja #machineLearning #napisy #OpenELM #sztucznaInteligencja #YouTube

OpenELM : Apple klärt Missverständnisse in YouTube-Kontroverse
Apple hat jüngst klar gestellt, dass sein OpenELM Modell nicht für die Funktionen von Apple Intelligence verwendet wird. Diese Klarstellung folgt auf eine Untersuchung, die aufdeckte, dass Technologieunt
https://www.apfeltalk.de/magazin/news/openelm-apple-klaert-missverstaendnisse-in-youtube-kontroverse/
#News #Tellerrand #Apple #AppleIntelligence #KITraining #OpenSourceModelle #OpenELM #Technologieethik #YouTubeKontroverse

最近（～2024年5月）公開された LLM の性能を ELYZA-tasks-100 で比較してみた
https://qiita.com/wayama_ryousuke/items/33cfbe8ae69ec090ea77?utm_campaign=popular_items&utm_medium=feed&utm_source=popular_items

#qiita #LLM #karakuri_lm #Phi_3 #OpenELM #Fugaku_LLM

#IntelligenceArtificielle 🤖 #Snowflake et Apple lancent leurs grands modèles de langage #OpenSource

Présenté le 24 avril, #Arctic de Snowflake est le #LLM optimisé pour les entreprises disposant de 480 milliards de paramètres.

De son côté, Apple sort #OpenELM un modèle de langage décliné en 4 configurations : 270 millions, 450 millions, 1 milliard et 3 milliards de paramètres.

Sources :
- https://www.usine-digitale.fr/article/snowflake.N2212050
- https://www.numerama.com/tech/1732480-apple-publie-openelm-le-modele-de-langage-open-source-que-personne-nattendait.html

Apple unleashes 8 open-source AI models designed to operate directly on devices
#AI #GenAI #openELM

https://buff.ly/44mrHJd

@pylapp @aprilorg

"(...) “Apple releases OpenELM, the open source language model no one expected” – via press review @aprilorg

#opensource #April #OpenELM #GenAI

https://www.numerama.com/tech/1732480-apple-publie-openelm-le-modele-de-langage-open-source-que-personne-nattendait.html (...)"

« Apple publie OpenELM, le modèle de langage open source que personne n’attendait » - via la revue de presse @aprilorg

#opensource #April #OpenELM #GenAI

https://www.numerama.com/tech/1732480-apple-publie-openelm-le-modele-de-langage-open-source-que-personne-nattendait.html

🧠 E ancora modelli open di piccole dimensioni: #Apple rilascia #OpenELM.
👉 Una famiglia di modelli su misura per elaborazioni sui dispositivi.
💡 Viene usata una nuova architettura definita "layer-wise scaling", che consente di assegnare meno parametri agli strati iniziali del transformer vicino all'input, e di aumentarli verso gli strati di uscita.
⚙️ Questo permette di ottimizzare le risorse in base alla complessità delle informazioni ad ogni livello.

🔗 https://machinelearning.apple.com/research/openelm

#AI

Apple openELM: AI efficiente e accessibile 🧠📱 Modelli linguistici rivoluzionari per Siri e la privacy. #Apple #iOS18 #IntelligenzaArtificiale #OpenELM #Privacy

https://www.melamorsicata.it/2024/04/26/openelm-apple-modello-ai/

After Meta has published #Llama3 a week ago, #Apple has added 4 new #AI models to #HuggingFace 🤗 now called OpenELM.
https://huggingface.co/collections/apple/openelm-instruct-models-6619ad295d7ae9f868b759ca

#OpenELM apparently means "Open-source Efficient Language Models". They are designed to run entirely on a single device. It is a bit ironic that Apple and Meta offer open source models while #OpenAI does not, isn't it?
https://venturebeat.com/ai/apple-releases-openelm-small-open-source-ai-models-designed-to-run-on-device/

#Apple #openelm #opensource https://venturebeat.com/ai/apple-releases-openelm-small-open-source-ai-models-designed-to-run-on-device/

#Apple hat 8 Open Source Sprachmodelle (#LLM) auf #Huggingface veröffentlicht: https://huggingface.co/apple/OpenELM-3B-Instruct #OpenELM

Tuż przed debiutem iOS 18 na WWDC w czerwcu tego roku, Apple udostępniło rodzinę dużych modeli językowych o otwartym kodzie źródłowym. Nazwali je OpenELM.

W swoich testach Apple twierdzi, że OpenELM oferuje podobną wydajność do innych otwartych modeli językowych, ale przy mniejszej ilości danych szkoleniowych.

Firma wyjaśnia:

Udostępniamy OpenELM, najnowocześniejszy otwarty model językowy. OpenELM wykorzystuje strategię skalowania warstwowego, aby efektywnie alokować parametry w każdej warstwie modelu transformatorowego, co prowadzi do zwiększenia dokładności. Na przykład, przy budżecie parametrów wynoszącym około miliarda parametrów, OpenELM wykazuje 2,36% poprawę dokładności w porównaniu do OLMo, wymagając jednocześnie 2 razy mniej tokenów do wstępnego uczenia.
Odbiegając od wcześniejszych praktyk, które zapewniają jedynie wagi modelu i kod wnioskowania oraz wstępne szkolenie na prywatnych zbiorach danych, nasza wersja zawiera kompletne ramy szkolenia i oceny modelu językowego na publicznie dostępnych zbiorach danych, w tym dzienniki szkoleniowe, wiele punktów kontrolnych i konfiguracje wstępnego szkolenia. Udostępniamy również kod do konwersji modeli do biblioteki MLX w celu wnioskowania i dostrajania na urządzeniach Apple. Ta kompleksowa wersja ma na celu wzmocnienie i wzmocnienie otwartej społeczności badawczej, torując drogę dla przyszłych otwartych przedsięwzięć badawczych.

Więcej szczegółów można znaleźć tutaj:

WWDC 2024 wystartuje 10 czerwca – nie tylko iOS 18

https://imagazine.pl/2024/04/25/apple-publikuje-rodzine-wydajnych-modeli-jezykowych-open-source/

#AI #generatywnaSztucznaInteligencja #OpenELM #sztucznaInteligencja #WWDC

Apple 推出開源生成式 AI OpenELM 有 4 種版本 + 可在手機上運行
Apple 最近於 Hugging Face 上發布了 OpenELM 生成式人工智能模型，據悉這個 AI 模 […]
The post Apple 推出開源生成式 AI OpenELM 有 4 種版本 + 可在手機上運行 appeared first on 香港 unwire.hk 玩生活．樂科技.
#人工智能 #AI #Apple #OpenELM
https://unwire.hk/2024/04/25/apple-ai-open-elm/ai/?utm_source=rss&utm_medium=rss&utm_campaign=apple-ai-open-elm

#OpenELM

Client Info