#LargeLanguageModel

Forschungszentrum Jülichfzj@social.fz-juelich.de
2025-07-03

🧠 Was genau ist eigentlich ein #LLM?

Ein #LargeLanguageModel (LLM) erzeugt mit Hilfe von maschinellem Lernen Texte – so wie dieser hier. Dazu lernt es aus Trainingstexten, wie Wörter miteinander in Verbindung stehen.

In unserer Rubrik #BesserWissen erklären wir, wie ein LLM funktioniert, wo seine Grenzen liegen – und was Jülicher Forschende damit zu tun haben.

📖 Neugierig geworden? In unserem effzett-Magazin gibt es mehr "Besserwisser".

👉 effzett.fz-juelich.de

Illustration: Diana Köhne

Yonhap Infomax Newsinfomaxkorea
2025-07-03

KT Corp. will open-source its proprietary Korean LLM 'Mi:um 2.0' for commercial use, aiming to boost South Korea's AI ecosystem and global competitiveness.
:um20
en.infomaxai.com/news/articleV

Sobre el entrenamiento de los Modelos de Lenguaje Grande (LLM por su sigla en inglés) y el derecho de autor

«Los LLM, siglas en inglés de “Large Language Model”, o en español «modelos de lenguaje grande» son una categoría de modelos de inteligencia artificial (IA) que pueden entender y generar lenguaje humano.

Los LLM son modelos de aprendizaje automático que se entrenan con grandes cantidades de datos. Su arquitectura se basa en redes neuronales que aplican aprendizaje profundo (“deep learning”) para representar las relaciones complejas entre palabras a partir de grandes volúmenes de datos extraídos de internet, libros y artículos científicos.

El aprendizaje profundo se refiere a una forma de aprendizaje automático que emplea redes neuronales de múltiples capas, lo que permite procesar datos no estructurados (como imágenes, videos y texto). A través de este proceso de entrenamiento, que puede tener múltiples etapas e involucrar distintos niveles de intervención humana, los LLMs aprenden cómo se usan las palabras entre sí en el lenguaje, y pueden aplicar estos patrones aprendidos para realizar tareas de procesamiento del lenguaje natural.

LLMs en la práctica clínia Hospital Italiano

Sobre el uso «de grandes volúmenes de datos extraídos de internet, libros y artículos científicos» y el derecho de autor de esos grandes volúmenes de datos, una reflexión de  Sven Slootweg

«Veo que muchas personas responden a la situación de los LLM y los derechos de autor con pedidos de aplicación más estricta de los derechos de autor, y honestamente creo que es una postura terrible.

No porque estas empresas LLM no deban ver consecuencias (¡deberían!), sino porque hay una observación mucho más importante que hacer: esta situación demuestra cómo eso de que «el copyright protege a los artistas» siempre ha sido un mito.

Si los derechos de autor realmente protegieran a los artistas, se habría aplicado con celeridad contra estas empresas de LLM, de la misma manera que se aplica con celeridad cuando se crea un sitio web de piratería en, por ejemplo, Estados Unidos. Pero no fue así.

Y eso demuestra lo que *realmente* son los derechos de autor: una herramienta de poder para quienes tienen mucho dinero para gastar en guerras legales. Siempre ha sido así: otorgando poder a quienes ya lo tienen en abundancia y quitándoselo a quienes tienen muy poco.

Es por eso que estas compañías LLM parecen inmunes a las leyes de derechos de autor: ellas tienen dinero y usted, como artista, no.

Los derechos de autor son una solución fundamentalmente mala para proteger a los artistas; están diseñados para beneficiar a los ricos y poderosos. ¡No se soluciona con más! De lo que *deberíamos* hablar es de mejores soluciones que *sí* funcionen.

Además, no se trata de un caso de «mejor algo que nada».

Cualquier tipo de «aplicación más estricta» de los derechos de autor que se solicite e instituya como resultado de las empresas LLM, *será* utilizada como arma contra los impotentes (artistas independientes y otros por igual) en el futuro.

Comentarios

tivasyk @tivasyk
#cita | «Esta situación demuestra que eso de que «los derechos de autor protegen a los artistas» siempre ha sido un mito». ¡

Excelente argumento!

kit de mg @kit
@joepie91 Publicación increíblemente culta, verdadera, real, correcta y buena.

*

Qybat @Qybat
@ joepie91 Los piratas lo sabemos desde hace décadas. Puedes meterte en muchos problemas por infringir los derechos de autor de una empresa con abogados o el dinero para contratarlos, pero para un artista individual sin ese respaldo, cualquier intento de hacer valer sus derechos es inútil. Lo único valioso que puedes hacer con tus derechos de autor es encontrar una editorial dispuesta a aceptarlos y a hacerlos valer por ti, a cambio de la mayor parte de los ingresos.

Monje polonioso @Uair
@ joepie91

Cory Doctorow tiene algunos.

b9AcE @b9AcE@todon.eu
@ joepie91 He estado pensando en algún tipo de solución tipo biblioteca para generar ingresos (asumiendo que todavía estamos en el mismo sistema económico general que ahora) para los artistas, mediante el cual cada uso (o aproximado) de una obra se registraría en un fondo mensual y luego los fondos de impuestos se podrían distribuir entre los creadores en función de su uso proporcional.

Creo que, por ejemplo, los índices de audiencia de la televisión (es decir, cuántos espectadores tenía cada programa) al menos solían generarse estadísticamente al tener un número mucho menor que la población total que tenía algún dispositivo que registraba lo que veían y luego se presumía que esos eran estadísticamente representativos y los números se ampliaban según fuera apropiado para obtener los números totales de espectadores, de modo que podría ser una base, tal vez con ajustes para creadores más pequeños.

Parece que algo así debería ser posible.

olaf @olav
@ joepie91 Los derechos de autor pueden funcionar si pagas/presentas el registro y probablemente puedas pagar un abogado decente.

olaf @olav
@ joepie91 *puede

dragonfi @dragonfi
@ joepie91 También creo que tratar algo infinitamente copiable y compartible como un recurso finito es una idea errónea.

La información «quiere» ser libre, deberíamos encontrar una mejor forma de apoyar a los artistas y beneficiar al público, a la vez que nos apoyamos en esta cualidad.

Toot original de Sven Slootweg y sus comentarios

#cita #copyright #derechosDeAutor #inteligenciaArtificial #LargeLanguageModel #llm #modelosDeLenguajeGrande

2025-06-19

In conversation with… the questions
We provided a broad range of questions to the AIs we tested. They're documented here and cover factual questions, wider information gathering, picture analysis and data analysis.

Read more to see what we went into.
diabettech.com/ai/in-conversat
#AI #DiabetesAI #LargeLanguageModel #LargeReasoningModel #LLM

2025-06-12

Welche Anbieter künstlicher Intelligenz Anwendungen gibt es, die ähnlich wie ChatGPT und Perplexity AI funktionieren? Was ist bei der Verwendung urheber- und lizenzrechtlich zu beachten?

Der nachfolgende Text ist mit Ausnahme der Fragen zu Aleph Alpha  von Perplexity AI erstellt worden. Die Antworten zu Aleph Alpha stammen von der französischen KI Anwendung Le Chat. Auf die Idee bin ich gekommen, weil der von mir verwendete Firefox-Browser mir proaktiv die Möglichkeit angeboten hat, Suchanfragen als ganze Fragen bei Perpexity AI zu formulieren. Folgende Fragen (Prompts) habe ich formuliert:

Welche mit Perplexity AI vergleichbaren Anbieter gibt es?

Worin unterscheiden sie sich hinsichtlich

Standort,

Sprachmodell,

Erlösquellen und

Preismodell?

Bei wem liegt das Urheberrecht für den von Dir gerade entworfenen Text?

Welche Möglichkeiten habe ich, diesen Text in meinem persönlichen Blog zu verwenden?

Muss ich dabei ein Lizenzgebühr entrichten oder Perplexity AI als Quelle nennen?

Auf welche Nutzungsbedingungen von Perplexity AI muss ich im einzelnen achten, wenn ich einen von Perplexity AI entworfenen Text in meinem Blog verwende?

Was ist „Le Chat“ von Mistral?

Auf welchen Sprachmodellen basiert „Le Chat“?

Existiert ein Wettbewerber von Le Chat bzw. Mistral in Deutschland?

Bietet Aleph Alpha einen öffentlichen Service ähnlich wie Le Chat?

Interessant ist, dass Perplexity AI bei der Erstanfrage „Le Chat“ unerwähnt gelassen hat. […]

#KI #LargeLanguageModel Volltext/Browserlink:
https://plinubius.de/welche-mit-perplexity-ai-vergleichbaren-anbieter-gibt-es-was-ist-bei-der-verwendung-urheber-und-lizenzrechtlich-zu-beachten/

2025-06-10

So not your recommended tools for making things better, but what about all the people seeking to make things worse? Would a #LargeLanguageModel / #LLM be right for them? Or perhaps a #GenerativeAdversarialNetwork / #GAN, could one of those help someone make things worse, faster?

2025-06-04

@boelder
RE
corporations putting confidential data in #insecure #datastorage owned by Amazon

@not2b
RE
using it for training...

@Haste
RE
AI scribe taking session notes.... the rooms are capable of recording now, but assured me that it is⭕ "completely deleted” in a “timely fashion”

IMO, the #AI is ⭕listing and using the sentences that go into the #LLM after this the original TEXT and AUDIO can be deleted.
This deletion is not the issue, right⁉️

#LargeLanguageModel
en.wikipedia.org/wiki/Large_la

मोहित ठाकुरrightnewshindi@rightnewsindia.com
2025-06-03

भारत जेन: जितेंद्र सिंह ने लॉन्च किया भारतीय भाषाओं के लिए स्वदेशी AI मॉडल, 22 भाषाओं में देगा समाधान

India News: केंद्रीय विज्ञान और प्रौद्योगिकी मंत्री जितेंद्र सिंह ने भारत जेन का शुभारंभ किया। यह भारतीय भाषाओं के लिए पहला स्वदेशी AI आधारित मल्टीमॉडल वृहद भाषा मॉडल है। इसका उद्देश्य भाषाई और सांस्कृतिक विविधता को बढ़ावा देना है। यह पहल स्वास्थ्य, शिक्षा और शासन जैसे क्षेत्रों में क्रांति लाएगी। भारत जेन 22 भारतीय भाषाओं में समाधान प्रदान करेगा।

भारत जेन का मिशन

भारत जेन एक राष्ट्रीय मिशन है। इसका लक्ष्य नैतिक और समावेशी AI विकसित करना है। यह मॉडल भारतीय मूल्यों और संस्कृति में गहराई से निहित है। जितेंद्र सिंह ने इसे आत्मनिर्भर भारत का प्रतीक बताया। यह पहल वैश्विक AI मॉडलों से अलग है। यह भारत की भाषाई और सांस्कृतिक जरूरतों को प्राथमिकता देता है। यह मॉडल जनता के लिए सुलभ होगा।

मल्टीमॉडल AI की विशेषताएं

भारत जेन पाठ, भाषण और छवि को एकीकृत करता है। यह 22 भारतीय भाषाओं में काम करता है। द हिंदू के अनुसार, यह मॉडल क्षेत्र-विशिष्ट समाधान प्रदान करेगा। यह कम डिजिटल उपस्थिति वाली भाषाओं के लिए डेटा-कुशल शिक्षण पर केंद्रित है। इसका डेटासेट भारत-केंद्रित है। यह डेटा संप्रभुता को मजबूत करता है। यह मॉडल शिक्षा और स्वास्थ्य जैसे क्षेत्रों में सहायता करेगा।

राष्ट्रीय मिशन का हिस्सा

भारत जेन राष्ट्रीय अंतःविषयी साइबर-भौतिक प्रणाली मिशन का हिस्सा है। इसे आईआईटी बॉम्बे के टीआईएच फाउंडेशन द्वारा कार्यान्वित किया गया है। विज्ञान और प्रौद्योगिकी विभाग इसका समर्थन करता है। यह पहल शैक्षणिक संस्थानों और विशेषज्ञों को एकजुट करती है। जितेंद्र सिंह ने इसे भारत की तकनीकी प्रगति का प्रतीक बताया। यह मॉडल दो साल में पूरा होगा।

विभिन्न क्षेत्रों में प्रभाव

भारत जेन कई क्षेत्रों में बदलाव लाएगा। यह स्वास्थ्य सेवा में AI आधारित टेलीमेडिसिन को बढ़ावा देगा। शिक्षा में यह स्थानीय भाषाओं में सामग्री प्रदान करेगा। शासन में यह नागरिकों की शिकायतों को तेजी से हल करेगा। जितेंद्र सिंह ने कहा कि यह मॉडल हर भारतीय की सेवा करेगा। यह ग्रामीण और शहरी दोनों क्षेत्रों में प्रभावी होगा।

वैश्विक स्तर पर भारत की स्थिति

भारत जेन भारत को AI में वैश्विक नेता बनाएगा। जितेंद्र सिंह ने इसे UPI जैसी सफलता से जोड़ा। यह मॉडल भारत की तकनीकी स्वतंत्रता को बढ़ाएगा। यह विदेशी तकनीक पर निर्भरता कम करेगा। यह स्टार्टअप्स और उद्योगों के लिए नया अवसर प्रदान करेगा। इंडिया AI के अनुसार, यह भारत की डिजिटल कहानी को मजबूत करेगा। यह मॉडल 2026 तक कई मील के पत्थर हासिल करेगा।

#bharatGen #largeLanguageModel

2025-06-03

The more I ask , the more I feel I have more luck asking my dog what time is it.

Farooq | فاروقfarooqkz@cr8r.gg
2025-05-30

Shoot! Mastodon has to take considerations for garbage generators as they are starting to appear:

hopperhq.com/tools/mastodon-po

And of course, I am not saying LLMs are garbage generators. But this is called abuse.

#hopperhq #MastodonPostGenerator #LLM #AI #MachineLearning #LargeLanguageModel #spam #mastodon

Railpagerailpage
2025-05-22

Revolutionising rail operations with AI and generic Large Language Models for freight wagons dlvr.it/TKwKzW

Ars Technica Newsarstechnica@c.im
2025-05-16

xAI says an “unauthorized” prompt change caused Grok to focus on “white genocide” arstechni.ca/JgaE #ArtificialIntelligence #largelanguagemodel #whitegenocide #grok #LLMs #xAI #AI

2025-05-16
distortion here and there and everywhere

not the ball valve that makes your garden wet!
antique globe shaped radio tubes girl!

a visible example how statistics irons out information

#autotranslate #screenshot #largelanguagemodel
you see the screenshot of a auction site where autotranslate messed the content: British „ball valves“ refer to American „globe radio tubes“ Deutsch „Birnenform“ and not a valve to shutoff a watering hose
Sandra Niemeyerniemeyers@blog.tib.eu
2025-05-15

Three questions to Dr Allard Oelen and Dr Mohamad Yaser Jaradeh on one year of ORGK Ask

diesen Beitrag auf Deutsch lesen

The “ORKG Ask” service was launched in May 2024 and is now a year old. This scientific search and discovery system provides answers from almost 80 million scientific documents, helping researchers to find the scientific publications they need. Dr Allard Oelen and Dr Mohamad Yaser Jaradeh from TIB developed the AI-based tool in just four months. In this interview, they discuss the tool, its functions, the challenges they faced during development and in the first year, and the features that will be added in the coming months.

What motivated the development of ORKG Ask, and how does ORKG Ask differ from other scientific search systems? What unique advantages does it offer users, and what impact will the tool have on scientific research?

Dr Allard Oelen // Photo: TIB /C. Bierwagen

Dr Allard Oelen: ORKG Ask is a next-generation scholarly search engine that uses the latest artificial intelligence (AI) technologies, such as large language models (LLMs) and semantic embeddings, to help researchers find relevant papers more efficiently.

Dr Mohamad Yaser Jaradeh: Established search systems often use keyword-based searches, leaving researchers to extract relevant information from the candidate articles themselves. ORKG Ask, on the other hand, uses a neural semantic search, which enables it to do more than just match keywords; it can actually find relevant work. It also uses LLMs to extract key concepts and information from articles, providing direct and detailed answers to research questions.

What challenges did you face during the development of ORKG Ask and how did you solve them?

Dr Allard Oelen: We wanted to ensure the system was easy to use and accessible for everyone. This means we added several features that modern-day web applications have, such as a dark mode, full responsiveness, accessibility for visually impaired users, and the possibility to use the interface in multiple languages.

Dr Mohamad Yaser Jaradeh // Photo: TIB/C. Bierwagen

Dr Mohamad Yaser Jaradeh: Also, since the service is available publicly in production to the public, and not just a prototype, we used the latest technologies and best practices for development applications. ORKG Ask is fully open source, this also benefits potential future developers, for whom it is then easier to contribute to the codebase.

What developments have been made in the past twelve months since ORKG Ask went online and what improvements are planned for ORKG Ask in the future to increase its usefulness for the scientific community?

Dr Mohamad Yaser Jaradeh: ORKG Ask is still in its infancy and there are a lot of plans to improve the service further. Recently, we introduced new reproducibility features, making it more transparent to users how answers are generated. For the future, we are working on customizing the LLMs for our particular usecases to improve the responsivenss and effiency of the results, Furthermore we want to leverage user-collected feedback to further guide development efforts, so in case you have any suggestions, please get in touch with us.

Dr Allard Oelen: For now, we plan to make a tighter integration with the core ORKG system, where Ask can be used to create ORKG Comparisons. Also, we plan to work on data provenance, showing to the user how specific LLM data is extracted, allow the user to further specify the LLM extracted information with schemas. As well as, permitting research institutes and interested parties in applying all functionalities of Ask on their own datasets.

About the ORKG

The Open Research Knowledge Graph (ORKG) is a service that aims to revolutionise the way scientific knowledge is shared and used. By creating a structured, searchable knowledge graph, the ORKG makes scientific information more accessible and usable for the global research community.

#AI #LargeLanguageModel #LizenzCCBY40INT #ORKG #ORKGAsk #scholarlyCommunication

Portrait of Dr Allard OelenPortrait of Dr Mohamad Yaser Jaradeh

Client Info

Server: https://mastodon.social
Version: 2025.04
Repository: https://github.com/cyevgeniy/lmst