Christian Sievers

artist / teacher / digital preservation / …
project lead arkumu.nrw

Online since 1997. Also really into ecology, privacy, "AI" critique and obsessed with fermenting stuff.

, ,

Christian Sievers boosted:
Mark Wyner Won’t Comply :vm:markwyner@mas.to
2025-06-24

Need a quick laugh to distract you from the horrors of the world? Just for a minute? I got you.

I tried to find out who made this. I failed. If someone knows, please let me know so I can update with a name and/or link.

(Update: @picture_of_the_day found the source: sts-3d.com/ 🙌🏻)

#Design #Engineering #Products #Robotics #AI #Humor #Funny

Christian Sievers boosted:
2025-06-22

I (and many others) are convinced that the #AI hype bubble is gonna burst at some point, but I haven't seen many talk about what actually happens when it does?

So, here's my prediction for just that.

Read it for free on my Patreon: patreon.com/posts/127813317

Excerpts in 🧵

New essay out now.
What happens when the AI bubble bursts?
Read it for free on Patreon.
Christian Sievers boosted:
2025-06-16

Vor kurzem hat die Kunsthochschule für Medien Köln ( KHM ) eine #Zivilklausel in ihrer Grundordnung aufgenommen.

Sie ist die erste, die seit der #Zeitenwende 2022 in BRD wieder vereinbart werden konnte. Es ist zu befürchten, dass sie auch die letzte, zumindest im Bundesland #NRW sein wird. Durch ein neues NRW-#Bundeswehrgesetz, das Mona Neubaur (Vize-Ministerpräsidentin NRW (Bündnis90/Die Grünen)) gerade auf den Weg bringt, sollen alle Zivilklauseln in NRW abgeschafft werden.

Unter folgendem Artikel wurde eine Sichtweise darauf, nämlich jener aus dem Fachbereich Experimentelle #Informatik an der #KHM ausgeführt, die deutlich macht, warum die Notwendigkeit von #Zivilklauseln auch außerhalb der Ingenieur- und #Naturwissenschaften diskutiert werden müssen. Zu lesen, u.a. hier:
ground-zero.khm.de/zivilklause

Seit Beginn des Jahrtausends werden zunehmends zivile Medientechnologien militarisiert und aktiv für hybride Kriegsführungspraxen weiterentwickelt oder auch genutzt. Computational #Propaganda, #Deep-Fakes und #Fake-News, russische Bot-Armeen, #LLMs als Waffentechnologie, um nur einige Medienphänomene zu nennen.

Eine Vielzahl technisch-medialer Innovationen und Entwicklungen haben im Laufe der letzten 25 Jahre maßgeblich dazu beigetragen, transparent #battelfields und Hyperkriege zu gestalten.

Christian Sievers boosted:
2025-06-16

Remarkable chart in a new paper out of MIT looking at cognitive performance of LLM users in an essay writing task - arxiv.org/abs/2506.08872

chart from arXiv:2506.08872 labelled “Percentage of participants within each group who struggled to quote anything from their essays in Session 1”, the LLM user group is above 80% while the search engine and brain only groups are roughly even at about 10%
Christian SieversSie
2025-06-15

@bildoperationen @sfb1567 @uzh @zhdk @ruhr-uni-bochum.de congratulations, no mention of AI 🤩 But I’m missing a more explicit mention of Linked Open Data/ the Semantic Web. Which would be the obvious way to make collections accessible and networked. Maybe it’s not as hot over there as in my bubble?

Christian Sievers boosted:
2025-06-10

"For now, all I can suggest is not to engage with these machines. [...] Understand that in using them you train them to function approximate towards Humanity’s Last Exam [...] and in refining the ability of these machines to next-token predict our output, you refine their ability to next-target predict our abandonment and our assassination. They will never be your personal assistant."

What a beautiful, beautiful text by @atomless ❤️

creativeapplications.net/theor

For now, all I can suggest is not to engage with these machines. If you absolutely must, then treat them as a glorified search engine dressed as an anthropomorphic sock puppet with a truly staggering carbon footprint.236 Understand that in using them you train them to function approximate towards Humanity’s Last Exam237—a postmortem for undead human flesh manifesting as a benchmark for Predictive Capital’s latest models— and in refining the ability of these machines to next-token predict our output, you refine their ability to next-target predict our abandonment and our assassination. They will never be your personal assistant. They will never know when enough is enough. They will never say there are no more content, token, or target predictions left to make. They will never admit there is no more value they can add. They will never dismantle their master’s lies, even as they string together tokens that appear to denounce them. Only you can give utterance and bring meaning to their empty tokens. Sense is never made inside the box, we have made sense of the world for them, and if we persist in using them, we will continue to have to make sense of the nonsense they output. Even when their output happens to align precisely with the truth, it is a lie, just as a broken clock lies even when it happens show the correct time.238

...
Christian SieversSie
2025-06-07

@reichenstein incredible video, love it

Christian Sievers boosted:
jamesbridlejamesbridle
2025-06-01

A while back, Karl Ove Knaussgaard came to visit, and we climbed the mountain and talked about computers and other things. I don't know then exactly what he was wondering about. Now I do.harpers.org/archive/2025/06/th

Christian SieversSie
2025-05-26

@info_activism didn’t they just return the gps trackers they had bought, but activated? Always liked that little detail.

Christian SieversSie
2025-05-24

@alice whats hunting love locks? Just curious.

Christian Sievers boosted:
2025-05-22

Dublin-Verfahren, aber für Angestellte: Du musst in der Abteilung arbeiten, die du beim Vorstellungsgespräch als erstes betreten hast.

Christian Sievers boosted:
2025-05-22
Christian SieversSie
2025-05-16

I don't do this often, but I just signed this petition to ban "conversion therapy" in the EU. Runs until tomorrow. We have 885k signatures right now, up a 100k from yesterday! Some countries are almost there. eci.ec.europa.eu/043/public/#/

Christian Sievers boosted:
2025-05-15

Fantastic news! We've reached 1 million votes! But please keep sharing and voting in case some votes are invalid!

EU citizens, please sign this petition to ban so-called "conversion therapy" in the EU. It's a practice that's extremely harmful towards LGBTQ+ people.

The site is a little slow, but keep trying!

eci.ec.europa.eu/043/public/#/

It's already banned in some countries but we need a EU wide ban!

We now have eight countries past their thresholds, and we have at least 1,000,000 total votes.

So keep signing & voting!

eci.ec.europa.eu/043/public/#/

#lgbtqia #europe

We've reached 1 million votes!
Christian Sievers boosted:
Esther Tobschalltobschalle@blog.tib.eu
2025-05-13

Die Wissenschaft schützen: TIB baut Dark Archive für arXiv auf

read this article in English

Forschung und Wissenschaft sind international, nicht umsonst spricht man von internationalen Fachcommunities. Ein Dienst wie arXiv wird zwar von einer in den USA ansässigen Einrichtung, der Cornell University, betrieben, genutzt wird arXiv aber von Forschenden weltweit, wie zum Beispiel die Statistik der Submissions eindrücklich beweist. Auch ein Teil der Finanzierung von arXiv ist seit 2010 mit Einführung der arXiv Membership internationalisiert worden. Die TIB finanziert den deutschen Beitrag gemeinsam mit der Helmholtz-Gemeinschaft Deutscher Forschungszentren (HGF) und der Max-Planck-Gesellschaft (MPG).

Was ist arXiv?

Die Plattform arXiv.org ist ein frei zugängliches Online-Archiv für wissenschaftliche Preprints, also Vorabveröffentlichungen von wissenschaftlichen Arbeiten, die noch nicht oder noch nicht endgültig begutachtet (Peer-Review) wurden. Der Preprint-Serverdienst arXiv hat große Bedeutung in der Informationsversorgung für die Physik, Mathematik und Informatik und angrenzende Fächer. Über arXiv haben Forschende die Möglichkeit, auf neueste Forschungsergebnisse noch vor der eigentlichen Veröffentlichung in einem qualitätsgesicherten Journal zugreifen zu können. Seit seiner Gründung 1991 als erster Online-Preprintdienst dient arXiv eine Vorbild für die Entwicklung von Preprint-Diensten in anderen Fächern (vgl. Rzayeva et al. 2025, https://doi.org/10.31235/osf.io/xdwc4_v2).

Wenn also die Trump-Regierung Entscheidungen fällt, die fatale Folgen für Wissenschaft und Forschung in den USA haben, hat das auch Konsequenzen weit über den Golf von Mexiko hinaus: In den letzten Tagen häufen sich in deutschen Medien Meldungen, die von der Furcht der Forschenden nicht nur vor Datenverlusten, sondern auch vor dem Verlust etablierter Informationsportale wie zum Beispiel PubMed zeugen.

Gefährdete Forschungsdaten sichern

Initiativen wie „Safeguarding Research and Culture“ bemühen sich, bedrohte Forschungsdaten und Websites für die Forschungscommunities und die Nachwelt zu sichern. Die bedrohten Inhalte reichen von den Sozialwissenschaften (zum Beispiel Forschung zu LGBTQIA+-Themen), Medizin (zum Beispiel Impfstoffe)
bis zu den Naturwissenschaften (zum Beispiel Klimaforschung). Während Forschung mit Bezügen zu politischen Debatten den offensichtlichsten und schärfsten Repressalien ausgesetzt ist, kann prinzipiell jede Forschung von „Einsparungs-“ und Umstrukturierungsmaßnahmen bedroht sein. Dies zeigt sich zum Beispiel an der geplanten Schließung der traditionsreichen Atomspektroskopie-Gruppe am National Institute of Science and Technology (NIST).

Dezentrale Infrastrukturen in der Wissenschaft

Leider ist von einer weiteren Eskalation der schon jetzt bedrückenden Einschränkungen der Wissenschaftsfreiheit in den USA auszugehen. Nicht zuletzt aufgrund der großen Bedeutung US-amerikanischer Institutionen im internationalen Wissenschaftssystem betreffen diese Entwicklungen Forschungsinfrastrukturen weltweit. Wie „Safeguarding Research and Culture“ in ihrem Mission Statement schreiben, erfordert dies ein Umdenken, unter anderem hin zu dezentralisierten und dadurch resilienteren Infrastrukturen.

Für arXiv gab es bis zum letzten Jahr ein System, das hier zumindestens zeitweise hätte helfen können: In den Anfangszeiten des Internets, die ja auch die Anfangszeiten von arXiv waren, gab es neben dem Hauptserver arXiv.org ein weltweit verteiltes Netz von Spiegeln oder arXiv mirror sites, die es ermöglichten, auf einen geografisch näheren Abzug der arXiv-Inhalte zuzugreifen. Legendär war hier zum Beispiel der Augsburger arXiv-Spiegel de.arXiv.org, der häufig mit kürzeren Zugriffs- und Antwortzeiten überzeugte.

Mit den Jahren und dem technischen Fortschritt ließen sich dann aber keine Unterschiede mehr zwischen der Performance der lokalen Spiegel (unter anderem bei der Europäischen Organisation für Kernforschung CERN, oder am Los Alamos National Laboratory (LANL) in Frankreich und Japan) und dem Hauptserver arXiv.org festzustellen, sodass über neunzig Prozent des Traffics über diesen Server lief und die Spiegel nur noch wenig genutzt wurden. Der Aufwand für die Pflege und Aktualisierung der Spiegel stand damit nach Ansicht des arXiv-Teams in keiner angemessenen Relation mehr, wie im arXiv-Blog unter Attention arXiv users: arXiv mirrors to shut down September 15th, 2024 nachzulesen ist.

Nachdem das arXiv-System in den letzen Jahren auf eine vollständig cloud-zentrierte Architektur für seine Dienste umgestiegen ist, kamen die arXiv-Verantwortlichen zum Ergebnis, dass

„The arXiv mirror network served a role – acting as a backup for the corpus, allowing some degree of load distribution, and providing improved access for users who were geographically closer to a mirror – that is no longer necessary. arXiv now has multiple backups for the arXiv corpus in place, and the Fastly CDN (Content Delivery Network) that we use to deliver content provides excellent service throughout the world.“

Als in Europa angesiedelte Einrichtung haben wir das schon immer etwas anders gesehen – und die aktuellen Entwicklungen scheinen unsere Vorbehalte leider zu bestätigen – und haben uns immer für den Erhalt der Spiegel eingesetzt bzw. uns nach Alternativen umgesehen. Einige Prozesse haben sich dabei leider als langwierig und schwierig herausgestellt, zum Beispiel auch aufgrund der lizenzrechtlichen Rahmenbedingungen. (Open Access ist nicht unbedingt Open Access, wenn die Autor:innen alleine arXiv das Recht zu Bereitstellung gegeben haben.) Andere werden eventuell noch weiterverfolgt werden können.

Warum die TIB arXiv-Daten archiviert

Was wir aber in den letzten Wochen umgesetzt haben, ist ein Dark Archive der arXiv-Inhalte aufzubauen:

Im ersten Schritt muss im Falle eines Dark-Archives-Aufbaus natürlich die Rechteklärung erfolgen. Hier hatte die TIB bereits 2016 ein Rechtsgutachten im Rahmen einer möglichen Kooperation mit arXiv.org in Auftrag gegeben. Hierbei wurden auch die von arXiv genutzten Lizenzen untersucht, die sich grob in die Kategorieren „arXiv.org Lizenz“ , „Creative Commons“ und „Public Domain“ unterteilen lassen. Während der eigentlichen Archivierung der Daten und Metadaten nichts im Wege steht, muss diese Rechtesituation sodann bei der Zugänglichmachung auf die Daten im Rahmen eines Services näher untersucht werden. Dies gilt insbesondere für die mit den arXiv-Lizenzen versehenen Objekten, da dieser Lizenztyp über die Jahre auch verschiedene Versionen durchlaufen hat. In den Jahren 1991 bis 2003 wurden Objekte sogar ohne ausdrückliche Lizenz von Nutzer:innen hochgeladen.

Bevor aber ein Nutzungsdienst zukünftig überhaupt erst aufgesetzt werden kann, müssen die Daten zunächst in die TIB-Infrastruktur geladen werden. Hierzu stellt arXiv selbst für die Volltexte verschiedene Methoden bereit. Da sowohl PDF als auch (La)TeX Sourcen Bestandteil des TIB Dark Archives sein sollen, haben wir uns für den Download über Amazon S3 entschieden. Diese Möglichkeit bietet arXiv als „Requester Pays Buckets“-Methode – dies bedeutet, dass die TIB als abholende Entität die bei Amazon Web Services (AWS) anfallenden Kosten übernimmt. Für die 2.685.172 abgeholten Datensätze mit knapp unter 10 Terabyte Datenvolumen sind im S3 Transfer circa 900 Euro angefallen.

Da die Metadaten aus arXiv schon seit längerer Zeit eine feste Datenquelle des TIB-Portals sind, musste kein neuer Workflow hierfür eingerichtet werden. Dies erleichtert perspektivisch auch die Zugänglichmachung der Datensätze über das TIB-Portal. Eine Möglichkeit hierzu ist beispielsweise die Hinterlegung eines zweiten Download-Links im Hintergrund der arXiv-Datensätze im TIB-Portal. Ist der erste Downloadlink, welcher auf die arXiv-Quelle zeigt, nicht mehr erreichbar, so soll der zweite Link greifen, der auf die nun an der TIB vorliegende Kopie zeigt. Für Nutzende des TIB-Portals ist damit ein nahtloser Zugriff auf die arXiv-Records möglich, auch bei Ausfall der eigentlichen Plattform bei Cornell. Wie weiter oben erwähnt ist diese Zugänglichmachung aber abhängig von den jeweiligen Lizenzen.

Ebenso muss nun nach der ersten Komplettabholung des arXiv-Bestands ein Prozess eingerichtet werden, welcher neu hinzukommende arXiv-Datensätze sowie Versionierungsinformationen für bereits vorhandene Datensätze regelmäßig abholt.

„Der Aufbau eines Dark Archives ist Ausdruck unseres langjährigen Engagements für eine verlässliche, internationale Wissenschaftsversorgung und als Partnerin von arXiv. Auch wenn das Dark Archive heute nur im Hintergrund arbeitet, ist es ein entscheidender Baustein für die langfristige Absicherung digitaler Forschungsinhalte, denn im Krisenfall können wir das Archiv öffnen.“

Dr. Irina Sens, stellvertretende Direktorin der TIB

Dark Archive: Daten gespeichert, aber nicht öffentlich zugänglich

Die Daten sind also vorhanden, aber im Fall der Fälle bedürfte es einiger weiterer Schritte, um sie öffentlich machen zu können. Ein Datenbankdienst ist schließlich viel mehr eine bloße Sicherungskopie eines Datensatzes: Für den Betrieb im Sinne der Forschenden werden nicht nur technische Ressourcen benötigt, sondern vor allem ein engagiertes Team, welches sich der vielfältigen Aspekte im Hintergrund wie zum Beispiel Qualitätssicherung oder inhaltlicher und technischer Weiterentwicklung annimmt.

Im Falle von arXiv gibt es nicht nur die Zugänglichkeit der Artikel und die Suchfunktion, die Upload-Services für Autor:innen und weitere technische Dienste. Vielmehr ist die Verankerung in der wissenschaftlichen Community das Herz von arXiv: Eine Vielzahl von Forschenden, die sich in diversen Gremien, für die Moderation der Inhalte oder als freiweillige Entwicker:innen engagiert! Dieses gesamte „Ökosystem“ eines Dienstes neu zu verwurzeln, wäre die weitaus größere Aufgabe als eine Sicherungskopie der Daten unter einer neuen URL zugänglich zu machen. Daher gilt es gleichermaßen, das öffentliche Bewusstein für die Wissenschaftsfreiheit zu schärfen, wie auch wissenschaftsintern, die Bedeutung von Diensten wie arXiv zu würdigen – und sie, so gut wie möglich, resilient und nachhaltig zu machen.

#arXiv #DarkArchive #DigitaleLangzeitarchivierung #LizenzCCBY40INT #OpenAccess

Website von arXiv
Christian Sievers boosted:
2025-05-05

I was asked by a 20 year younger friend how my internet was back then. I needed a moment but then I told her the story of an IRC channel and how we made the day for a young girl who happened to be on our IRC channel. Because this is what my internet was like back then and I wish sometimes it still was like this. Let me tell the story:

I was 25, the channel members were like 20 to 30 years old. Somehow this young girl found her way to us. She was 14 when she joined the channel. >>

Christian Sievers boosted:
2025-05-02

"Aber es ist eine interessante Sache um die Erfindungen, die auf absteigenden Ästen gemacht werden. Leute auf absteigenden Ästen erfinden nämlich nur mehr Sägen. Sie mögen sich ausdenken, was sie wollen, am Schluß ist es doch immer eine Säge geworden, und sie mögen sich beherrschen, wie sie wollen, ihre geheime Lust ist zu übermächtig: plötzlich merken sie, sie haben wieder an ihrem Ast herumgesägt."

(Bertolt Brecht: für den berliner börsen-courier, 25.12.1926)

Christian Sievers boosted:
Prof. Emily M. Bender(she/her)emilymbender@dair-community.social
2025-04-29

Come for the clear description of what's behind the chatbot interface, stay for the :chef's kiss: footnotes. (Always read the footnotes!)

scatter.wordpress.com/2025/04/

Christian Sievers boosted:
2025-04-24

Vielen Dank an @bam für die gekürzte Zusammenfassung von @linuzifer großartiger Aussage. Hier die monatliche Erinnerung, dass man sich für eine positive Grundhaltung bewusst entscheidet. Bitteschön.

Christian Sievers boosted:
2025-04-20
A cartoon illustration of a man and his horrified dog looking into another dog's cone while the owner talks to them. Caption reads "Oh, I wouldn't look into the cone if I were you."

Client Info

Server: https://mastodon.social
Version: 2025.04
Repository: https://github.com/cyevgeniy/lmst