Man redet sich ja quasi den Mund sabbelig, warum #Transkribus oft nicht wirklich gut funktioniert, wenn man #OpenScience und #FAIR ernst nimmt. Zeige jetzt nur noch das:
Man redet sich ja quasi den Mund sabbelig, warum #Transkribus oft nicht wirklich gut funktioniert, wenn man #OpenScience und #FAIR ernst nimmt. Zeige jetzt nur noch das:
Today is *definitely* one of those days where I feel a strong kinship with crime drama authors as a pen & paper RPG storyteller.
Because my last couple search engine queries would *definitely* seem suspicious without context. 🥴
"What's the all-cause mortality rate in Northern Ireland?"
"How long after death does a body get cold?"
"How long after death do people still bleed?"
"Can you buy blood in the UK?"
"Can you sell blood in the UK?"
...
Bookmarked: CoMMA: thousands of medieval manuscripts finally transcribed | Inria https://www.inria.fr/en/comma-medieval-manuscripts-transcribed #HTR Transcribing thousands of medieval manuscripts by hand would be a monumental undertaking. Fortunately, researchers in computational humanities at the Inria Paris Centre have been able to automate the task through the use of generative AI. Their creation is CoMMA, a giant, one-of-a-kind corpus that will now be available to specialists in the humanit
Kennt jemand gute Einstiegstutorial zum HTR? Ich möchte ein Model für HTR der polnischen und deutschen Handschrift für eigene Forschungszwecke entwickeln, bin ich aber in der Tesseract Dokumentation völlig lost.
Lebt e-Scriptorium-Projekt noch? Kann man den auf eigenem Computer installieren und ausprobieren? #HTR #OCR #eScriptorium #Tesseractocr
One team. One title. One legacy. 🏆
South Carolina State Bulldogs | HBCU National Champs 2025
Shop the Poster, T-Shirt & Cap today.
#HBCUFootball #CricketBowl
#GoDogs #PayTheFEE #DigDEEP #FearTheBITE #CWCW #BBB #HTR #BuyIn🔴🔵🐶🏈
T-Shirt: https://zornixtee.com/product/south-carolina-state-bulldogs-football-national-champions-2025-cricket-celebration-bowl-classic-t-shirt/
Poster: https://zornixtee.com/product/south-carolina-state-bulldogs-football-hbcu-national-champions-2025-cricket-celebration-bowl-home-decor-poster-canvas/
Cap: https://zornixtee.com/product/south-carolina-state-bulldogs-football-national-champions-2025-cricket-celebration-bowl-classic-cap-snapback-hat/
Check #pytesseract offline:
‘Model = CNN + RNN + CTC loss’
https://github.com/bdstar/Handwritten-Text-Recognition-Tesseract-OCR?tab=readme-ov-file#for-offline-handwrritten-text-we-use-crnn-model
Also #Loghi offline with:
‘download a #laypa model (for detection of baselines) and a #loghi-htr model #HTR ’
https://github.com/knaw-huc/loghi?tab=readme-ov-file#installation
MKNetwork Transcription Workbench ist fertig! Automatisches Tagging, manuelles Tagging, Verküpfung zu GND und Wikipedia steht. Der unten verlinkte Blogartikel ist erweitert -- mehr Details dort.
#OCR #HTR #MKNetwork
RE: https://bsky.app/profile/did:plc:fxgiogheyouyiu6n6qjp4ekf/post/3m6ja4np4uk2f
Es ist soweit! Gemini 3 transkribiert via AI Studio fast fehlerfrei Hand- und Druckschrift – mit ein klein wenig Hilfe. dhh.hypotheses.org/3934 #OCR #HTR #MKNetwork
구글 AI가 200년 전 장부의 숫자 오류를 스스로 수정했다: Gemini의 추론 능력 발견
구글의 새 Gemini 모델이 18세기 장부를 전문가 수준으로 해독하고, 프롬프트 없이 스스로 논리적 추론을 수행했습니다. AI의 진짜 '이해' 능력에 대한 새로운 증거를 소개합니다."Von der Handschrift zum Volltext: HTR in der Digital History"
https://digihistbie.hypotheses.org/771
"Vor wenigen Jahren war Handwritten Text Recognition (#HTR) noch ein Nischenthema in der digitalen Geschichtswissenschaft. Inzwischen gehört sie zum methodischen Repertoire vieler Projekte und das nicht nur, weil sie die ressourcenintensive Arbeit des Transkribierens erleichtert, sondern auch, weil sie neue Perspektiven und Zugänge zu historischen Quellen eröffnet. …
Handwritten Text Recognition hat sich zur Schlüsseltechnologie der digitalen Geschichtswissenschaft entwickelt. Doch die Wahl der Plattform – #Transkribus oder #eScriptorium – ist weit mehr als eine technische Frage:
Die Entscheidung für eine HTR-Plattform beeinflusst auch, wie historische Quellen gelesen, verstanden und ausgewertet werden.
HTR wird so zum epistemischen Instrument, das Forschung nicht nur unterstützt, sondern mitprägt, schreibt Melvin Wilde 👇
I went through the terms and conditions of #transkribus to make my previous post more substantiated and clearer. #atr #htr (This is from the Transkribus user group).
[#veille] Paris, il y a 100 ans : une population plus nombreuse qu’aujourd’hui et déjà originaire d’ailleurs - Population et Sociétés - Institut national d’études démographiques ( @SandraBree )
#popp #histoire #population #recensement #lesgens #Paris #20esiecle #genealogie #htr #demographie
[#veille] Le projet e-NDP / Corpus numériques pour l’histoire de Notre-Dame de Paris : bilan archivistique – Archives nationales, carnet de recherche
https://labarchiv.hypotheses.org/4429
#archives #HTR #digitalhumanities #humanitesnumeriques #HN #NotreDamedeParis #Paris #histoire @archivistodon #archivesnationales #history
Slides with our workshop goals and results from the #ATR session organised by ATRIUM in Berlin are now available on #Zenodo:
https://zenodo.org/records/17061629
Please contact me if you have any questions or would like to collaborate on #HTR model training for early 20th-century #English handwriting.
As part of an Atrium workshop, my colleague Susan & I are trying to prepare #trainingdata to build a special #HTR model for early 20th-century handwriting from the British Isles in #escriptorium. Unfortunately, none of the existing #kraken models worked as a basis. We are now experimenting with different hands & image qualities. Dirty images (see below) distorted our model, so we focus on clean samples. Are other researchers interested in codeveloping a ground truth with us? Let us know!
Coming up on October 3-4, 2025 at Central European University in Vienna: OCR/HTR Workshop for Under-resourced and Under-represented Languages in Digital Humanities, funded by the Cluster of Excellence EurAsian Transformations and by CLARIAH-AT! (Main organizer: yours truly) #digitalhumanities #multilingualdh #textrecognition #ocr #htr
Attention Palaeographers! 🖋️✨
I'm happy to share the Corpus Litterarum: a new dataset of annotated Latin manuscript characters from the St. Gall codices CSG 11 & 70 (Winithar).
🔎 2,152 line images
🔠 44,407 annotations across 73 classes
📜 Includes Latin letters
🤖 Semi-automatic labelling with Roboflow
The dataset is freely available on Zenodo:
👉 https://zenodo.org/records/16995048
Use it for palaeography, HTR, character segmentation — or just to explore the manuscripts of St. Gall!
#DigitalHumanities #Palaeography #HTR #MedievalStudies #History #OpenScience
Am vergangenen Freitag und Samstag fand unser Sommerkurs „Schriftkulturen des Mittelalters in digitaler Perspektive“ in der Staatsbibliothek zu Berlin statt (https://blog.sbb.berlin/termin/mittelalterliche-schriftkulturen-in-digitaler-perspektive/). Neben #TEI und #HTR ging es auch um #multispectral imaging und Materialanalyse. Wir hatten tolle Teilnehmende, die in den verschiedenen Hands-On-Sessions mitgemacht haben, z.b. in unserem Handschriftenlesesaal, um das digitale DinoLite-Mikroskop (UV, VIS, IR) kennenzulernen.