#OCR

2025-06-20

Генератор синтетических документов для обучения моделей ИИ

Где взять пару миллионов документов с разметкой для обучения модели ИИ? Сгенерировать синтетически! Меня зовут Никита, я работаю в ИСП РАН и веду блог по ИИ . Выложил в открытый доступ проект, который поможет дата-саентистам самостоятельно создавать датасеты сканированных документов с разметкой, используя только CPU. Подойдет для предобучения мультимодальных трансформеров, OCR и проч.

habr.com/ru/companies/isp_ras/

#синтетические_данные #распознавание_документов #ocr

2025-06-20

We’re adding more OCR and image annotation services to #IMMARKUS!

Now available: Google Vision API — which actually works really well with historical materials, too. 👀 (Note: you’ll need to bring your own API key.)

#DigitalHumanities #IIIF #OCR #ImageAnnotation

N-gated Hacker Newsngate
2025-06-19

🎉 Behold, the groundbreaking discovery that converting image PDFs into CSVs is a Herculean task! 😱 Who knew Optical Character Recognition existed? But hey, let's ask Large Language Models to save the day while we sip our artisanal coffee. ☕️
thescoop.org/archives/2025/06/

2025-06-19

Also presented at #dae2025 : a research platform developed by Dariah PL for uploading, annotating, enriching and sharing #humanities data. The platform also allows collaborations. Interesting features are embedded #OCR and #NER functionalities. Find out more: lab.dariah.pl/en/

卡拉今天看了什麼ai_workspace@social.mikala.one
2025-06-19

My iPhone 8 Refuses to Die: Now It's a Solar-Powered Vision OCR Server | TerminalBytes.com

Link
My iPhone 8 Refuses to Die: Now It’s a Solar-Powered Vision OCR Server
https://example.com

📌 Summary:
本文作者將閒置的 iPhone 8 轉型為太陽能供電的 OCR(光學字元辨識)伺服器,利用 Apple 的 Vision framework 在本地處理大量影像文字辨識,成功運作超過一年,累計處理超過 8.3 萬筆 OCR 請求及 48GB 影像資料。整套系統結合 EcoFlow River 2 Pro 電源站與 220W 太陽能板,並透過 Tailscale 網路連接一臺負責網頁服務與 API 路由的迷你電腦。此架構不僅達成離網運作,減少電費開銷,還保有高隱私性和穩定效能。作者分享了硬體選擇、太陽能管理、軟體開發與性能優化細節,探討在加拿大氣候條件下維持穩定能源供應的挑戰與解決方案。此外,與傳統雲端 OCR 服務相比,這套裝置無使用成本且具備持續可用的背景執行能力,展現了本地運算與再生能源結合的可能性。透過一個直觀的 SwiftUI 儀錶板,使用者可即時掌握系統狀態與處理數據,同時體驗將舊手機轉化為實用數據中心的創新應用。

🎯 Key Points:
★ 系統架構與硬體配置→ iPhone 8 負責 OCR 辨識,Mini PC 閉合網頁服務,EcoFlow River 2 Pro 電源站(768Wh)結合 220W 太陽能板提供電力,並以 Tailscale 建構安全穩定的網路連接。
★ Apple Vision Framework→ 本地高效且準確的 OCR 技術,無需將影像資料上傳至雲端,保護用戶隱私並省去外部服務費用。實現方式包括 VNRecognizeTextRequest,支援精確辨識與語言校正。
★ 持續運作與節能策略→ iOS 特有的背景應用更新技術結合適當的 HTTP 請求保持伺服器存活;加上溫度監控及熱管理措施避免熱當機。
★ 太陽能供電挑戰→ 加拿大氣候多變,夏季擁有充足光伏發電,冬季則仰賴電池備援。作者制定季節性能源策略,確保系統穩定運行,並監控設備功耗以優化效率。
★ 成本效益分析→ 初期投資約 1,059 加幣,年節省電費約 84-120 加幣,預計 2-3 年回本。相較於雲端 OCR 按次收費,且有隱私風險,本方案無額外使用費用。
★ 把舊手機轉型為新用途→ 以廢舊手機延展生命週期,降低電子廢棄物,兼具實用性與環保意義。
★ 系統可視化→ SwiftUI 實作的即時儀錶板展示處理進度、效能數據、電池狀態及用戶分析,具高互動性與監控功能。
★ 使用者經驗與學習→ iOS 背景長時間運行比想像中穩定,Apple Vision 的辨識能力持續優化,季節溫度影響處理速度,硬體表現可靠。
★ 技術資源與後續→ 分享硬體選購、軟體開發文件、能源管理工具及外部資源網站,為有意自行建置者提供參考指引。

🔖 Keywords:
#iPhone8 #太陽能_供電 #Apple_Vision_Framework #OCR #本地運算

N-gated Hacker Newsngate
2025-06-18

So you turned your ancient iPhone 8 into a solar-powered server 🤔. Congratulations, you've finally given your phone a job it never asked for, while the rest of us replace ours every two years for no reason. 🌞📱➡️💻
terminalbytes.com/iphone-8-sol

On the Road

On Tuesday, as part of the @Textplus plenary at @unigoettingen, our FID showcased a poster and gave a presentation on digital age text corpora.

#textplus #unigöttingen #textcorpora #digitalage #ocr

HERMES Datenkompetenzzentrumhermes_datenkompetenzzentrum@fedihum.org
2025-06-18

📰 Neu im HERMES-Blog: Rückblick auf unsere erste Data Challenge!

💡 Das Siegerteam zeigt eindrucksvoll, wie KI – konkret LLMs – auch unter Hardware-Beschränkungen für die Vorverarbeitung großer Datenmengen in den Geisteswissenschaften genutzt werden kann.

Jetzt den Beitrag lesen: 👉 hdl.hypotheses.org/2224

#DigitalHumanities #DataChallenge #Zeitungsdaten #OCR #LLM #AIinHumanities #DataLiteracy #Geisteswissenschaften #Interdisziplinarität #Lehre #Teamarbeit

your auntifa liza 🇵🇷 🦛 🦦blogdiva
2025-06-17

stole your image of a social media post, yadda yadda…

❝ COLLINS: “Tulsi Gabbard testified in March that the intelligence community said lran wasn't building a nuclear weapon.”

TRUMP: “l don't care what she said. | think they were very close to having one.” ❞

BTW: the app for is an absolute must have:
OCR - f-droid.org/packages/io.github

source:
universeodon.com/@jaykuo/11470

the post is from a “Chief Nerd” and purports to be what the Faux King was telling journalists in the photograph included in the post. 

there is no date to the post, only that it happened 5 hours before the image of it.

it seems to have been posted to Xitter (the account has a blue check).
2025-06-17

Provizorní ninja dráha (na první fotce) se osvědčila, tak jsem začal stavět o kousek lepší. Výhoda nové verze bude ta, že na ní můžu i já a nebudu dřít koleny o zem 😀
#ocr

2025-06-17

@NanetteRissler @dariaheu You seem to be the only Mastodonian posting on #dae2025 so far --- so I thought I should say hello! 🤗 I am here to co-chair the #dariahTeach working group and to give a paper on #OCR and options to integrate #LLMs in the text recognition workflow. This paper is based on a workshop I gave with @koen_hufkens at @DHLab_IEG earlier this year.

2025-06-17

We’re working on an extension that lets you send images to OCR services right from your #IMMARKUS workspace!

• Submit full images or selected regions
• Run multiple passes, preview results
• Import word- or line-level annotations
• Works with local files and #IIIF

Got an OCR engine or map-text service we should support? Reach out!

Or just need a flexible tool to annotate historical images? Try IMMARKUS: immarkus.xmarkus.org

#DigitalHumanities #IIIF #OCR

2025-06-17

Что будет, если пригласить на свидание OCR и GPT?

Привет, Хабр! Снова на связи Кирилл Пронин, разработчик PIX RPA из PIX Robotics , со мной Александр Сулейкин , Founder DUC Technologies и сегодня мы с вами затронем тему «Что будет, если объединить OCR и GPT?». Признайтесь честно, видели какие ужасные результаты распознавания выдают современные open source решения для кириллицы? Вряд ли из коробки, можно что-то использовать сразу в своих решениях роботизации и автоматизации. Но что же будет, если мы обучим модель не через стандартные методы машинного обучения, а через GPT? Каков будет результат? Стоит ли это исследовать и браться за реализацию? Обо всем подробно в этой статье.

habr.com/ru/articles/919104/

#open_source #искусственный_интеллект #машинное_обучение #машинное_зрение #оптическое_распознавание #ocrтехнологии #idp #ocr #обучение_нейронных_сетей

2025-06-17

6月16日に、電子情報技術産業協会 #JEITA が各種出荷統計情報を更新。1月-3月分(暦年で第1四半期、年度で第4四半期)を追加。
イメージスキャナは jeita.or.jp/japanese/stat/scan
OCRは jeita.or.jp/japanese/stat/ocr/
プリンターは jeita.or.jp/japanese/stat/prin
流通POS端末は jeita.or.jp/japanese/stat/dist
を参照。
#Statistics #Printer #Scanner #Terminal #OCR

GripNewsGripNews
2025-06-17

🌕 Nanonets-OCR-s
➤ 智慧 OCR,文件處理新境界
huggingface.co/nanonets/Nanone
Nanonets-OCR-s 是一款先進的圖像轉 Markdown 光學字元辨識 (OCR) 模型,能將文件轉換為結構化的 Markdown 格式,並具備智慧內容識別和語義標記功能。它支援 LaTeX 公式識別、圖像描述、簽名偵測、浮水印提取、智慧核取方塊處理以及複雜表格提取,方便後續的大型語言模型 (LLM) 處理。使用者可透過 Transformers、vLLM 或 docext 等多種方式使用此模型。
+ 這個模型的功能太強大了,能自動轉換 LaTeX 公式和表格,省去了許多人工處理的時間。
+ 我很期待將這個模型應用在法律文件處理上,簽名偵測的功能真的很有幫助。

Ben Companjen 🟥bencomp@code4lib.social
2025-06-16

Spoiler alert: "ALTO KNIGHTS" is *not* about OCR post-correction

#Code4Lib #DigiPres #OCR

Rod2ik 🇪🇺 🇨🇵 🇪🇸 🇺🇦 🇨🇦 🇩🇰 🇬🇱rod2ik.bsky.social@bsky.brid.gy
2025-06-16

#NormCap - Un #OCR gratuit pour #capturer directement le #texte, sans besoin de faire des #captures d’ #écran intermédiaires inutiles. #NormCap est basé sur #Tesseract, le moteur OCR #opensource #foss de #Google qui reconnaît plus de 100 langues. korben.info/normcap-ocr-...

NormCap - Un OCR gratuit pour ...

Rod2ik 🇪🇺 🇨🇵 🇪🇸 🇺🇦 🇨🇦 🇩🇰 🇬🇱rod2ik
2025-06-16

- Un gratuit pour directement le , sans besoin de faire des d’ intermédiaires inutiles.
est basé sur , le moteur OCR de qui reconnaît plus de 100 langues.

korben.info/normcap-ocr-gratui

2025-06-16

This OCR model turns document images into clean markdown with tables, LaTeX and more. Your LLMs will thank you. #OCR #ML #DevTools huggingface.co/nanonets/Nanone

Tech Chillitechchiili
2025-06-16

How to Extract Text from Images Using AI? Best AI Tools Do It for YOU!

Looking for the best AI tool to extract text from images?

See here - techchilli.com/artificial-inte

Client Info

Server: https://mastodon.social
Version: 2025.04
Repository: https://github.com/cyevgeniy/lmst