#ImageToText

Diego :mastodon:diegopds@bolha.us
2025-02-21

Frog: Extract text from any image, video, QR Code and etc.

github.com/tenderowl/frog

Ótimo app que extrai texto de imagens, como prints.

Está quebrando um galhão para pegar questões de simulados que estão em vídeos ou PDFs sem texto selecionável.

#Frog #ImageToText #app #Linux #FOSS

2025-01-29

Janus Pro от DeepSeek: стоит ли она внимания? Сравнение генерации и объяснений с Dalle-3 и SD3

Появились первые тесты новой нейросети Janus — эта модель не только генерирует изображения, но и анализирует их, объясняя детали и делая осмысленные комментарии. В этой статье мы разберёмся, как Janus Pro (7B) справляется с генерацией изображений по сравнению с Stable Diffusion 3 (Medium) и Dall-3 , а также кто лучше анализирует и комментирует изображения — Janus Pro или Dalle-3 . Ну что, готовы? Тогда погнали!

habr.com/ru/companies/bothub/a

#ai #ии #janus #deepseek #генерация_изображений #анализ_изображений #texttoimage #imagetotext

unfa🇺🇦unfa
2024-05-24

Can't Ctrl+C something because it's baked to pixels? Now you can!

NormCap is an unusual screen capture tool. It doesn't capture images, but extracts *text* from a selected area of your screen.

dynobo.github.io/normcap/

2023-11-24

Обучение ИИ на синтетических данных: исследователи из MIT меняют правила игры

Как известно, данные - это новая почва в мире AI. И товарищи-исследователи из MIT CSAIL нашли оригинальный способ вырастить на этой плодородной земле нечто большее, чем просто пиксели. В своем новом исследовании , они использовали синтетические изображения для обучения моделей машинного зрения и значительно превзошли результаты традиционных подходов с "реальными" картинками. Такое обучение оказалось более эффективным и свободным от предубеждений машинного обучения. В основе описываемого подхода лежит система StableRep. Это не просто очередной софт для генерации синтетических картинок. StableRep использует самые популярные в последнее время модели вроде Stable Diffusion, которые создают изображения на основе текста. Приглашаем узнать больше об этом проекте!

habr.com/ru/companies/bothub/a

#ии #ии_и_машинное_обучение #машинное_обучение #stable_diffusion #imagetotext

Webappiawebappia
2023-07-10

Apps that Convert Pictures and Documents to Text using AI 

Hashtags: Summary: An image-to-text converter online is a tool that uses Optical Character Recognition (OCR) technology to extract text from an image or paper document. These converters are available for both Android and iOS users and offer various features to choose from. One important feature to consider is whether the converter is…

webappia.com/apps-that-convert

2023-06-10

"Detect text from picture" in the "Edit media" dialog of the Mastodon PWA is not a bad way to extract code from screenshots. It has some predicable issues such as mistaking digit 1 for letter l and 0 for @, but not too bad for short code segments.

Recommend 8/10

#mastodon #pwa #imageToText #image #text

Norobiik @Norobiik@noc.socialNorobiik@noc.social
2023-04-10

"Midjourney now offers a clever twist on its #AI image software, using its powerful machine-learning algorithms to generate text descriptions of already-existing images. This makes detailed image captions trivially easy to make and could totally change the game for blind people when it comes to pictures. "

Why #Midjourney’s New #ImageToText Generator Is an #Accessibility Home Run | #AI #GenerativeAI
lifewire.com/why-midjourneys-n

A screenshot of a Midjourney image-to-text output giving 3 possible variations of a description of a picture of a mouse in golden armor standing atop a cityscape.
2023-02-03

The trade-free app of the day:

Normcap

https://www.tromjaro.com/normcap/

OCR-powered screenshot tool to capture text instead of images.

2022-12-10

Few corrections from the text scrape that I missed.

READY SPREADY GO -is the one on the far left I'm pretty sure.

Which of course leaves SALT DISNEY making much more sense!

#winter #snow #ice #WordPlay #Puns #Puntastic

#GoogleLens #ImageToText #Whoa #NearlyGotIt #Blimey #Nerdy

Somebonnie, aka 6x6pixsomebonnie@better.boston
2022-12-04

#ChatGPT is fun, esp when the output is pared down and fed into DallE or Midjourney etc.

What I'd really like to see though is an #AI tool that can describe an uploaded image in text. Does any such tool exist?

#AIGenerator #imagetotext

6x6pix🚶‍♀️🎞️ 📷6x6pix@mastodon.art
2022-12-04

I've been experimenting with facilitating collaborations between AI generators by having one tool generate a text description of something, which I can then feed into a text-to-image generator.

What I'd really like to find is an image-to-text generator: upload an image, and have the AI describe the image in text. DOES THIS EXIST?

#AI #ImageToText #DallEButBackwards

Theodore Kuecheltheok@mstdn.social
2022-11-14

Firefox's ability to extract and copy text from an image is rather impressive. Because of all the different fonts & typefaces used. This one presented a challenge.

#Firefox #AI #ImageToText

Client Info

Server: https://mastodon.social
Version: 2025.04
Repository: https://github.com/cyevgeniy/lmst