#TIKA

2025-05-04

“La Casa de los Cuentos” de la primera dama beneficiará a 730 estudiantes de la Zona de los Santos

“La Casa de los Cuentos” de la primera dama beneficiará a 730 estudiantes de la Zona de los Santos
San José, 03 may (elmundo.cr) – La segunda edición de la iniciativa “La Casa de los Cuentos”, impulsada por la primera dama de la [...]

#BibliotecasEscolares #CostaRica #Educación #EducaciónRural #LaCasaDeLosCuentos #PrimeraDama #SigneZeikate #TIKA #Türkiye #ZonaDeLosSantos

elmundo.cr/costa-rica/la-casa-

Son Dakika Haberlerisondakikam
2025-04-29
Son Dakika Haberlerisondakikam
2025-04-29
2025-04-14

I am still extremely flashed what tika in opencloud can do, I have lots of pictures of steam engines. from many closeup fotos tika picks up the technical data noted on the loco #opencloud #tika

Search result from apache tika in #opencloud
EshaHaberEshahaber
2025-02-16

News Haber EshaHaber TİKA'dan dost ve kardeş ülke Endonezya'da kalkınma işbirliği: Dost ve kardeş ülke Endonezya'da TİKA'nın faaliyetleri devam ediyor. TİKA, kalkınma işbirliği projeleriyle iki ülke ilişkilerine katkı sağlamaya devam ediyor.

TİKA Başkan Yardımcısı Dr. Ümit Naci Yorulmaz, sosyal medya hesabından işbirliği çalışmalarına ilişkin açıklama yaptı. Yorulmaz, "Özellikle son 2 yılda… eshahaber.com.tr/haber/tika-da EshaHaber.com.tr

2025-02-11

Par ailleurs, je commence à avoir pas mal de petites fifiches sur l'utilisation d'outils de préservation numérique, ou d'outils généralistes utilisables dans un contexte #digipres (#Tika, #7Zip, #Robocopy, #exiftool ...). S'il y a de la demande, je peux faire l'effort de les publier !

2025-01-30

Hi @tallison ! I have used #Tika to extract the text from a ~170 Tb set of files, in batch mode, from the CLI.

I have two questions:
1) The result is ~17K text files while I was expecting ~23K files. Are there any formats that are just ignored by Tika (AFAIK, there were no exotic formats in this corpus)?
2) In batch mode, is Tika applying OCR? It did not throw a warning like when used in regular mode.

Thomas Keepoutarpwatch@ioc.exchange
2025-01-24

‘Never seen anything like this’: Trump’s team halts NIH meetings and travel
#FelonTrump
Trump
Is
Killing
Americans
#TIKA

nature.com/articles/d41586-025

EshaHaberEshahaber
2024-12-22

News Haber EshaHaber Numan Kurtulmuş: Türkçe Kuzey Makedonya Türk toplumu tarafından kuvvetlendirilmeli: Numan Kurtulmuş, Türk İşbirliği ve Koordinasyon Ajansı Başkanlığı (TİKA) ile Makedonya Türk Sivil Toplum Teşkilatları Birliği (MATÜSİTEB) tarafından Kuzey Makedonya'nın başkenti Üsküp'teki bir otelde düzenlenen "21 Aralık Türkçe Eğitim Bayramı" programında konuştu.

21 Aralık'ın, Türk… eshahaber.com.tr/haber/numan-k EshaHaber.com.tr

2024-10-25

When your #ownCloud #OCIS takes up more memory than the Apache #Tika #Java process.

2024-09-11

est une de soutien thérapeutique dans l’unité de soins intensifs de l’

L'Hôpital Universitaire des Enfants Reine Fabiola (HUDERF), partie intégrante de l'Hôpital Universitaire de Bruxelles, est heureux d'annoncer l'arrivée de Tika dans son unité des soins intensifs. Cette initiative innovante, soutenue par Kids Care, vise à améliorer le bien-être des jeunes patients et de leurs parents grâce à la thérapie assistée par l'animal.   Les bienfaits des…

bruxelles-city-news.be/tika-es

豈几文 :verified:kevinwu5168@liker.social
2024-08-11

Pizza 下午茶~😋

#Tika Coffee

jakob 🇦🇹 ✅jakob@soc.schuerz.at
2024-07-23

Gibts hier #Java Devs?

Ich hab ein Problem.

Ich krieg über http-Header "X-blafoo" einen CN (also einen ausgeschriebenen Benutzernamen) rein, der leider aufgrund des verwendeten Protokolls kein bestimmtes Encoding haben muss.

Es kann also UTF8 oder ISO-8859-1 oder irgendwas anderes sein. Die Header werden von einem Portal gesetzt das nicht in meinem Einflussbereich liegen muss.

Ich muss also schlucken, was daherkommt. Kein Spielraum.

Jetzt habe ich mehrere Encodingdetektoren getestet. #Icu4j, apache #tika, #juniversalchardet

Aber keiner arbeitet zuverlässig.

So wird z.B. der Name Schürz, Lösch, Löwz korrekt als UTF-8 oder auch ISO-8859-1 erkannt, wenn es entsprechend daherkommt...

Aber der Name "Löw" wird als BIG5 (chinesisch) oder TIS-620 (Thai) encodiert erkannt. Häng ich ein Zeichen an... passts wieder.

Da es ausschließlich Namen sind, hab ich nicht mehr Text zur Verfügung...

Zu Testzwecken kann ich mir die Header selbst setzen... die sind damit immer utf8... und trotzdem werden sie gelegentlich falsch erkannt...

Was kann ich da tun?

2024-05-24
girl looking backwards with a fighting pose
Stumpi im Retrolandstumpi@c64.social
2024-04-09

Dank #Tika und #Gotenberg kann mein #paperlessngx nun auch mit Officedokumenten umgehen. #yay
🙃

Johan van der Knijffbitsgalore@digipres.club
2024-03-28

Just found out there's now a development prototype of veraPDF-rest, which exposes #VeraPDF's functionality through a REST API:

github.com/veraPDF/veraPDF-res

Will need to try this out, but this definitely looks really useful!

This could also be good for developing performant VeraPDF wrappers in other programming languages, like Python (similar to how Tika-python currently wraps around #Apache #Tika's REST API).

q.binqbinary
2024-02-02

are amazing. Created an Q&A running completely local. And it is shockingly good whilst being shockingly easy to implement...

I just dump a folder of PDFs into . Concat them, split them by /n/n to get paragraphs. Yoink them into . Done

Now I can pose a question that will query chroma to return 20 semantically similar documents. Those documents are dumped into a mixtral-instruct in combination with the original question.
The results are nearly perfect!

Stefan TRMSC | eduBWtrmsc@bildung.social
2023-10-09

@_DigitalWriter_ Darauf freue ich mich riesig! Einen ganz großen Dank im Vorfeld Herbert! 😊 🙏

Werden zufällig sogar #tika und #gotenberg Thema sein, wodurch neben #office Dateien wohl sogar #EML verarbeitet werden kann? 😮
Damit wäre endlich "nebenbei" (m)eine plattformübergreifende Lösung zur #email #archivierung gegeben? 😍

docs.paperless-ngx.com/configu

Das finde ich noch etwas kompliziert und würde mir sehr helfen, #paperlessngx auf der Projektagenda nach oben zu schieben! 🥳

#digitalcleaning

David Bloombergdavidbloomberg@mas.to
2023-06-10

During the #WhyXLost #Survivor44 season wrap-up podcast, Voce surprised the rest of us by revealing he didn’t know the #ThreeStooges were actually a real thing! 😲 (Also the #Tika 3 nickname.) We had to explain it to the youngster. Today’s TikTok: tiktok.com/t/ZT81ACJbh/

If you’d rather watch us on YouTube as a Short, have at it: youtube.com/shorts/1ZGnJKR3qkg

Be sure to catch up on the FULL podcast: robhasawebsite.com/survivor44-

#Survivor #RHAP #SurvivorFinale #CBSSurvivor #RealityTV #TV #TVShow

Client Info

Server: https://mastodon.social
Version: 2025.04
Repository: https://github.com/cyevgeniy/lmst