#ner

2025-06-25

Что такое NER, зачем он нужен и когда не поможет

Про NER написано немало, но этот материал носит прикладной характер. Статья будет полезна тем, кто интересуется NLP и ищет разные подходы для решения узкопрофильных задач, требующих извлечения сущностей из текста. Для джунов это возможность пройти весь путь — от разметки данных до обучения собственной кастомной NER-модели, попутно понять типичные сложности и ограничения. Привет, меня зовут Александр Агеев, на протяжении года я занимался NER-моделями для определения сущностей на этикетках продуктов питания. Несмотря на мою любовь к NER, у этой технологии есть свои границы — кейсы, которые она не может решить хорошо, поэтому надо подключать другие инструменты. В статье я дам критерии применимости NER для решения практических задач.

habr.com/ru/articles/921698/

#нейросети_python #named_entity_recognition #ner #natural_language_processing #nlp #spacy #примеры_кода #обучение_моделей

Oliver Ammannoa@swiss.social
2025-06-23

Am Donnerstag referiert mein Kollege Roman Walt für mich an der #bibliocon25 zu #OCR und #NER #NEL auf e-rara – Danke Roman!

bid2025.abstractserver.com/pro
#namedentityrecognition #namedentitylinking #ethbibliothek #erara

Where's Lena? :neocat_hug_ice_3:lenaontrans@zug.network
2025-06-20

PU auf der Strecke #NN - #NER - #NBA in #NVA, Zug wird über #NNA - #DS:NS umgeleitet, Ankunft #NBA mit +90, #BL mit +70 prognostiziert

2025-06-19

Also presented at #dae2025 : a research platform developed by Dariah PL for uploading, annotating, enriching and sharing #humanities data. The platform also allows collaborations. Interesting features are embedded #OCR and #NER functionalities. Find out more: lab.dariah.pl/en/

CDR Writers Orgcdrwritersorg
2025-06-13

📘 What is the National Engineering Register (NER)?

If you're an engineer looking to boost your credibility and visibility in Australia, NER registration with Engineers Australia is a great step forward.

✅ Recognized qualification
✅ 5+ years of experience
✅ Proven professional competence

Learn more about eligibility, benefits, and how to register ➡️
🔗 cdrwriters.org/blog/what-is-na

What is National Engineer Register?
2025-06-11

От хаоса к порядку: как ML помогает искать и защищать конфиденциальную информацию

В современном мире объемы данных растут экспоненциально: компании ежедневно генерируют и обрабатывают огромные массивы информации — от реляционных баз данных и текстовых документов до изображений, аудио и видео. С ростом объемов информации усложняется и ее защита, особенно в отношении чувствительных сведений: персональных данных сотрудников и клиентов, финансовой информации, корпоративных документов и других конфиденциальных материалов. Традиционные методы обнаружения и классификации информации, основанные на формальной экспертизе и регулярных выражениях, демонстрируют ограниченную эффективность: они неплохо работают для стандартных форматов, таких как email-адреса и банковские карты, но могут не покрывать с должной полнотой обнаружение в реальных сценариях. На помощь приходит машинное обучение, позволяющее автоматизировать процесс классификации, учитывать контекст и работать с разными источниками информации. Меня зовут Вадим Безбородов. Мы c Максимом Митрофановым в департаменте Data science & ML в Positive Technologies занимаемся исследованием и внедрением машинного обучения в продукты компании. В этой статье расскажем о наших исследованиях и внедрении ML в модуль поиска и классификации чувствительных данных в PT Data Security. Читать

habr.com/ru/companies/pt/artic

#машинное_обучение #обработка_естественного_языка #персональные_данные #информационная_безопасность #named_entity_recognition #machine_learning #nlp #data_security #защита_данных #ner

9Lukas5 🚂 🐧9Lukas5@mastodontech.de
2025-06-06

Cool.....coolcoolcoool

- 13min Umstieg in NN
- pünktlich ab in #NER
- S-Bahn voraus
- +4 an #NF

- ein Gz überholt
- ein ICE überholt

- +11 ab #NF 😤

Digital History BerlinDigitalHistory@fedihum.org
2025-06-05

Stelle 3/5

Für das Projekt „TextPloring. Forschungsdatenexploration in den Geisteswissenschaften mit dem LAUDATIO-Repository“ suchen wir befristet auf 2 Jahre ein*e #WiMi (65%) für die Modellierung mittelalterlicher Städtechroniken, Integration in das #LAUDATIO Repositorium & eigenständiger Beforschung der Daten mit #DigitalHistory Methoden.

In diesem Rahmen besteht die Möglichkeit zur Entwicklung eines Promotionsprojekts.

👉 dhistory.hypotheses.org/10656

#DH #Mediävistik #NER #LLM #DHJobs
4/6

Digital History BerlinDigitalHistory@fedihum.org
2025-06-05

📢 Wir stellen ein! 📢

Am Lehrstuhl für Digital HIstory der @HumboldtUni bzw. verbundenen Drittmittelprojekten sind über den Sommer 5 Stellen zu besetzen!

Mehr Details zu den Stellen und zur Bewerbung gesammelt auf unserem Blog... 👉 dhistory.hypotheses.org/10656

...oder im Kurzformat hier im Thread. 👇

@histodons @historikerinnen
#DH #DigitalHistory #NFDI #DHJobs #WiMi #RSE #InfoWiss #WissKomm #OER #NER #LLM #Mediävistik
1/6

2025-05-06

We've been working on a little library that might be useful if you work with #TEI and NER or text analysis:

• Extract plaintext from TEI
• Run your NER/NLP tools
• Map results back into the original TEI—without breaking anything!

Perfect for adding automated annotations to existing markup.

👉 github.com/recogito/tei-stando

#DigitalHumanities #TEI #NER #NLP

2025-04-30

Today, the 2nd lecture of #ISE2025 took place with an introduction into Natural Language Processing, which will be subject of our lecture for the next 4 weeks.

#AI #nlp #informationextraction #ocr #ner #linguistics #computationallinguistics #morphology #pos #ambiguity #language @fiz_karlsruhe @fizise @tabea @enorouzi @sourisnumerique #AIart #generativeAI #machinetranslation #languagemodels #llm

Cover slide of the slide deck presentation for the ISE 2025 lecture. It states: Information Service ENgineering, Lecture 2: Natural Language Processing 01, Prof. Dr. Harald Sack, FIZ Karlsruhe, AIFB, KIT Karlsruhe, Summer Semester 2025. It shows the two logos of FIZ Karlsruhe and KIT. In the background there is an AI-generated image of a (female) bald head connected to many wires forming a kind of graph network.
2025-04-15

📖 #NLP people, a reminder that the brilliant notebooks developed by #Ghent CDH are a game-changing walkthrough of #NER, #ABSA Sentiment Analysis, and #RelationalExtraction pipelines. ▶️
Please share widely!
github.com/GhentCDH/CLSinfra/t

2025-04-03

#til the German transformer model for #spacy is not trained for #ner. Room for improvement, I'd say.

Gábor SEBESTYÉN 🇭🇺🇪🇺🇺🇦segabor@czinege.social
2025-04-03

Ez miért nincs a jóhir PONT kormány.hu -ra kitéve? Szerintem pont odavaló. Ja, meg kiléptették Magyarországot a nemzetközi büntetőbíróságból 😡 #mcc #mol #fidesz #ner

2025-03-31

Heute wieder in Köln für das #VL-Anwendertreffen. Spannende Vorträge im Plan. Von mir gibt’s morgen eine kleine Tour durch Nachlassdigitalisierung, #HTR und #NER (und die Grenzen dessen).

2025-03-19

📖 three CLS INFRA Deliverables on #NLP are out now! 📖
In this video Tess Dejaghere and Pranaydeep Singh of Ghent University CDH explain and demo work on #NER (#NamedEntityRecognition), #ABSA (Aspect-based #SentimentAnalysis) and #RelationalExtraction.
youtu.be/RJE83eb7a6A

2025-03-07

Canada ist ein Pferd - @bibwiss hat die besten Beispiele für Unsicherheit /Uncertainty bei Named Entity Recognition :) #NER #DHd2025

Sophie Schneider vorn im Hörsaal beim Vortrag und Blick auf Präsentation
Holle Medinghmeding
2025-03-06

🔠 Panel: More than Chatbots: Multimodal Large Language Models in Humanities Workflows

At , Nina Rastinger explores how well handles abbreviations & NER:

✅ NER works well, even with small, low-cost models
❌ Abbreviations are tricky—costs & resource demands skyrocket
🚀 GPT o1 improves performance, even on abbreviations, but remains resource-intensive
Balancing accuracy & efficiency in text processing remains a challenge! ⚖️

Nina Rastinger at Panel More than Chatbots: Multimodal Large Language Models in Humanities Workflows #dhd2025
Digital History BerlinDigitalHistory@fedihum.org
2025-02-12

🥁 We are happy to announce that we just published our first preprint on arXiv: "NER4all or Context is All You Need: Using LLMs for low-effort, high-performance NER on historical texts. A humanities informed approach".🎉

👉 arxiv.org/abs/2502.04351 👈

It is also our first endevour into collaborative work with such a large number of collaborators & contributors from the Chair of Digital History, NFDI4Memory's Methods Innovation Lab, & AI-Skills.

#DigitalHistory #NER #LLM #AI #DigitalHumanities

Client Info

Server: https://mastodon.social
Version: 2025.04
Repository: https://github.com/cyevgeniy/lmst