Lmst

Reranking text documents with Ollama and Qwen3 Embedding model - in Golang:
https://www.glukhov.org/post/2025/06/reranking-with-ollama-qwen3-embedding-golang/
#ollama #embedding #reranking #golang #ai #llm

Qwen3 Embedding & Reranker Models on Ollama: State-of-the-Art Performance
https://www.glukhov.org/post/2025/06/qwen3-embedding-qwen3-reranker-on-ollama/
#Qwen3 #Embedding #Reranker #LLM #AI #ollama

#Development #Techniques
Introducing php-node · How to seamlessly blend PHP with Node.js https://ilo.im/164g4x

_____
#Programming #Coding #Embedding #NodeJS #PHP #WordPress #CMS #WebDev #Frontend #Backend

https://blog.gslin.org/archives/2025/06/09/12444/mariadb-11-8-lts/

MariaDB 11.8 LTS

#2038 #2106 #database #embedding #hnsw #mariadb #mysql #problem #rdbms #signed #timestamp #unsigned #vector #year

[備忘録] Google Colabで30行！Qwen3-Embedding-0.6Bで日本語テキスト類似度計算
https://qiita.com/Tadataka_Takahashi/items/4ff6e114db134746c835?utm_campaign=popular_items&utm_medium=feed&utm_source=popular_items

#qiita #Python #日本語 #colaboratory #embedding #Qwen3

Mem-векторы: как сохранить 1500 токенов в одном векторе и зачем это нужно

Каждый, кто работал с большими языковыми моделями (LLM), знает про ограничение длины контекста: модель не может напрямую обработать текст, превышающий определённое число токенов. Это накладывает ограничения на работу с длинными документами и обширным контекстом. Но что если бы мы могли упаковать длинный текст в один-единственный вектор и скормить его модели как обычный токен? Звучит фантастично, однако свежие исследования показывают, что это возможно – такие “mem-векторы” позволяют сохранить сотни и даже полторы тысячи токенов информации в одном эмбеддинге. Это принципиально иной подход, нежели классическое сжатие данных, и он сулит интересные применения. Mem-вектор (от “memory vector”) – это специально обученный вектор, который хранит содержание целого текста. Идея в том, что если модель умеет предсказывать текст, то можно подобрать такой вектор на входе, при котором замороженная (неизменяемая) LLM сама декодирует исходный текст . Иначе говоря, mem-вектор играет роль «семени», из которого предобученная модель порождает заложенное в нём сообщение. В этой статье разберём, как это работает, почему вообще возможно “запихнуть” роман в один вектор и какие ограничения при этом появляются. Также сравним mem-подход с классическими алгоритмами сжатия (Huffman, арифметическое кодирование, zlib и др.), обсудим последние научные работы на эту тему и возможные применения: от Retrieval-Augmented Generation (RAG) до передачи новых знаний замороженным моделям. Центральная мысль: mem-векторы – это не просто компрессия текста, а способ напрямую скормить модели смысл и знания, минуя последовательное чтение токенов . Разбираемся далее

https://habr.com/ru/articles/906592/

#memвектор #llm #энтропия_текста #компрессия #RAG #embedding #hidden_capacity #NLP

'Variance-Aware Estimation of Kernel Mean Embedding', by Geoffrey Wolfer, Pierre Alquier.

http://jmlr.org/papers/v26/23-0161.html

#embeddings #embedding #empirical

Proactive culture is the real preparation. Building a proactive security culture means embedding readiness into everyday operations. It’s not just about preparing for the “what ifs” — it’s about creating an environment where users, teams, and leaders are already aligned before a breach...

https://medium.com/readers-club/reactive-incident-response-vs-proactive-culture-rethinking-how-we-prepare-for-cyber-threats-1c907e6cfb92

#readersclub #proactive #culture #building #security #embedding

Oracle Database RU23.7で機能追加されたDB内マルチモーダルEmbeddingを試してみた
https://qiita.com/ssfujita/items/dc4087551253adb597c9?utm_campaign=popular_items&utm_medium=feed&utm_source=popular_items

#qiita #oracle #MultiModal #embedding #VectorSearch #23ai

【Google Colab】カレーレシピでわかる！PLaMo-Embedding-1Bによる意味検索入門
https://qiita.com/Tadataka_Takahashi/items/575e1d965938ef98020e?utm_campaign=popular_items&utm_medium=feed&utm_source=popular_items

#qiita #Python #日本語 #colaboratory #embedding #PLaMo

Photographer asks #SupremeCourt to decide if embedded #InstagramPosts infringe #copyright https://zorz.it/gaucE | #PesalaBandara #CopyrightInfringement #embedding #EmbedFeature #Instagram #lawsuit #technology

Photographer Asks Supreme Court to Decide if Embedded Instagram Posts Infringe Copyright https://petapixel.com/2025/04/09/photographer-asks-supreme-court-to-decide-if-embedded-instagram-posts-infringe-copyright/ #copyrightinfringement #embedfeature #supremecourt #Technology #embedding #instagram #lawsuit #News #Law

How to speak in ways AI bots won’t understand.

今朝毎朝ボット

https://youtube.com/watch?v=F4KQ8wBt1Qg
#ai #llm #machinelearning #embedding #context

SOTA Code Retrieval with Efficient Code Embedding Models — https://www.qodo.ai/blog/qodo-embed-1-code-embedding-code-retreival/
#HackerNews #SOTA #Code #Retrieval #Code #Embedding #AI #Technology #Machine #Learning

#AI and #RAG - Learning the basics: What exactly is an #embedding and how to use them in #MariaDB?
https://www.youtube.com/watch?v=XkB2DLK60JU

GitHub - lancedb/lancedb: Developer-friendly, serverless vector database for AI applications. Easily add long-term memory to your LLM apps! https://github.com/lancedb/lancedb #persistence #OpenSource #embedding #database #GitHub #search #vector #ai

💟🎉初めてのAI開発！ワクワクしながら作った問い合わせ対応チャットボット🎉💟
https://qiita.com/SatoRyota_zvc/items/c5d647f5174ca8136bcb?utm_campaign=popular_items&utm_medium=feed&utm_source=popular_items

#qiita #Python #AI #chatbot #OpenAI #embedding

So basically face recognision is: compare current #embedding distance to database of embeddings and closest is considered a match?
#facerecognition #opencv