#LMArena

2025-10-18

Chào mỗi bạn! Hiện, AI trên LMArena chưa hỗ trợ từ Kyryillic trong tên chat, chỉ hiển thị chữ Latin và dấu-interpunct. Điều này khiến tên chat chỉ là dấu-comma hoặc dấu-dấu. 🤖 Cotherap hình ảnh viết bằng Petrus. #AI #Cyrillic #LMArena #TechNews #Vietnamese #ChatNames #Tin-Kyzyllic #Dinh-Vu-AI

reddit.com/r/singularity/comme

2025-10-18

Microsoft 첫 자체 이미지 AI ‘MAI-Image-1’, LMArena 9위 데뷔의 의미

Microsoft가 자체 개발한 첫 이미지 생성 AI MAI-Image-1을 발표하며 LMArena 9위에 데뷔했습니다. OpenAI 의존도를 줄이고 사진 리얼리즘에 집중한 Microsoft의 전략을 살펴봅니다.

aisparkup.com/posts/5596

2025-10-17

"Hiện có một mô hình bí ẩn tên 'soltitude' trên lmarena. Tiêu bổ tên币 là gì? 🤔 #mystery #lmarena #model #technology"

reddit.com/r/singularity/comme

2025-10-14

Mô hình x1-1-kiwifruit với phong cách viết hấp dẫn được phát hiện trên LMArena, nhưng hiện không tìm thấy bất kỳ thông tin nào về nó, kể cả trên chính LMArena. Nguyên nhân có thể là lỗi tên, mô hình tạm thời hoặc bị gỡ nhanh. Cộng đồng LocalLLaMA đang thảo luận.
#AI #LLM #MôHìnhNgônNgữ #LMArena #LLMs #LocalLLaMA

reddit.com/r/LocalLLaMA/commen

NERDS.xyz – Real Tech News for Real Nerdsnerds.xyz@web.brid.gy
2025-10-14

Microsoft unveils MAI-Image-1, its first in-house image generator

web.brid.gy/r/https://nerds.xy

2025-10-14

"Tôi tìm thấy mô hình AI x1-1-kiwifruit trên LMArena về phong cách viết ’Alternate Reality'. Không thấy ở đâu cả! Czó: @LorestForest #AI #LMArena #TôngCáo #PhongCáchViết #MôHìnhAI #CôngDiệnVănHóa"

reddit.com/r/LocalLLaMA/commen

Benjamin Carr, Ph.D. 👨🏻‍💻🧬BenjaminHCCarr@hachyderm.io
2025-10-13

#China leads #US on this measure of technological influence
#American companies are widely seen as offering most powerful proprietary AI, such as #OpenAI’s #ChatGPT and #Google’s #Gemini #chatbots. But by openly sharing #AI software, Chinese firms could have major influence over the trajectory of technology.
Open models from Chinese firms are rated higher than those from American companies on #LMArena, a site that uses blind tests to discover which AI outputs users prefer
msn.com/en-us/news/technology/

2025-10-08

Топ-10 лучших бесплатных нейросетей, которые сильно упростят вашу жизнь

2025 год. Нейросети уже не просто часть технологий, а часть повседневности. Они рядом с нами в работе, учебе, творчестве, даже в быту. Помогают написать письмо, подобрать музыку, отредактировать фото или придумать идею для проекта. Иногда кажется, что единственное, чего им не хватает, это способности приготовить завтрак. Хотя, если честно, и это, похоже, лишь вопрос пары десятков апдейтов. Всего пару лет назад мы с интересом наблюдали, как алгоритмы с трудом оживляют фотографии. Тогда всё это выглядело забавно и очень неуклюже. А теперь ИИ рисует картины, пишет сценарии и создаёт видео, которые сложно отличить от реальных. В какой-то момент мы даже перестали удивляться. Но вместе с возможностями пришла и новая проблема. Их стало слишком много. Каждый день появляются десятки новых сервисов, которые обещают упростить жизнь и сделать всё за вас. Чтобы сэкономить вам время, мы собрали подборку из десяти нейросетей, которые подойдут на все случаи жизни. Они просты, удобны и работают без привязки карты. Приятного чтения!

habr.com/ru/companies/bothub/a

#ии #нейросети #машинное+обучение #cursor #perplexity #lmarena #nano_banana #gigachat #firebase #notebooklm

2025-10-03

GLM 4.6 đứng đầu bảng xếp hạng mô hình ngôn ngữ mở trên LMarena! 🏆 Đứng thứ 3 về code, thứ 3 về hard prompts và số 1 về creative writing. Một bước tiến lớn cho AI mã nguồn mở! 🤖✨ #AIVietnam #OpenSource #GLM46 #LMarena #CreativeWriting #CodingAI

reddit.com/r/LocalLLaMA/commen

2025-09-24

Grok 4 Fast: 98% 비용 절감으로 AI 게임의 룰을 바꾸다

xAI의 Grok 4 Fast가 어떻게 98% 비용 절감과 LMArena 검색 부문 1위를 달성했는지, 그리고 이것이 AI 업계의 경쟁 구도와 개발자 생태계에 미치는 영향을 분석한 실용적 가이드입니다.

aisparkup.com/posts/5082

2025-09-04

Wonderful/Useful Resource! "The Battle of the #LLMs: A Popular Website Allows Users to Pit #AI Models From Google, OpenAI, And More Against Each Other" (via #businessinsider) businessinsider.com/lmarena-ct #LMArena #GenAI

Troll 🎃Troll@maly.io
2025-08-29

Je découvre #LMArena c'est un site qui permet d'utiliser différents modèles IA (LLMs , génération d'images et recherche wb) sans avoir besoin de compte.

Il nous propose à chaque fois 2 réponses et nous invite a voter pour la meilleure d'entre-elles.

C'est crée par des chercheurs d'UC Berkeley. Ils proposent différents classements basés sur les retours utilisateurs.

Çà ne semble pas limité dans l'usage.

lmarena.ai

#IA #Ai #LLM

Capture du site: A propos de nousCapture du site: Comment ca marche
2025-07-20

🧠 #Kimi K2 va al primo posto tra i modelli open superando #DeepSeek, secondo #LMArena

📈 Ma va anche al 5° posto nella classifica generale, superando diversi #LLM proprietari prestigiosi. 

👉 Alcuni miei test sul modello: linkedin.com/posts/alessiopoma 

___ 

✉️ 𝗦𝗲 𝘃𝘂𝗼𝗶 𝗿𝗶𝗺𝗮𝗻𝗲𝗿𝗲 𝗮𝗴𝗴𝗶𝗼𝗿𝗻𝗮𝘁𝗼/𝗮 𝘀𝘂 𝗾𝘂𝗲𝘀𝘁𝗲 𝘁𝗲𝗺𝗮𝘁𝗶𝗰𝗵𝗲, 𝗶𝘀𝗰𝗿𝗶𝘃𝗶𝘁𝗶 𝗮𝗹𝗹𝗮 𝗺𝗶𝗮 𝗻𝗲𝘄𝘀𝗹𝗲𝘁𝘁𝗲𝗿: bit.ly/newsletter-alessiopomaro 

#AI #GenAI #GenerativeAI #IntelligenzaArtificiale 

Miguel Afonso Caetanoremixtures@tldr.nettime.org
2025-05-22

"Chatbot Arena started as an academic project, where researchers and students at the University of California at Berkeley worked to evaluate the capacity of artificial intelligence tools. Now, the group has spun out into a new company, called LMArena, that’s raised $100 million in seed funding from a slate of A-list investors.

Andreessen Horowitz and UC Investments — which manages an investment portfolio for the University of California — led the fundraising, which the company plans to announce Wednesday. The deal includes backing from Lightspeed Venture Partners, Felicis Ventures and Kleiner Perkins, among others, the company said.

The round values LMArena at $600 million, according to people familiar with the matter who asked not to be named in order to discuss private conversations. This gives the company, the formation of which was announced in April, a substantial valuation despite being less than two months old. LMArena declined to comment on its valuation.

“We believe evaluations are more important now than when we started,” said Ion Stoica, LMArena co-founder and chairman. Stoica, a UC Berkeley professor, is also the co-founder of tech companies such as Databricks Inc. and Anyscale Inc.

LMArena’s website allows people to test a slew of cutting-edge AI models and see how they perform head to head. Users then vote for the ones they prefer on the site’s leaderboards, which are closely watched by the tech community."

bloomberg.com/news/articles/20

#AI #GenerativeAI #LLMs #Chatbots #LMArena

2025-05-05

🧠 Il paper “The Leaderboard Illusion” (MIT e Stanford) mette in luce alcune distorsioni nella piattaforma #LMArena.
👉 I dettagli e la risposta di LMArena: linkedin.com/posts/alessiopoma

___ 

✉️ 𝗦𝗲 𝘃𝘂𝗼𝗶 𝗿𝗶𝗺𝗮𝗻𝗲𝗿𝗲 𝗮𝗴𝗴𝗶𝗼𝗿𝗻𝗮𝘁𝗼/𝗮 𝘀𝘂 𝗾𝘂𝗲𝘀𝘁𝗲 𝘁𝗲𝗺𝗮𝘁𝗶𝗰𝗵𝗲, 𝗶𝘀𝗰𝗿𝗶𝘃𝗶𝘁𝗶 𝗮𝗹𝗹𝗮 𝗺𝗶𝗮 𝗻𝗲𝘄𝘀𝗹𝗲𝘁𝘁𝗲𝗿: bit.ly/newsletter-alessiopomar 

#AI #GenAI #GenerativeAI #IntelligenzaArtificiale #LLM

Ars Technica Newsarstechnica@c.im
2025-05-01

New study accuses LM Arena of gaming its popular AI benchmark arstechni.ca/FkAGg #ArtificialIntelligence #lmarena #google #openai #meta #AI

2025-04-24

От улыбки рейтинг наш светлей: Как фильтры стиля и настроения меняют рейтинг LLM

Как фильтры стиля и настроения меняют рейтинг LM Arena Привет, Хабр! Я Сергей, в Битрикс24 отвечаю за то, чтобы под капотом Copilot крутилась правильная LLM — та, что действительно помогает пользователю, а не просто разбрасывается смайликами. Выбирая лучшие языковые модели, люди далеко не всегда руководствуются точностью ответов. Иногда внимание пользователей привлекает красивое оформление или эмоциональный стиль, а не фактическая польза. На LM Arena это стало особенно заметно в последнее время и заставило команду платформы изучить, как именно эмоции и оформление влияют на рейтинг моделей. Команда площадки решила отделить форму от содержания и запустила фильтр Sentiment Control , который «вычитает» эмоции и украшательства из итогового балла. Ниже — коротко о том, как они вычислили этот «эмо-чит» и почему это важно всем, кто выбирает модель для продукта, клиентской поддержки или внутреннего ассистента. Что такое LM Arena и зачем она нужна Сейчас существует много способов измерить качество языковых моделей. Есть метрики, которые оценивают знание фактов (MMLU), способность к обобщённому рассуждению (ARC‑AGI), умение решать задачи в игровой среде (VideoGameBench) и даже подсчитывают, сколько долларов модель могла бы заработать на реальных биржах фриланса (GigBench). На этом фоне появилась LM Arena — платформа, где пользователи вслепую сравнивают ответы разных моделей и выбирают лучший. Чем больше побед у модели, тем выше её рейтинг. Это похоже на шахматы или киберспорт, где тоже используется рейтинговая система Elo.

habr.com/ru/companies/bitrix/a

#lmarena #нейросети #openai #языковые_модели #chatgpt #внедрение_ai #ds #выбор_модели

Client Info

Server: https://mastodon.social
Version: 2025.07
Repository: https://github.com/cyevgeniy/lmst