#ml4se

2025-06-07

Benchmark — разрушитель LLM'ок, или Как мы собрали свой мультиязычный SWE-Bench

В статье представлено многоязычное расширение SWE-Bench от команды

habr.com/ru/companies/doubleta

#AI #ML #DS #SWE #bench #ML4se #Dataset #Датасет #Разметка_данных #benchmark

Arie van Deursen 🇪🇺🇳🇱avandeursen@mastodon.acm.org
2023-09-13

Today's #ASE2023 keynote on "resolving code review comments with ML".

Presented by Danny Tarlow (Google Deepmind).

Blog: blog.research.google/2023/05/r

Based on the DIDACT "Large sequence models for software development activities". blog.research.google/2023/05/l

#ai4se #codereview #ml4se #DannyTarlow #DIDACT

Client Info

Server: https://mastodon.social
Version: 2025.07
Repository: https://github.com/cyevgeniy/lmst