#Eval

NaWiknawik
2025-07-14

🔍 Online-Workshop: Praxisnahe Evaluation von ! Teilnehmende entwickelten in unserem Workshop Evaluationspläne für Projekte-von Exzellenzclustern bis hin zu Formaten für Schüler:innen. Der Fokus lag dabei auf Ziel, Methode & Umsetzung. Danke für den inspirierenden Austausch! 🙌💡

Sieben Personen, die an einem Online-Workshop teilnehmen. Links in der Ecke: Ein grünes Icon mit dem Wort Einblick und einem Auge als Symbol in der Mitte.
2025-06-29

more python binding fun

>>> [a,b] = a = c = [1,1]
>>> a,b,c
([1, 1], 1, [1, 1])

2025-06-27

Still having fun with class scoping rules

def f_ok(f):
">>> f_ok(1).G.y # 1"
class F:
g = f
class G:
y = f
return F

def f_mok(f):
">>> f_mok(1) # NameError: name 'f' is not defined"
class F:
f = f
class G:
y = f
return F

def f_nok(f):
">>> f_nok(1) # NameError: name 'y' is not defined"
y = f
class F:
g = f
class G:
y = y
return F

EsquerraValencianaEsquerraVakencians
2025-05-31

A arribat el moment.
El Consell nacional d'Esquerra Valenciana vàlida el retorn a la activitat política activa.

Es el moment de les valencianes I valencians, es el moment d'Esquerra Valenciana.

diarilaveu.cat/politica/esquer

2025-04-28

[Перевод] Хочешь умного агента? Научись оценивать его правильно

В середине 2024 года AI-агенты стали главной темой обсуждений в технологическом сообществе — с помощью них теперь выполняют множество задач от заказа ингредиентов для ужина до бронирования билетов и записи на прием к врачу. Затем появились вертикальные AI-агенты — узкоспециализированные системы, о которых заговорили как о потенциальной замене привычных SaaS-решений. Но по мере роста влияния агентов увеличиваются и риски, связанные с их преждевременным внедрением. Недостаточно протестированный AI-агент может стать источником множества проблем: от неточных предсказаний и скрытых байасов до плохой адаптивности и уязвимостей в безопасности. Такие ошибки дезориентируют пользователей и подрывают доверие к системе, нарушая принципы fairness и транспарентности. Если вы разрабатываете AI-агента, наличие чёткой стратегии безопасного деплоймента критически важно. В этой статье мы рассмотрим, почему тщательная валидация необходима, разберём пошаговые подходы к тестированию и методы проведения комплексной оценки AI-агентов для обеспечения их надёжного развертывания.

habr.com/ru/articles/902608/

#ai_agent #ai_agents #ai_агенты #ии_агент #ai #ии #llm #eval

2025-04-21

[Перевод] Оцени, прежде чем доверять: как сделать AI-агента полезным

Часто недооцененным аспектом разработки AI-агентов остаётся этап оценки. Хотя создать proof of concept относительно просто, поиск оптимальной конфигурации для балансировки стоимости, скорости, релевантности и других параметров требует значительных временных затрат. Инструменты и фреймворки для оценки являются ключевыми элементами этой стадии оптимизации.

habr.com/ru/articles/902594/

#ai_agent #ai_агенты #ai #ии #llm #rag #eval #genai

N-gated Hacker Newsngate
2025-04-04

🎩 BREAKING NEWS: is weird! 🧙‍♂️ Who would've thought? 🤔 An article reveals the shocking truth that is a , are , and is quirkier than your uncle's dance moves at a wedding. 😱 But hey, don't worry, just slap a on it and pretend everything's fine. 🙄
stack-auth.com/blog/on-javascr

Emlak Vitrinemlakvitrin
2025-03-28

🏡 MERHABA ARTVİN! 🏡

Artvin’deki emlak ilanlarınızı profesyonelce yayınlayın!
📍 Güvenilir ve profesyonel emlak ilanları için EmlakVitrin.com’a katılın!

🌐 www.emlakvitrin.com

Emlak Vitrinemlakvitrin
2025-03-28

🏡 MERHABA ARDAHAN! 🏡

Ardahan’daki emlak ilanlarınızı profesyonelce yayınlayın!
📍 Güvenilir ve profesyonel emlak ilanları için EmlakVitrin.com’a katılın!

🌐 www.emlakvitrin.com

Emlak Vitrinemlakvitrin
2025-03-28

🏡 MERHABA AKSARAY! 🏡

Aksaray’daki emlak ilanlarınızı profesyonelce yayınlayın!
📍 Güvenilir ve profesyonel emlak ilanları için EmlakVitrin.com’a katılın!

🌐 www.emlakvitrin.com

Emlak Vitrinemlakvitrin
2025-03-28

🏡 MERHABA ADIYAMAN! 🏡

Adıyaman’daki emlak ilanlarınızı profesyonelce yayınlayın!
📍 Güvenilir ve profesyonel emlak ilanları için EmlakVitrin.com’a katılın!

🌐 www.emlakvitrin.com

🏡 MERHABA ADIYAMAN! 🏡

Adıyaman’daki emlak ilanlarınızı profesyonelce yayınlayın!
📍 Güvenilir ve profesyonel emlak ilanları için EmlakVitrin.com’a katılın!

🌐 www.emlakvitrin.com

#EmlakVitrin #AdıyamanEmlak #AdıyamanGayrimenkul #SatılıkEv #KiralıkDaire #AdıyamanKonut #EmlakSektörü #Emlakçı #EvAl #EvSat #AdıyamanEvleri #GüvenilirEmlak
Emlak Vitrinemlakvitrin
2025-03-28

🏡 MERHABA ADANA! 🏡

Adana’daki emlak ilanlarınızı profesyonelce yayınlayın!
📍 Güvenilir ve profesyonel emlak ilanları için EmlakVitrin.com’a katılın!

🌐 www.emlakvitrin.com

IB Teguh TMteguhteja
2025-03-03

XML Odoo Eval tutorial explains how to fix common XML errors, correctly set eval attributes, and add image fields in Odoo modules. Read more for detailed code examples and best practices. Tags:

teguhteja.id/xml-odoo-eval-cor

Markus 🤓✨markus@hachyderm.io
2025-02-27

My evals.fun web app is really starting to become usable for graphing #LLM #eval results! I’m using it in a client project to embed graphs in GitHub PRs. Try it out, one project is free forever! evals.fun

2025-02-23

I think that I would not go back to using a language where I can't just type

#eval my-thing

in the middle of a document. This is so much better than a REPL it is not even funny. Don't talk to me about REPLs...

It is so unnecessarily complicated to figure out how to actually run some code in languages like OCaml or Haskell, and then (in OCaml) you realise "Oh god, I also need to write a pretty printer for everything" when you are just trying to explore and figure out what something does. The fact that you can use a ppx doesn't really help, because you still have to figure out the *name* of the pretty printer you are trying to call...

2025-02-23

It is nice to have dependent types **and** a good notebook environment (with #eval/#reduce) to help me get this kind of code right...

Judith van Stegerenjd7h@fosstodon.org
2025-02-11
Ioannis Konstantoulasykonstant@mathstodon.xyz
2025-02-11

@brendan I mean, `#eval` can execute arbitrary I/O, so if you are carelessly testing your functions with it and there is some I/O somewhere in the chain of functions, who knows what can be overwritten.

I once accidentally dumped about 20 GB of noise from /dev/urandom into a temp file because of an #eval. If you have IO functions that do file deletion for cleanup, you better make sure you don't pass those to an #eval by mistake.

Unlike code you are ready to compile and execute, you can always butterfingers an eval parameter!

Ioannis Konstantoulasykonstant@mathstodon.xyz
2025-02-11

@brendan `#eval` is also a great way to delete System32 😅

Client Info

Server: https://mastodon.social
Version: 2025.04
Repository: https://github.com/cyevgeniy/lmst