#Evaluation

Réseau F3Ereseauf3e
2025-05-30

🔈 Communauté de pratique consacrée au
🗓️ Jeudi 5 juin en ligne, à 14h30 (UTC+2)

On ne fait pas de suivi-évaluation sans implication de nombreuses parties-prenantes (ou on le fait mal !), mais il est toutefois important d’identifier leurs rôles et responsabilités en fonction de leur propre intérêt vis-à-vis de la démarche, de leur disponibilité, capacités et ressources.

👉 Inscriptions : reseauf3e.org/activite/session

Un groupe d'adultes assis en cercle avec le texte "communauté de pratique suivi évaluation"
Félicien Breton ⏚ 🍉 🔻breton@eldritch.cafe
2025-05-26
PL_RLPPL_RLP
2025-05-23

Befragungsportale EVA Klasse und EVA Schule jetzt auch über das RLP verfügbar: um diese Werkzeuge nutzen zu können, benötigen Sie einen Bildungsportal-Account. Mit einem Klick auf die Kacheln stehen diese Tools dauerhaft zur Verfügung. bildungsportal.rlp.de/

Serhii Nazarovetsserhii@mstdn.science
2025-05-23

How do countries assess research? With spreadsheets, committees, metrics - and increasingly, soul-searching. A new @RoRInstitute study compares 13 national systems and maps a quiet shift: from 'publish or perish' to 'be useful, be fair':

👉 doi.org/10.6084/m9.figshare.29

No silver bullets, just a very thoughtful typology.

#ResearchAssessment #OpenScience #CoARA #ResearchPolicy #Evaluation

Typology of national research assessment and funding systems, showing core aspects (inner circle) and subsidiary aspects (outer circle)

Rushforth, Alexander; Sivertsen, Gunnar; Wilsdon, James; Bin, Adriana; Firth, Catriona; Fraser, Claire; et al. (2025). A new typology of national research assessment systems: continuity and change in 13 countries. RoRI Working Paper No.15. Research on Research Institute. Preprint. https://doi.org/10.6084/m9.figshare.29041787.v4
Hindi NewsHindiNews
2025-05-20

HPBOSE रिजल्ट गड़बड़ी: अंग्रेजी पेपर में गलत मूल्यांकन, जल्द आएगा संशोधित परिणाम

rightnewsindia.com/career/hpbo

Universität Potsdamunipotsdam@wisskomm.social
2025-05-20

Bestnoten für Lehrende – Humanwissenschaftliche Fakultät der Universität Potsdam vergibt Lehrpreis an Dr. phil. Lars Rothkegel und fünf weitere Forschende. Weitere Informationen zu den TOP 10 am besten evaluierten Lehrveranstaltungen an der Humanwissenschaftlichen Fakultät und zum Fakultätsfest: uni-potsdam.de/de/nachrichten/

#lehrpreise #lehre #humanwissenschaften #evaluation #studierende #lehrende #qualitätsmanagement #golm #potsdam

Von links nach rechts: Dr. phil. Lars Rothkegel, Prof. Dr. Aileen Oeberst, Peter Horn, Henna Tahir, Dr. Berno Bahro und Dr. phil. Stefanie Bosse. Das Foto hat Florian Rumprecht aufgenommen.
Sonya McChristiesonya@scholar.social
2025-05-19

I wrote a thing, and if you're interested in #EdTech #TEL or #Education you might want to give it a wee read:

Should I Be Researching?

blog.mcchristie.com/should-i-b

#CPD #Ethics #Evaluation #HeLF #Research

2025-05-16

[Перевод] Reasoning CV-модели OpenAI не смогли посчитать монеты

Новые мультимодальные модели OpenAI o3 и o4-mini позиционируются как "разумные". Однако качественное тестирование на практических задачах вроде подсчета объектов и распознавания текста выявило неожиданные пробелы в их производительности, в некоторых случаях уступающие даже не-reasoning моделям. Узнайте, какие именно тесты провалили новинки и где показали уверенный результат.

habr.com/ru/articles/909052/

#ai #computervision #multimodal_llm #openai #llm #testing #evaluation #VQA #ocr

2025-05-15

"La fiction du mérite, que beaucoup de sociologues décrivent comme nécessaire car elle vient remplacer l’héritocratie de l’ancien régime, stipule que toute personne a un potentiel qu’elle nourrit par ses efforts et ses liens, dispose d’un principe d’émancipation, à l’image de la déclaration des Droits de l’Homme qui l’a érigée en principe. Chacun à le droit de tenter sa chance. En cela, cette fiction est rassurante, car elle paraît comme un ordre plus juste. C’est aussi une fiction sécurisante, car elle dit que les hommes de pouvoir ont les compétences pour occuper ces positions de pouvoir. Elle est aussi rassurante pour ceux qui perdent dans ce système, puisqu’elle légitime aussi cette perte. La fiction de la méritocratie est finalement apaisante pour la société, car elle ne pousse pas à analyser les raisons des inégalités et donc à éventuellement les subvertir. La fiction du mérite, nous donne l’illusion que si on n’y arrive pas, c’est parce qu’on n’a pas le talent ou qu’on n’a pas assez travaillé. Elle permet finalement de stabiliser la société."

danslesalgorithmes.net/2025/05
Samah Karaki en entretien avec @hubertguillaud

#talent #pédagogie #apprendre #joie #volonté #antiPsy #psychologie #contrôle #mérite #succès #doute #développementPersonnel #école #évaluation #évaluations #éducation #imagination #performance #classement #SamahKaraki #méritocratie #lesInstitutionsMentent

2025-05-14

I am so tired of seeing evaluators distracted and compromised by generative AI and LLMs.

It's taking up space even in the VSA justice and anti-racism space because people are asking how to use it ethically or in service of equity.

Thats Not How Any Of This Works dot gif

I guess I could show up to the meeting, but given that a) the main source of discussion points is from the garbage AEA journal on the topic and b) I've been ignored, it's prob not worth my time.

#evaluation #RealEvalTalk

Réseau F3Ereseauf3e
2025-05-14

[Restitution]

Venez participer à la restitution de l’étude collective : « La valeur ajoutée de la participation des jeunes aux politiques publiques dans les pays des Suds »

Cette étude est co-pilotée par quatre membres du consortium Place aux Jeunes : Engagé.e.s et Déterminé.e.s (E&D), Plan International France, l’IRAM et le GRET.

🗓️ Mercredi 11 juin à 10h (GMT+2)
📍 À Paris et à distance

👉 reseauf3e.org/activite/restitu


@Gret_ONG

Groupe de jeunes femmes manifestant dans la rue avec haut parleur et pancartes
h o ʍ l e t thomlett@mamot.fr
2025-05-13

→ Evidence of a social evaluation penalty for using AI
pnas.org/doi/abs/10.1073/pnas.

“As AI tools become increasingly prevalent in #workplaces, understanding the social dynamics of AI adoption is crucial.”

“[W]e propose that people believe they will be evaluated negatively by others for using AI tools and that this belief is justified. […] [We] find that people who use AI at #work anticipate and receive #negative evaluations regarding their #competence and #motivation.”

#evaluation #social #AI

Réseau F3Ereseauf3e
2025-05-12

[Restitution]

Vous souhaitez vous inscrire dans une démarche d’appui à la planification participative ?

Participez à notre restitution d'étude pour vous inspirer de la démarche mise en œuvre par Pays de la Loire Coopération afin de nourrir votre réflexion !

🗓️ 3 juin, 10h (GMT+2)
📍En ligne
👉 Infos : reseauf3e.org/activite/repense

Gros plan sur des adultes debout autour d'une table en train de travailler ensemble
Réseau F3Ereseauf3e
2025-05-06
Capture d'écran de mastodon montrant la page du F3E
2025-04-30

#Mednum #Réflexivité #Évaluation
Ces dernières semaines je participe à un bon nombre de jury et il y a quelque chose que je ne comprends pas, y compris chez mes pairs évaluateurs.
Lorsqu'on aborde la question de l'évaluation, je ne comprends pas si l'on parle de:
1️⃣ La progression de l'apprenant
2️⃣ Notre capacité à transmettre
3️⃣ Notre projet
Une chose est sûre : le questionnaire de satisfaction qui évalue les chaises et le café n'évalue ni la progression ni notre transmission...
#OnPartDeLoin

Podcast Projets libres !projetslibres_podcast@piaille.fr
2025-04-25

@Framasoft de retour dans Projets Libres ! 📣 📣

Comment choisissent-ils les logiciels qu'ils hébergent ? On explore leurs critères : scalabilité, modération, modèle économique, collaboration avec les communautés...
@tcit et @pyg partagent leur expérience et leurs projets 2025 (alternatives à Notion, Canva...).
Un épisode riche pour les passionnés du libre !

👉 projets-libres.org/framasoft-d

Bonne écoute 🎧 🎧
#logiciellibre #logicielslibres #opensource #Framasoft #evaluation

[Evaluer le libre] Dégooglisons l’évaluation : comment Framasoft choisit ses outils libres ?
2025-04-19

If it is agreed that Mahomes needs a good, pass-catching running back for the offense, who are some names that pop off the page when it comes to evaluating the draft? Who are the backs the Chiefs could acquire, and what round would they make the pick? #Mahomes #PassCatchingRB #ChiefsOffense #NFLDraft #Evaluation #DraftProspects #RunningBacks

2025-04-17

Interesting (short) paper of game-based training and evaluation of agentic behaviour in LLMs: Leon Guertler, Bobby Cheng, Simon Yu, Bo Liu, Leshem Choshen, Cheston Tan.: "Textarena"

arxiv.org/html/2504.11442v1

#llms #AI #generativeai #agents #agenticAI #evaluation

TextArena Soft-skill comparison. Frontier models and Humanity are compared across ten key skills. Each skill is normalised separately for presentation. 

The image shows a radar chart comparing the capabilities of different AI models in various areas.
The image is an octagon radar chart that compares the performance of four different AI models (Humanity, claude-3.5-sonnet, qwen-plus, and gpt-40) in eight different categories: logical reasoning, memory recall, bluff detection, theory of mind, pattern recognition, spatial reasoning, strategic planning, and adaptability. Each category is represented as an axis, and the performance of each model is represented by a point on the axis, which is connected by a line to the points in adjacent categories. The axes are labeled with the categories. The models are represented by different colors (orange, purple, turquoise, and dark red), with the legend at the bottom assigning each model to the corresponding color. The areas between the lines create a polygon whose shape and size visualize the respective performance of the model in the individual areas. The overall atmosphere of the image is factual and informative, with a clear and easy-to-understand presentation of the data. The color scheme is neutral and contributes to the clarity of the image.

Client Info

Server: https://mastodon.social
Version: 2025.04
Repository: https://github.com/cyevgeniy/lmst