@phpmacher #RSS nutzen: Sicher. Immer noch populär. Ob als Eingangsformat für andere Medien oder direkte Nutzung durch Menschen.
Gibt diverse Systeme die lokal aggregieren und filtern, auch self-hostable. Teilweise über die eingebetteten #Metadaten, teilweise mit #Regex gegen andere Inhaltsfelder.
Der Schritt von da zu einer Art #Bayesfilter oder den NN wie sie #rspamd zur Klassifizierung nutzt oder sogar einem SLM/kleineren #LLM auf #Ollama, ggf. mit #TPU / #APU Support sollte überschaubar groß sein.
Eins der Probleme wird aber die zunehmend schlechte Feedqualität was Tags/Metadaten und der notorische (wenn gleich sehr verständliche) Hang zur Nicht-Auslieferung des Volltext im Feed sein. Da müsste man ggf auf Verdacht das Original fetchen, ggf. als zweite Stufe.
Und natürlich ist ein #Recommender-System was deutlich anderes als ein mehr oder minder ausgefeilter #Classifier. Aber lassen wir das...