#SKLearn

2026-01-30

🚀 Cập nhật sklearn‑diagnose: thư viện Python “máy MRI” cho mô hình ML giờ đã có chatbot tương tác! Bạn có thể trò chuyện với LLM để hỏi “Tại sao mô hình overfit?” hoặc nhận code mẫu, nhớ ngữ cảnh và khám phá sâu hơn. Giao diện React chạy locally trong trình duyệt. Đừng quên star repo! #MachineLearning #ML #AI #Python #sklearn #CôngNghệ #TríTuệNhânTạo #MLdiagnose

reddit.com/r/LocalLLaMA/commen

2026-01-25

Компрессор для данных или как я написал свой первый custom transformer

Эта статья будет полезна DS специалистам, и тем, кто хоть когда-нибудь сталкивался с такой проблемой, как выбросы в данных или OOD (out of distribution), и ищет пути решения проблем, возникающих из-за них.

habr.com/ru/articles/988736/

#выбросы #анализ_данных #data_science #preprocessing #compression #outliner #custom_transformer #transformer #sklearn

2025-12-09

От «обезьяньей» работы к Smart-анализу: как выполнить предобработку данных для моделей

От «обезьяньей» работы к Smart-анализу: как правильно готовить данные для моделей. Что такое Exploratory Data Analysis и как избежать основных ошибок при его выполнении.

habr.com/ru/articles/975082/

#pandas #sklearn #data_science #exploratory_data_analysis #machine_learning #numpy #statistics #feature_engineering

2025-10-29

Clasificación SVM de 2 clases

Máquinas de Vectores de Soporte con kernel lineal

Se muestra:
- Puntos de entrenamiento
- Puntos de prueba
- vector de soporte
- Hiperplano
- Margen

#python #ML #sklearn

2025-10-28

Clasificación de solo dos características de iris:
- longitud y ancho del sépalo
- Algoritmo de k vecinos

#python #sklearn curso ML Aprendiaje Automatico #Anzoategui #Lecheria

2025-07-27

Agrupación de estados meteorológicos:
- Agrupamiento Kmeans 3 grupos
- Se puede separar Heavy Rain de los otros 2 grupos

#python Aprendizaje Automatico #ML Guanacaste Software Abierto Libre #sklearn Compressed Sparse Row Matrix Lecheria #anzoategui

2025-07-22

Crear una matriz de confusión a partir de los resultados del experimento
Evaluar los resultados del modelo

#Python #sklearn confusion software soberania Guanacaste #Flisol

2025-05-21

Scikit-learn теперь умеет в пайплайны: что изменилось и как работать с библиотекой в 2025 году

Scikit-learn — это одна из основных Python-библиотек для машинного обучения. Её подключают в прикладных проектах, AutoML-системах и учебных курсах — как базовый инструмент для работы с моделями. Даже если вы давно пишете на PyTorch или CatBoost, в задачах с табличными данными, скорее всего, всё ещё вызываете fit , predict , score — через sklearn. В 2025 году в библиотеку добавили несколько важных обновлений: доработали работу с пайплайнами, подключили полную поддержку pandas API, упростили контроль за экспериментами. Мы подготовили гайд, как работать со scikit-learn в 2025 году. Новичкам он поможет собрать первую ML-задачу — с данными, моделью и метриками. А тем, кто уже использует библиотеку, — освежить знания и понять, что изменилось в новых версиях. Почитать гайд →

habr.com/ru/companies/netology

#scikitlearn #sklearn #пайплайн #python #pandas #машинное_обучение #machine_learning #ml #классификация #регрессия

Scikit Flow #skflow has been moved to @TensorFlo https://goo.gl/WvpO79 and will be maintained there! #deeperlearning #datascience #sklearn

Eric Maugendre about datamaugendre@hachyderm.io
2024-10-25
Eric Maugendre about datamaugendre@hachyderm.io
2024-10-24

@datadon

#Lasso #LinearRegression "is useful in some contexts due to its tendency to prefer solutions with fewer non-zero coefficients, effectively reducing the number of features upon which the given solution is dependent"

scikit-learn.org/stable/module 🧵

#dataDev #AIDev #ML #sklearn #python #interpretability

2024-10-18

I'm playing with the California Housing dataset built into sklearn.

One census block group has an average number of bedrooms per household of 0.83 and an average number of household members of 1243.

Huh?

#DataScience #python #sklearn

2024-10-15

I just did my first project using the #mlflow library to track metrics on iterations of manual tuning of an #sklearn pipeline, it works great and gives me some idea of the search space before moving into automated hyperparameter tuning.

I am using it in a super basic way, as an alternative to creating a gazillion cells with comments tracking metrics, does anyone have any favorite features to check out for taking mlflow to the next level?
#machinelearning #python #MLOps #scikitlearn

2024-10-12

[Перевод] Линейная регрессия и её регуляризация в Scikit-learn

Создание модели линейной регрессии относится к задачам обучения с учителем, цель которых — предсказать значение непрерывной зависимой переменной (y) на основе набора признаков (X). Одним из ключевых допущений любой модели линейной регрессии является предположение, что зависимая переменная (y) в некоторой степени линейно зависит от независимых переменных (Xi). Это означает, что мы можем оценить значение y, используя математическое выражение:

habr.com/ru/articles/850168/

#python #машинное_обучение #линейная_регрессия #для_начинающих #руководство #туториал #machine_learning #data_science #регуляризация #sklearn

Christian Feldmanncfeldmann@fediscience.org
2024-09-26

Our molpipeline paper is out: pubs.acs.org/doi/10.1021/acs.j

The presented code (github.com/basf/MolPipeline) integrates #RDKit functionality in #sklearn like objects, allowing to chain multiple steps in a single pipeline. Pipelines can even include ML models, allowing to obtain predictions directly from SMILES strings.

➴➴➴Æ🜔Ɲ.Ƈꭚ⍴𝔥єɼ👩🏻‍💻AeonCypher@lgbtqia.space
2024-09-09

I genuinely miss PyMC2. The #PyMC and #Arviz APIs changes so frequently, that it's impossible to know what the standard approach to anything is.

#Bayesian #Statistics in #Python should be easy.

To be honest, I'd really like a well maintained #SkLearn module for it.

Joxean Koret (@matalaz)joxean
2024-08-31

Uhm... if I get a decision tree like the one shown in the picture, does it mean that I only need the columns shown in the tree for training and validation, right? I would only need the columns 2 and 3 (x[2], x[3]), isn't it? Or am I missing something else?

2024-08-29

While tackling a Kaggle competition for mushroom classification (to eat or not to eat? 🍄 ), I implemented Classifier Stacking. My blog post explores how combining various models and a meta-learner led to better results, with some trade-offs in computation time.

Combining diverse models can enhance overall performance, at the cost of calculation time.

briaslab.fr/blog/?action=view&

#MachineLearning #Stacking #Kaggle #sklearn

IB Teguh TMteguhteja
2024-08-26


Dive into predictive modeling with our comprehensive guide on linear regression using Python and sklearn. Learn step-by-step implementation, result interpretation, and data visualization techniques. Perfect for beginners

teguhteja.id/mastering-linear-

Client Info

Server: https://mastodon.social
Version: 2025.07
Repository: https://github.com/cyevgeniy/lmst