#CatBoost

Kevin Brown-Silvakevin@brown-silva.social
2025-05-16

Looking for open spaces at #PyConUS? Here are the ones starting at 3:00 PM:

Room 308: Data Engineering Meetup
Room 309: #Python for Science & Research
Room 316: @gnuradio / Ham Radio
Room 318: Tabular ML (@sklearn, #XGBoost, #CatBoost, & friends)
Room 320: Pythonic Music: MIDI, Synthesis and more

us.pycon.org/2025/schedule/ope

#PyConUS2025 #PyConUSOpenSpaces

2025-03-26

Как спрогнозировать вес птицы с помощью XGBoost: от предобработки данных до оптимизации модели

Привет, Хабр! Вот когда каждый грамм действительно имеет значение: если вам нужно спрогнозировать вес птицы перед продажей, чтобы экономить на кормах и оптимизировать производство. Меня зовут Михаил Чирков, я data scientist в R-Style Softlab и сегодня хочу поделиться с вами кейсом прогнозирования с помощью XGBoost, этот проект мы делали в рамках внедрения BI-системы для птицефабрики.

habr.com/ru/companies/rshb/art

#XGBoost #CatBoost #Градиентный_бустинг #машинное_обучение

Valeriy M., PhD, MBA, CQFpredict_addict@sigmoid.social
2025-03-23

When it comes to #tabulardata #catboost rules supreme, in probabilistic forecasting competition most of top winning submissiones used CatBoost.

Valeriy M., PhD, MBA, CQFpredict_addict@sigmoid.social
2025-03-22

In fact, a recent paper once again confirms CatBoost's dominance with tabular data, while XGBoost came in at just … number 10.

“AComprehensive Benchmark of Machine and Deep Learning Across Diverse Tabular Datasets”

#tabulardata #catboost

Valeriy M., PhD, MBA, CQFpredict_addict@sigmoid.social
2025-03-02
Valeriy M., PhD, MBA, CQFpredict_addict@sigmoid.social
2025-03-02

How does it compare to XGBoost and LightGBM in your work? Drop a comment below!

#MachineLearning #DataScience #GradientBoosting #CatBoost #AI #XGBoost #LightGBM

---

Would you like me to tweak the post for a specific audience or style?

Valeriy M., PhD, MBA, CQFpredict_addict@sigmoid.social
2025-02-22

When it comes to tabular data CatBoost rules the roost.

#catboost

Valeriy M., PhD, MBA, CQFpredict_addict@sigmoid.social
2025-02-19

* CatBoost achieves the best average rank in most classification and regression tasks, which is consistent with previous studies.

* Among all deep tabular methods, TabR works the best in most cases. However, it has a high training cost

#catboost
#tabulardata
#deeplearning

Valeriy M., PhD, MBA, CQFpredict_addict@sigmoid.social
2025-02-17

Compare to XGBoost that can’t even handle categorical variables properly in 2024.

#catboost

Valeriy M., PhD, MBA, CQFpredict_addict@sigmoid.social
2025-01-11

🚀 While some data scientists still cling to Kaggle folklore fairytales professionals are guided by solid research.

Extensive studies demonstrated that **CatBoost is the unrivaled leader in handling tabular data.

My repository, has reached **200 stars**!

#DataScience #CatBoost #AI #TabularData

2024-10-23

Исследование опенсорс-инструментов в области ML/Data от ИТМО: выводы и инсайты

Новые инструменты в области ML/Data меняют правила в опенсорсе ― позволяют создавать решения быстрее и дешевле и это трансформирует существующие практики. Мы в центре «Сильный ИИ в промышленности» ИТМО задались вопросом: куда мы уже пришли и как эта отрасль изменится в ближайшие годы. А чтобы на него ответить, провели масштабное аналитическое исследование open source ― посмотрели как разработки крупных компаний, так и университетов, поговорили с экспертами рынка и проанализировали выложенный на GitHub код. На Хабре уже выходила новость с перечнем основных игроков и некоторыми результатами. В этой статье ― более подробные выводы и инсайты от экспертов ― как тех, что уже участвовали в исходном исследовании, так и тех, кто решил прокомментировать результаты уже после публикации.

habr.com/ru/companies/spbifmo/

#open_source #github #catboost #университет_итмо #искусственный_интеллект #data_science #machine_learning #исследования_и_прогнозы_в_it #машинное_обучение

2024-10-08

Учимся на чужих ошибках: как прокачать SIEM с помощью machine learning

Привет, Хабр! В этой статье мы хотим поговорить о применении технологий машинного обучения (machine learning, ML) в SIEM-системах. Разберемся, с какими проблемами и ограничениями сталкиваются операторы, расскажем о нашем модуле BAD и о том, как реализованные в нем модели ML помогают вычислять хакеров. А еще заглянем в будущее и посмотрим, как машинное обучение может применяться в SIEM завтра. Все это ждет вас под катом! Под кат →

habr.com/ru/companies/pt/artic

#cybersecurity #siem #ml #machine_learning #behavioral_anomaly_detection #машинное_обучение #catboost #gbm #profiler #кибератаки

2024-09-15

🚀 Day 4 of my **30 Kaggle Challenges in 30 Days** is complete! 🎉

Today, I tackled a regression problem using the Abalone dataset, focusing on hyperparameter tuning with **CatBoost**.
You can check out the blog post where I dive into the process: (surajwate.com/blog/regression-)

#Kaggle #MachineLearning #DataScience #Regression #CatBoost #AbaloneDataset

2024-07-24

Как наш ученик попал на стажировку в VK. История Артёма Мазура

Мы следим за жизнью всех ребят, которые приходят в ЦПМ и участвуют в наших проектах. Каждый раз, когда мы узнаем об их достижениях, нам очень трепетно и радостно! Сегодня мы хотим поделиться историей Артёма Мазура, который прошел на стажировку, внимание, в VK!

habr.com/ru/articles/831252/

#vk #вконтакте #стажировка #машинное_обучение #ml #python #go #catboost

2024-07-24

Выпускные проекты участников senior-буткемпа «кодИИм» (июль 2024 г.)

Мы долго собирались и наконец-то дошли до хабра. Можете нас поздравить! Мы – «кодИИм» – проект от команды Центра педагогического мастерства (ЦПМ) и МФТИ. Наша команда организует буткемпы по искусственному интеллекту для подростков. Мы учим ребят создавать собственные проекты с использованием нейронных сетей, обучаем программированию, математике и анализу данных в процессе работы с ИИ. А еще мы выстраиваем коммьюнити подростков (и иногда даже взрослых). Вся обновленная информация про проекты и не только есть в нашем телеграм-канале «песочница кодИИм» ! В течение года наша команда организует несколько буткемпов, рассчитанных на разные уровни знаний. Наши буткемпы – это выездные смены, на которых ребята живут и учатся вместе. За неделю участники осваивают фундаментальные темы по искусственному интеллекту на семинарах и лекциях, а в конце реализуют свой собственный проект под руководством преподавателей и менторов, применяя полученные знания на практике. Кроме учебы, вечером участники занимаются спортом, играют в настольные игры, что помогает отдохнуть и настроиться на следующий день.

habr.com/ru/articles/831002/

#искусственный_интеллект #программирование #подростки #буткемп #python #catboost #github

2024-06-17

NLP, Catboost и тематическое моделирование: создаем модель для прогнозирования цен с использованием новостей

Привет, Хабр! Меня зовут Иван, я Data Science специалист SimbirSoft. Я расскажу, как на одном из проектов мы занимались прогнозированием на месяц вперед с помощью методов NLP, Catboost и тематического моделирования на новостном потоке. Один из способов достижения экономического превосходства над конкурентами — это получение инструмента, оценивающего ситуацию на рынке сейчас и позволяющего делать точные достоверные прогнозы на будущее. И с помощью искусственного интеллекта, анализа данных, работы с временными рядами можно создать достаточно точный инструмент прогнозирования цен. К нам обратился заказчик, который занимается продажами удобрений. Ему необходимо было протестировать различные подходы к прогнозированию цен на удобрения. Нашей задачей стало построить бейзлайн-модель и оценить, насколько перспективен подход с использованием новостей. Заказчик хотел, чтобы мы оценили предсказательную силу именно новостей, поэтому мы не использовали признаки из самого временного ряда цен (лаги/сезонность/тренд) и признаки, связанные с рынком.

habr.com/ru/companies/simbirso

#nlp #catboost #тематическое_моделирование #прогнозирование_цен #машинное_обучение #data_science

2024-03-26

Классификация экзопланет (часть II построение моделей)

Это вторая и заключительная часть статьи, в которой мы рассматриваем задачу классификации экзопланет. Если предыдущая статья была больше про предобработку данных, то здесь мы будем строить модели, отбирать лучшие и экспериментировать.

habr.com/ru/articles/803117/

#машинное_обучение #градиентный_бустинг #нейронные_сети #random_forest #catboost #xgboost #tensorflow #Классификация_Экзопланет

2024-03-14

Градиентный бустинг. Реализация с нуля на Python и разбор особенностей его модификаций (XGBoost, CatBoost, LightGBM)

На сегодняшний день градиентный бустинг (gradient boosting machine) является одним из основных production-решений при работе с табличными, неоднородными данными, поскольку обладает высокой производительностью и точностью, а если быть точнее, то его модификации, речь о которых пойдёт чуть позже. В данной статье представлена не только реализация градиентного бустинга GBM с нуля на Python, но а также довольно подробно описаны ключевые особенности его наиболее популярных модификаций.

habr.com/ru/articles/799725/

#градиентный_бустинг #gradient_boosting #xgboost #catboost #lightgbm #алгоритмы_машинного_обучения #data_science #машинное_обучение #реализация_с_нуля #python

Client Info

Server: https://mastodon.social
Version: 2025.04
Repository: https://github.com/cyevgeniy/lmst