«Яндекс» выложил в открытый доступ новую библиотеку машинного обучения

Возврат к списку

18.07.2017     
Новый метод машинного обучения CatBoost, позволяет обучать модели на разнородных данных, таких как местонахождение пользователя, тип устройства, история операций и т.д.

Библиотека машинного обучения выложена в открытый доступ и ее могут использовать все желающие.

CatBoost является усовершенствованной версией метода Матрикcнет, задействованного почти во всех сервисах «Яндекса». Также как и Матрикснет, в CatBoost используется механизм градиентного бустинга, который хорошо подходит для работы с разнородными данными. Однако в отличие от метода-предшественника, CatBoost учитывает не только числовые данные -  например, виды облаков или типы зданий. Если раньше такие данные приходилось переводить в цифровой формат, что могло изменить их суть и повлиять на точность работы модели, то теперь они могут использоваться в первоначальном виде. Благодаря этому новый метод дает более высокое качество обучения, чем аналогичные методы для работы с разнородными данными. При этом CatBoost можно применять в самых разных областях – от банковской сферы до промышленности, сообщается в пресс-релизе компании. 

Чтобы начать работу с библиотекой, достаточно установить ее на свой компьютер. Она поддерживает операционные системы Linux, Windows и macOS, доступна на языках программирования Python и R.

Также «Яндекс» разработал программу визуализации CatBoost Viewer, которая позволяет отслеживать процесс обучения на графиках. Скачать CatBoost и CatBoost Viewer можно на GitHub.


Источник: https://infostart.ru/journal/news/tekhnologii/yandeks-vylozhil-v-otkrytyy-dostup-novuyu-biblioteku-mashinnogo-obucheniya_650703/

Комментарии
1. Олег Молочников (milkers) 1679 18.07.17 16:42 Сейчас в теме
Где бы найти побольше информации по CatBoost, желательно с примерами сборки и обучения
2. Антон Степанов (Stepa86) 883 18.07.17 17:15 Сейчас в теме
(1) Пока нигде похоже, судя по хабру
3. Роман Мусий (ph_1984) 17 18.07.17 17:44 Сейчас в теме
4. Сергей Крайнов (ccserg) 48 19.07.17 09:37 Сейчас в теме
ничего не понял , что сие за штука
5. Вася Пупкин (bubus) 19.07.17 11:12 Сейчас в теме
в CatBoost используется механизм градиентного бустинга - спасибо! Теперь все стало понятно.
Оставьте свое сообщение