Предсказываем тренды. С Rattle и R в мир моделей классификации - страница 32

Для реализации идей данного раздела могут быть использованы следующие пакеты: caret, C50, DMwR, kernlab, pROC и rpart.

createDataPartition (caret)

стратифицированная случайная выборка;

coords (pROC)

оптимизирует чувствительность и специфичность на кривой ROC;

downSample (caret)

upSample (caret)

выравнивает классы;

ksvm (kernlab)

с параметром class. weights подгоняет модель SVM в режиме взвешивания.

10. Значимость предикторов для целевой переменной

Под значимостью предикторов понимается степень влияния предиктора на целевую переменную как самостоятельно, так в совокупности с другими предикторами.

Функции оценки значимости предикторов могут быть разделены на две группы: те, которые используют информацию о модели и те, которые не используют информацию о модели. Преимущество подхода, основанного на модели, состоит в том, что в этом случае подход связан с результативностью модели и что он, скорее всего, включает структуру корреляции между предикторами при вычислении значимости. Независимо от того, как вычислена значимость для большинства моделей классификации у каждого предиктора будет отдельная значимость предиктора для каждого класса (исключения – деревья классификации, бутстрэп агрегированные деревья и усиленные деревья).

10.1. Метрики значимости, полученной из моделей

Величина значимости предикторов, полученная из сведений, входящих в результат подгонки моделей, ценна тем, что значимость предикторов тесно связана с другими параметрами модели. При оценке модели в целом мы всегда получаем оценку значимости предикторов, а произведя манипуляции с предикторами (объединение, удаление) всегда можно сравнить полученный результат по результативности модели в целом.

В рамках R доступны следующие методы для оценки вклада каждого предиктора в модель:

– линейные модели: используется абсолютное значение t-статистики для каждого параметра модели;

– случайный лес: при подгонке модели вычисляется четыре меры значимости для каждого предиктора модели. В Rattle печатаются вычисленные значения значимостей, а также может быть построен график для визуального обзора;

– частные наименьшие квадраты (PLS): более полезный для нас аналог главных компонент (РСА). В PLS мера значимости предикторов основана на взвешенных суммах абсолютных коэффициентов регрессии. Веса являются функцией приведения сумм квадратов по числу компонентов PLS и вычисляются отдельно для каждого результата. Поэтому, вклад коэффициентов взвешивается пропорционально;

– рекурсивное разделение (пакет rpart): приведение функции потерь (например, среднеквадратической ошибки), приписанной к каждому предиктору в каждом разделении, сводится в таблицу. Кроме того, предикторы-кандидаты, которые также были важны, но не использовались в разделении, также сводятся в таблицу в каждом разделении. Эти сведения можно получить в функции rpart.control. Этот метод в настоящий момент не предоставляет достоверный результат при категориальной целевой переменной;

– бутстрэп агрегированные деревья (Bagged trees): для улучшенных деревьев применена методология, аналогичная отдельному дереву. Возвращается итоговая значимость предикторов;

– усиленные деревья (Boosted trees): этот метод использует подход, аналогичный отдельному дереву, но суммирует значимость предикторов при каждой усиливающей итерации. Подробности в пакете gbm;

– многомерные регрессии адаптивных сплайнов

Назад Вперед

Похожие книги

Предсказываем тренды. С Rattle и R в мир моделей классификации

Александр Фоменко

Просто о бизнесе

Книга является практическим руководством по обучению моделей предсказаниям трендов на рынке Форекс. Берем исторические значения исходных данных – котировок, индикаторов, макроэкономических данных, и на них учим модель предсказывать «лонги-шорты».Данная книга является практическим применением пакета Rattle к рынку Форекс и терминалу МТ4 c комментариями идеологии моделей классификации и их оценки.Книга доступна новичкам, а также полезна опытным тре

Читать онлайн

Управление запасами

Андрей Батуров

Просто о бизнесе

Управление запасами является кульминацией всех действий, направленных на управление запасами. Используя правильные стратегии управления запасами, вы гарантируете, что у вас всегда есть нужный объем запасов, сводя при этом к минимуму риск возникновения узких мест и чрезмерных затрат. Всем компаниям, имеющим физические запасы, требуется стратегия управления запасами.В книге подробнее рассматривается, что означает управление запасами и как вы можете

Читать онлайн

Прочность вашего бизнеса

Игорь Клипиницер

Просто о бизнесе

Игорь Клипиницер – бизнес-консультант с 25-летним опытом работы с компаниями малого и среднего бизнеса, а в прошлом – топ-менеджер КамАЗа, ответственный за организационное развитие компании. Книга рассказывает о трех простых шагах, которые необходимо сделать владельцу бизнеса для того, чтобы компания стала прочной, то есть устойчивой к внешним воздействиям.

Читать онлайн

100 уроков менеджмента. Методическое пособие для управленческой элиты

Олег Кулагин

Просто о бизнесе

В книге рассмотрены общие основы управления и представлена пошаговая технология формирования и развития системы управления предприятием в виде «пирамиды регулярного менеджмента», состоящей из десяти блоков. В каждом из них кратко рассмотрены основные управленческие инструменты и методики, отражающие симпатии и убеждения автора на основе личного опыта управленческого консультирования и доступных разработок ведущих российских и зарубежных специалис

Читать онлайн

Камасутра для репетитора. 173 способа найти ученика

Теодор Донцу

Просто о бизнесе

Данная книга создана для помощи как школьным учителям, студентам старших курсов педагогических ВУЗов, молодым учителям, так и центрам дополнительного образования или онлайн школам. В ней описаны практические инструменты, сайты, агрегаторы и нечестные способы привлечения клиентов на репетиторство. Минимум теории и куча практики. Книга поделена на блоки: инструменты для всех; инструменты для опытных преподавателей; сайты и агрегаторы. Здесь вы найд

Читать онлайн

Нил Сорский

Елена Романенко

Биографии и мемуары

Рассказать о жизни святого – сложная задача. Его жизнь не так событийна, как жизнь государя или полководца. Его внутренний мир – это вообще тайна «за семью печатями». Однако повествуя о жизни преподобного Нила Сорского, видного церковного деятеля Средневековой Руси, автор находит свой ключ к «заветной двери». Этим ключом послужили тексты 24 житий древних святых, которые Нил Сорский отобрал в свои сборники. Они сохранились в автографах преподобног

Читать онлайн

Малина Смородина

Вера Колочкова

Современные любовные романы

Марина Смородина на свое одиночество не сетовала, она старалась с ним «дружить», приноровиться к безмужней жизни, украсить ее житейской мудростью и юмором. В маршрутке Марина выручила безбилетного пассажира, попавшего в затруднительную ситуацию… Преуспевающий владелец бизнеса, Павел Сергеевич оказался в непривычной ситуации из-за украденной машины и увидел в спасительнице не просто добрую, отзывчивую душу. Марина охотно приняла ухаживания интерес

Читать онлайн