Предсказываем тренды. С Rattle и R в мир моделей классификации - страница 38

11.6. Инструменты R для выбора предикторов

11.6.1. Пакет Boruta

Представим реализацию алгоритма для вычисления всех релевантных предикторов пакетом Boruta. Алгоритм использует подход обертки, созданный вокруг классификатора случайного леса. Алгоритм – расширение идеи для определения релевантности методом сравнения релевантности реальных предикторов к их случайным пробам.

Устанавливаются пороги, ниже которых предикторы отбрасываются. В результате по каждому предиктору получаем фактор со значениями Confirmed, Rejected или Tentative. Отвергнутые предикторы помечаются.

Устанавливаются параметры типа классификации. По умолчанию – случайный лес из пакета randomForest. В результате выдается индекс Gini.

11.6.2. Пакет varSelRF

Пакет для выбора предикторов в случайном лесе для объекта randomforest.

Выбор предикторов случайных лесов, используя как обратное удаление предикторов (для выбора небольших множеств безызбыточных переменных) и выбора, основанного на спектре значимости (что-то похожее на рисунки каменистой осыпи для выбора больших, потенциально чрезвычайно коррелированных предикторов). Основное применение для данных большой размерности (например, применение для данных геномики и протеомики).

11.6.3. Пакет FSelector

Методы для выбора предиктора могут быть разделены на два подхода: ранжирование предикторов и выбор подмножества. В первом подходе предикторы упорядочены по некоторым критериями, а затем выбираются предикторы выше определенного порога. Во втором подходе ищется промежуток между подмножествами предикторов для оптимального подмножества. Кроме того второй подход может быть разделен на три части:

– подход фильтра: сначала выбираются предикторы, а затем используется их подмножество для выполнения алгоритма классификации.

– встроенные подходы к выбору предикторов выполняются при выполнении алгоритма классификации.

– подход с оберткой алгоритма для классификации применяется к набору данных для идентификации лучших предикторов.

Пакет FSelector предлагает алгоритмы для фильтрации предикторов, алгоритмы с оберткой классификаторов, и алгоритм поиска разделения предикторов на подмножества (например, поиск по первому наилучшему совпадению, обратный поиск, поиск вперед, поиск восхождения на вершину). Пакет также позволяет выбрать подмножества предикторов с учетом их весов, выполняя различные способы отсечения.

11.6.4. Пакет «CORElearn»

Пакет «CORElearn» имеет большое число критериев упорядочения предикторов по их важности. Особое место занимают критерии, которые основаны на Relief, что позволяет оценивать предикторы, имеющие корреляцию между собой. Учет этой корреляции позволяет строить модели случайного леса, дающие устойчивые характеристики вне выборки.

11.7. Функции R

Приведем некоторые функции, которые могут быть использованы при работе над данным разделом.

Приведено название функции, а в скобках название пакета, в котором функция расположена. Для использования функция необходима загрузка пакета, а если его еще нет, то и установка.

Если названия пакета не приведено – это означает, что функция имеется в базовом пакете и не требуется предварительная загрузка пакета.

Для реализации идей данного раздела могут быть использованы следующие пакеты: caret,klaR, leaps, MASS, pROC, rms и stats.

11.7.1. Выбор вперед, назад и пошаговый

Есть несколько функций R для этого класса:

– может использоваться

Назад Вперед

Похожие книги

Предсказываем тренды. С Rattle и R в мир моделей классификации

Александр Фоменко

Просто о бизнесе

Книга является практическим руководством по обучению моделей предсказаниям трендов на рынке Форекс. Берем исторические значения исходных данных – котировок, индикаторов, макроэкономических данных, и на них учим модель предсказывать «лонги-шорты».Данная книга является практическим применением пакета Rattle к рынку Форекс и терминалу МТ4 c комментариями идеологии моделей классификации и их оценки.Книга доступна новичкам, а также полезна опытным тре

Читать онлайн

Управление запасами

Андрей Батуров

Просто о бизнесе

Управление запасами является кульминацией всех действий, направленных на управление запасами. Используя правильные стратегии управления запасами, вы гарантируете, что у вас всегда есть нужный объем запасов, сводя при этом к минимуму риск возникновения узких мест и чрезмерных затрат. Всем компаниям, имеющим физические запасы, требуется стратегия управления запасами.В книге подробнее рассматривается, что означает управление запасами и как вы можете

Читать онлайн

Прочность вашего бизнеса

Игорь Клипиницер

Просто о бизнесе

Игорь Клипиницер – бизнес-консультант с 25-летним опытом работы с компаниями малого и среднего бизнеса, а в прошлом – топ-менеджер КамАЗа, ответственный за организационное развитие компании. Книга рассказывает о трех простых шагах, которые необходимо сделать владельцу бизнеса для того, чтобы компания стала прочной, то есть устойчивой к внешним воздействиям.

Читать онлайн

100 уроков менеджмента. Методическое пособие для управленческой элиты

Олег Кулагин

Просто о бизнесе

В книге рассмотрены общие основы управления и представлена пошаговая технология формирования и развития системы управления предприятием в виде «пирамиды регулярного менеджмента», состоящей из десяти блоков. В каждом из них кратко рассмотрены основные управленческие инструменты и методики, отражающие симпатии и убеждения автора на основе личного опыта управленческого консультирования и доступных разработок ведущих российских и зарубежных специалис

Читать онлайн

Камасутра для репетитора. 173 способа найти ученика

Теодор Донцу

Просто о бизнесе

Данная книга создана для помощи как школьным учителям, студентам старших курсов педагогических ВУЗов, молодым учителям, так и центрам дополнительного образования или онлайн школам. В ней описаны практические инструменты, сайты, агрегаторы и нечестные способы привлечения клиентов на репетиторство. Минимум теории и куча практики. Книга поделена на блоки: инструменты для всех; инструменты для опытных преподавателей; сайты и агрегаторы. Здесь вы найд

Читать онлайн

Нил Сорский

Елена Романенко

Биографии и мемуары

Рассказать о жизни святого – сложная задача. Его жизнь не так событийна, как жизнь государя или полководца. Его внутренний мир – это вообще тайна «за семью печатями». Однако повествуя о жизни преподобного Нила Сорского, видного церковного деятеля Средневековой Руси, автор находит свой ключ к «заветной двери». Этим ключом послужили тексты 24 житий древних святых, которые Нил Сорский отобрал в свои сборники. Они сохранились в автографах преподобног

Читать онлайн

Брачная афера

Энн Херрис

Зарубежные любовные романы

На этот раз виконт Люк Кларендон совершенно вывел из себя своего деда графа Хартингтона. Молодой человек соблазнил замужнюю даму, красавицу Адриану. Напрасно Люк отрицал свою вину, разгневанный граф заявил, что лишит внука наследства, если он в ближайшее время не женится на девушке из приличной семьи. Жениться Люк не собирался, еще ни одна женщина не взволновала его настолько, чтобы он захотел повести ее к алтарю. В чрезвычайных обстоятельствах о

Читать онлайн