Нейронные сети. Эволюция - страница 18

Вот теперь иллюстрируем:

Из графика видно, что для того чтобы обновить вес в большую сторону, до значения (w2), нужно к старому значению (w1) прибавить дельту (∆w), откуда: (w2 ==w1+∆w). Приравняв (∆w) к производной ошибки (величину которой уже знаем), мы спускаемся на эту величину в сторону уменьшения ошибки.

Так же замечаем, что (E2 – E1 = -∆E) и (w2 –w1 = ∆w), откуда делаем вывод:

∆w = -∆E/∆w

Ничего не напоминает? Это почти то же, что и дельта линейного классификатора (∆А = E/х), подтверждение того что наша эволюция прошла с поэтапным улучшением математического моделирования. Таким же образом, как и с обновлением коэффициента (А = А+∆А), линейного классификатора, обновляем весовые коэффициенты:

новыйwij= старый wij-(– ∆E/∆w)

Знак минус, для того чтобы обновить вес в большую сторону, для уменьшения ошибки. На примере графика – от w1 до w2.

В общем виде выражение записывается как:

новыйwij= старый wij– dE/dwij

Еще одно подтверждение, постепенного, на основе старого аппарата, хода эволюции, в сторону улучшения классификации искусственного нейрона.

Теперь, зайдем с другой стороны функции ошибки:

Снова замечаем, что (E2 – E1 = ∆E) и (w2 –w1 = ∆w), откуда делаем вывод:

∆w = ∆E/∆w

В этом случае, для обновления весового коэффициента, в сторону снижения функции ошибки, а значит до значения находящееся левее (w1), необходимо от значения (w1) вычесть дельту (∆w):

новыйwij= старый wij- ∆E/∆w

Получается, что независимо от того, какого знака производная ошибки от весового коэффициента по входу, вычитая из старого значения – значение этой производной, мы движемся в сторону уменьшения функции ошибки. Откуда можно сделать вывод, что последнее выражение, общее для всех возможных случаев обновления градиента.

Запишем еще раз, обновление весовых коэффициентов в общем виде:

новыйwij= старый wij– dE/dwij

Но мы забыли еще об одной важной особенности… Сглаживания! Без сглаживания величины дельты обновления, наши шаги будут слишком большие. Мы подобно кенгуру, будем прыгать на большие расстояния и можем перескочить минимум ошибки! Используем прошлый опыт, чтоб устранить этот недочёт.

Вспоминаем старое выражение при нахождении сглаженного значения дельты линейного классификатора: ∆А = L*(Е/х). Где (L) – скорость обучения, необходимая для того, чтобы мы делали спуск, постепенно, небольшими шашками.

Ну и наконец, давайте запишем окончательный вариант выражения при обновлении весовых коэффициентов:

новыйwij= старый wij– L*(dE/dwij)

Еще раз можем убедиться, в постепенном улучшении свойств, в ходе эволюции искусственного нейрона. Много из того что реализовывали ранее остается, лишь небольшая часть подверглась эволюционному улучшению.

Ложный минимум

Если еще раз взглянуть на трехмерную поверхность, можно увидеть, что метод градиентного спуска может привести в другую долину, которая расположена правее, где минимум значения будет меньше относительно той долины, куда попали мы сейчас, т.е. эта долина не является самой глубокой.

На следующей иллюстрации показано несколько вариантов градиентного спуска, один из которых приводит к ложному минимуму.

Поздравляю! Мы прошли самую основу в теории нейронных сетей – метод градиентного спуска. Освоив этот материал, в дальнейшем, изучение теории искусственных нейронных сетей, не будет представлять для вас значимого труда.

Как работает эволюционировавший нейрон

Назад Вперед

Похожие книги

Нейронные сети. Эволюция

Каниа Кан

Прочая образовательная литература

Эта книга предназначена для всех, кто хочет разобраться в том, как устроены нейронные сети. Для тех читателей, кто хочет сам научиться программировать нейронные сети, без использования специализированных библиотек машинного обучения. Книга предоставляет возможность с нуля разобраться в сути работы искусственных нейронов и нейронных сетей, математических идей, лежащих в их основе, где от вас не требуется никаких специальных знаний, не выходящих за

Читать онлайн

Курс на прибыль. От идеи до успешного бизнеса

Павел Столбов

Прочая образовательная литература

В этой книге хорошо сочетается теория и практика создания эффективного бизнеса, а также прилагаются готовые шаблоны и документы, уже неоднократно проверенные и доказавшие свою эффективность на реальных кейсах, которые можно сразу же использовать в работе.Книга будет полезна руководителям, предпринимателям, учредителям и инвесторам, желающим эффективно инвестировать, развивать бизнес и увеличивать прибыль.

Читать онлайн

Логоритмика для детей 2—3 лет. Конспекты занятий

Марина Кишиневская

Учебная литература

Методическое пособие «Логоритмика для детей 2 – 3 лет (конспекты занятий)» поможет педагогам и родителям при планировании занятий и развлечений с детьми раннего возраста.Для индивидуальных и групповых занятий.

Читать онлайн

Юридическая социология: научные статьи

Сергей Пацановский

Юриспруденция

Книга «Юридическая социология: научные статьи и исследования Пацановского С. В.» представляет собой сборник научных статей и исследований. В книге содержится ряд научных статей и исследований, представляющих актуальную информацию о современных проблемах и вызовах юридической социологии. Автор освещает такие темы, как социальные причины правонарушений, роль правосознания в формировании правовой системы, влияние социальных факторов на судебные реше

Читать онлайн

Сохранение жизни человечества

Александр НˊГор

Книги по философии

В книге содержится концентрированная выборка и обобщение информации по биологическим и социальным основам жизни человечества, определяющим его развитие или деградацию, жизнь или исчезновение как биологического вида и носителя социального разума. Все, что в ней изложено, было когда-то кем-то высказано, за исключением некоторых выводов и обобщений, и является в своей сути продуктом социального разума Руси.

Читать онлайн

Девочка из черного мрамора

Ася Плошкина

Детская проза

Тамаре всего четырнадцать, а ее уже успели выгнать из двух школ. Родители думают, что девочке нужен особый подход, и устраивают ее в частный пансион. Балтийское море, живописный парк, старинный немецкий особняк должны пробудить ее творческие способности.В первый же вечер в школе Тамара, шагнув не в ту дверь, спускается в глубокий сырой подвал и поворачивает старый ржавый замок. После этого в ней просыпается дар художницы. Но ее рисунки удивительн

Читать онлайн

IT-storii. Записки айтишника

Андрей Кузин

Техническая литература

Андрей Кузин – культовая фигура российского Интернета. Десять лет назад он, начав с нуля, создал популярнейший сайт 3DNews. А теперь он большую часть своего рабочего времени проводит в деловых поездках по США, Европе и Юго-Восточной Азии. Вы мечтали заглянуть на компьютерные фабрики Тайваня или Малайзии? Эта книга дает вам такой шанс!

Читать онлайн