Введение в машинное обучение - страница 5

то есть известны метки объектов ob_>1, ob_>2,…, ob_>m. Требуется построить алгоритм A («обучить»), который по объекту ob определяет значение y(ob) или «достаточно близкое» значение, если допускается неточное решение.

Другими словами, зная значения целевой функции на обучающей выборке, требуется найти удовлетворительное приближение к ней в виде А.

При конечном множестве Y = {1, 2,…, l} задачу называют задачей классификации (на l непересекающихся классов). В этом случае можно считать, что множество X разбито на классы C_>1,…, C_>l, где Ci = {ob Ob | y(ob) = i} при i{1, 2,…, l}:

Ob = ⋃^>1_>i=1C_>i.

При Y = {(α1,…,αl ) |α1,…,αl {0,1 говорят о задаче классификации на l пересекающихся классов. Здесь i-й класс – Ci = {ob Ob | y(ob) = (α1,…,αl), αi = 1}.

Для решения задачи, то есть поиска оптимального алгоритма A, вводится функция потерь или функция стоимости (cost function) J(A(ob), y(ob)), которая описывает, насколько «плох» ответ A(ob) по сравнению с верным ответом y(ob). В задаче классификации можно считать, что

а в задаче регрессии

J(A(ob), y(ob)) = | A(ob) – y(ob) |

или

J(A(ob), y(ob)) = (A(ob) – y(ob))2.

Возникает закономерный вопрос: что же такое объект? В задачах машинного обучения объект – это некоторое множество параметров (признаков). Если некоторую сущность можно описать конечным набором параметров, то она может рассматриваться как объект в машинном обучении, причем ее физическая природа не имеет значения. Параметры могут задаваться исследователем, исходя из его представлений о наилучшем описании объекта, так, как это делается в «классических» задачах машинного обучения, или, с другой стороны, формироваться путем выполнения некоторой процедуры так, как это делается в глубоком обучении.

Таким образом, каждый объект ob описывается конечным набором (входных) параметров или свойств (input values or features) x_>1,x_>2,….x_>n, одинаковым для каждого ob_>i∈ Ob , а y называется целевой переменной (целевым параметром) (target value) в задаче регрессии или классом в задаче классификации.

Алгоритм А может описываться конечным набором параметров θ_>i∈ θ или, как часто говорится при описании нейронных сетей, весов (weights) w_>i∈ W.

Задача обучения по примерам рассматривается как задача оптимизации, которую решают путем настройки множества параметров θ алгоритма А так, чтобы минимизировать значение функции стоимости J(θ) по всем примерам m.

В задаче регрессии алгоритм A часто называется функцией гипотезы, а функция стоимости определяется как сумма квадратов разности «предсказываемого» алгоритмом (функцией гипотезы) значения и реального значения у по множеству примеров m. При этом подбирается такая функция гипотезы h_>θ(x), которая при некотором наборе параметров θ_>i∈ θ обеспечивает минимальное значение J(θ).

где m – множество обучающих примеров или объектов; x^>(i) – значение параметров или свойств для i-го объекта; y^>(i) – фактическое значение объясняемой или целевой переменной для i-го примера; h_>θ– функция гипотезы, которая может быть линейной (h_>θ = θ_>0 + θ_>1x) или нелинейной (например, квадратичная функция гипотезы одной переменной – (h_>θ = θ_>0 + θ_>1x + θ_>2x^>2).

Например, если мы рассматриваем задачу прогнозирования стоимости автомобиля, исходя из года его производства, то год производства будет являться входной переменной или свойством (x), а стоимость – целевой переменной (y) (рисунок 2.1).

Рисунок 2.1. Зависимость стоимости автомобиля от года выпуска

Назад Вперед

Похожие книги

Введение в машинное обучение

Едилхан Амиргалиев

Учебник поможет студентам различных специальностей освоить современные технологии машинного обучения и практически использовать их в работе и научных проектах. В настоящем пособии даются весьма краткие теоретические и относительно подробные практические сведения о применении отдельных алгоритмов классификации и регрессии. Для практического освоения материала достаточно базовых навыков работы с языком Python. При этом освоение возможностей основны

Читать онлайн

Офсайд 2

Алекс Д

Эротика

«Я не люблю полутонов и недочувств. Я беру все или ничего. И если я люблю, то это, минимум цунами, максимум ядерный взрыв, который уничтожит всё в радиусе сотен тысяч километров. И когда я говорю этой голубоглазой девочке, что люблю ее, это не радостная новость. Это приговор. Нам обоим. Внимание! Сторого 18+, сцены эротического характера, сцены жесткости, содержит нецензурную брань. Вторая книга серии. Смотрим Буктрейлер

Читать онлайн

Ты – моя добыча! Книга 1

Татьяна Сергеева

Любовное фэнтези

Молодой демон пошёл против сложившихся традиций – бросил вызов старшему. И не смог убить уже обессиленную жертву, позволив уйти. Проявил сострадание. Такому не место в Нижнем мире. Наказание – волчья шкура и невозможность вернуться. Кому нужен волк с душой и разумом демона? Нелегка такая доля. Но, может, судьба смилостивится и предоставит ещё шанс на счастье? Ведь может демон влюбиться? А настоящая любовь и не такие чудеса совершает…

Читать онлайн