Статистика: учебное пособие - страница 17
Существуют различные виды корреляции и регрессии. Так, относительно числа изучаемых признаков различают следующие виды корреляции и регрессии.
• Простая корреляция и регрессия, выражающая связь между двумя признаками. Например, между урожайностью и осадками, между производительностью труда и уровнем механизации, т. е. между результативным признаком Y и факторным признаком X. Такого рода связь можно выразить формулой: Y = f (x).
• Множественная корреляция и регрессия, характеризующая связь между результативным признаком и несколькими факторными признаками, например связь между себестоимостью продукции и факторами, влияющими на нее (производительностью труда, концентрацией и специализацией производства и т. д.). В общем виде такая связь выражается формулой: Y>1,2... n = f (x>1, x>2, …, x>n).
В зависимости от характера связи различают следующие виды корреляции и регрессии.
• Положительная корреляция и регрессия – если связь между изучаемыми явлениями прямая, т. е. с увеличением факторного признака растет и результативный (в среднем). Например, связь между производительностью труда с уровнем механизации.
• Отрицательная корреляция и регрессия – если с ростом значений факторного признака результативный признак в среднем уменьшается. Например, связь между стоимостью продукции и получаемой предприятием прибылью. Однако это различие касается только простой регрессии и корреляции. Если же она множественная, то на результативный признак влияет множество факторов различного направления и невозможно четко определить окончательно ее направление.
Относительно формы связи различают следующие виды.
• Линейная – когда связи между изучаемыми явлениями носят линейный характер и выражены линейной функцией. Уравнение регрессии имеет вид:
• Криволинейная корреляция и регрессия – когда между исследуемыми явлениями существуют нелинейные соотношения и связь выражается нелинейной функцией.
Процесс нахождения теоретической линии регрессии заключается в выборе и обосновании типа кривой, в расчете параметров ее уравнения. Для выбора и обоснования типа линии нет универсального метода. Существует несколько путей решения задачи: теоретический, эмпирический, а также опыт предыдущих исследований.
Определить тип уравнения регрессии можно, исследуя зависимость графически, однако существуют и другие приемы, позволяющие выявить тип уравнения связи. Так, если результативный и факторный признаки возрастают примерно одинаково, то это свидетельствует о том, что связь между ними линейная; если же один признак увеличивается, а другой неравномерно уменьшается, – связь гиперболическая. Если с увеличением значений фактора результативный признак сначала растет, а потом снижается, то связь параболическая, и т. д.
Задача заключается в том, чтобы найти такие коэффициенты уравнения регрессии, чтобы ошибка была минимальной. Это достигается путем применения метода наименьших квадратов. Для нахождения значений неизвестных параметров приравняем частные производные по этим параметрам к нулю и после простейших преобразований получим систему уравнений.
Пусть связь между результатом и фактором выражается уравнением параболы второго порядка:
Y = a + b>1 x+b>2 x>2, (1.36)
Миниминизируя сумму квадратов отклонений переменной от ее значений по уравнению, получим:
Для этого берутся частные производные Q по параметрам «а» и «b», которые приравниваются к нулю, и полученная система уравнений решается относительно параметров: