Статистика: учебное пособие - страница 18



Проделав простейшие преобразования, получим систему из трех уравнений:

Далее задача сводится к решению этой системы нормальных уравнений.

Применим этот метод для определения степени влияния сроков посева на урожайность. Для расчетов используем табл. 12, из которой возьмем следующие данные: сроки посева и средние значения урожайности для каждого срока посева.

Таблица 12

Порядковые номера сроков посева можно рассматривать как кодированные значения Х. Причем

Средняя урожайность представлена таблицей значений:

Y>1 = 16; Y>2 = 18; Y>3 = 18; Y>4 = 17; Y>5 = 15;

Теперь задача сводится к построению зависимости: Y = f(x).

Исходные данные для расчета зависимости Y = f(x) представлены в табл. 13.

Из табл. 13 видно, что с изменением сроков посева средняя урожайность сначала растет, а затем падает. Следовательно, существуют оптимальные сроки посева, при которых средняя урожайность максимальна.

Подобный процесс целесообразно описать уравнением параболы 2/го порядка:

Таблица 13

Y = a + b>1x + b>2 x>2,

где a, b>1, b>2 – параметры, подлежащие определению.

Для нахождения параметров a, b>1 и b>2 необходимо решить систему нормальных уравнений.

Известно, что экстремальные точки функции Y = f (x) определяются из условия Y = f (x), где Y' – первая производная функции Y по переменной x.

Для выбранного вида функции:

Y = (a + b>1x + b>2 x>2) = b>1 + 2b>2 x.

Откуда

Подставляя из табл. 13 значения (X>i Y) в систему нормальных уравнений, получим:

5a + 15b>1 + 55b– = 84;

15a + 55b>1 + 225b>2 = 249; (I)

55a + 225b>1 + 979b>2 = 897.

Система решается следующим образом:

1. Все уравнения делятся на коэффициенты при «а»:

a + 3b>1 + 11b>2 = 16,8;

a + 3,67b>1 + 15b>2 = 16,8;

a + 4,09b>1 + 17,8b>2 = 16,3.

2. Из первого уравнения вычитается сначала 2/е, а затем 3/е. В результате получается система уравнений с двумя неизвестными:

– 0,67b>1, – 4b>2 = +0,2; (II)

– 1,09b>1 – 6,8b>2 = +0,5.

3. Повторяем процедуру 1 и 2 и получаем:

0,24b>2 = -0,16,

откуда b>2 = -0,64.

Подставляя в любые уравнения системы II, например в первое, значение: b>2 = -0,64, найдем b>1 = +3,54.

Из первого уравнения системы I находим:

a = 13,22.

Таким образом, уравнение, выражающее связь сроков посевов с урожайностью, будет иметь вид:

Y = 13,22 + 3,54x – 0,64x>2

Оптимальный срок посева будет равен х>опт = 2,8, что соответствует периоду с 10 по 20 мая.

Существует много методов решения системы нормальных уравнений, в частности, целесообразно решать систему нормальных уравнений обычными методами линейной алгебры.

До сих пор речь шла о том, что на результативный признак действует один факторный признак, и в зависимости от этого мы строили все свои расчеты. На самом деле все обстоит гораздо сложнее. На результативный признак действует множество случайных факторов, и перед нами возникает новая задача – найти модель наблюдаемого процесса, адекватно отражающую сам процесс, определить, как и в какой степени на результаты наблюдения воздействуют выбранные факторы. Эта задача чрезвычайно важна, так как именно она позволяет правильно оценить с определенной заданной вероятностью место и роль наблюдаемого явления в решении конкретных народно-хозяйственных задач.

Наиболее часто на практике наблюдаемый процесс описывается линейной многофакторной моделью:

Y = a + b>1x>1 + b>2 х>2 +… + b>kx>k, (1.37)

гдеx>1x>2… x>k – значения факторов; a, b>1, b>2, b>k – параметры модели.

Что же такое модель? Как ее объяснить? Обычно стараются для наглядности все процессы интерпретировать геометрически. Попробуем подойти к многофакторной модели именно с такой позиции.