Статистика: учебное пособие - страница 10



В статистике, когда нужно показать, насколько форма изучаемого ряда отличается от кривой нормального распределения, рассчитывают показатель, называемый эксцессом.

При одних и тех же характеристиках (средней арифметической и среднем квадратическом отклонении) ряд может быть более островершинным или низковершинным по сравнению с кривой нормального распределения.

Показатель эксцесса рассчитывается по формуле:

Если E>k> 0, то распределение будет островершинным по сравнению с нормальным, если E>k < 0, то распределение будет плосковершинным.

1.4. Определение статистических характеристик сложных процессов или явлений

В ряде случаев представляет интерес отыскание статистических параметров среднего значения, дисперсии, коэффициента вариации, когда наблюдение за каким-либо процессом или явлением представляет собой сложную функцию двух процессов. Например, вариация валового сбора зависит от вариации посевной площади и урожайности сельскохозяйственных культур; вариация молочного жира зависит от вариации количества молока и процента жира в молоке и т. д.

Рассмотрим пример, когда процесс представляет произведение двух переменных.

Пусть Y = X>1X>2, причем у процессов X>1 и X>2 известны следующие параметры: X>1 и X>2 – средние значения; σ1 и σ2  – средние квадратические отклонения; V>1 и V>2 – коэффициенты вариации.

Необходимо определить аналогичные параметры сложного процесса (Y), используя уже известные параметры.

Сложный процесс можно представить таким образом:

Y = X>1X>2 = (X>1 +ΔX>1)(X>2 +ΔX>2) = X>1X>2 +X>2ΔX>1 +ΔX>1X>2 +ΔX>1ΔX>2.

После усреднения найдем, что:

– коэффициент парной корреляции между X>1 и X>2, о котором речь пойдет дальше. 11,24/268,82 = 0,0418, или 4,18.

Тогда Y = X>1X>2 + R>12σ1σ2.

Вынося за скобки X>1X>2, получим:

Y = X>1X>2(1 + R>12V>1V>2). (1.22)

Дисперсию σ>y>2 найдем из выражения:

σ>y>2 = Y>2(Y)>2.

Подставив вместо Y его выражение через X>1 и X>2, после несложных преобразований получим:

Тогда коэффициент вариации будет равен:

Рассмотрим на конкретном примере (табл. 6).

Исходя из данной информации, определяем статистические параметры исследуемых явлений обычным способом:

X>1 = 6689,7 кг; X>2 = 4,038 %; Y = 268,95 кг;

Таблица 6. Данные об удое коров, жирности молока и количестве молочного жира

А теперь проверим предложенную методику и рассчитаем (Y>1, σ>y,V>y), исходя из известных данных X>1 и X>2 и неизвестной информации по Y. В нашем примере известными будем считать все статистические характеристики удоя молока и содержания жира в молоке; при этом ничего не известно о количестве молочного жира. Но так как количество молочного жира будет равно количеству молока, умноженному на содержание жира в молоке (например 5645×0,0435 = 245,6), то, используя вышеизложенную методику, определяем:

Сравнивая рассчитанные по данной методике характеристики с представленными ранее результатами, видим, что результаты получились одинаковые, т. е. в пределах допустимой статистической погрешности.

Так, например, ошибка средней величины составляет:

В относительном выражении она будет равна всего лишь:

11,24/268,82 = 0,0418, или 4,18 %.

Так же можно рассчитать погрешности и для других параметров. Рассмотрим случай, когда изучаемое явление представляет собой не произведение двух переменных, а частное, т. е.:

Также представляет интерес получить статистические характеристики сложного явления, состоящего из суммы или разности двух явлений.