Статистика: учебное пособие - страница 10
В статистике, когда нужно показать, насколько форма изучаемого ряда отличается от кривой нормального распределения, рассчитывают показатель, называемый эксцессом.
При одних и тех же характеристиках (средней арифметической и среднем квадратическом отклонении) ряд может быть более островершинным или низковершинным по сравнению с кривой нормального распределения.
Показатель эксцесса рассчитывается по формуле:
Если E>k> 0, то распределение будет островершинным по сравнению с нормальным, если E>k < 0, то распределение будет плосковершинным.
1.4. Определение статистических характеристик сложных процессов или явлений
В ряде случаев представляет интерес отыскание статистических параметров среднего значения, дисперсии, коэффициента вариации, когда наблюдение за каким-либо процессом или явлением представляет собой сложную функцию двух процессов. Например, вариация валового сбора зависит от вариации посевной площади и урожайности сельскохозяйственных культур; вариация молочного жира зависит от вариации количества молока и процента жира в молоке и т. д.
Рассмотрим пример, когда процесс представляет произведение двух переменных.
Пусть Y = X>1X>2, причем у процессов X>1 и X>2 известны следующие параметры: X>1 и X>2 – средние значения; σ1 и σ2 – средние квадратические отклонения; V>1 и V>2 – коэффициенты вариации.
Необходимо определить аналогичные параметры сложного процесса (Y), используя уже известные параметры.
Сложный процесс можно представить таким образом:
Y = X>1X>2 = (X>1 +ΔX>1)(X>2 +ΔX>2) = X>1X>2 +X>2ΔX>1 +ΔX>1X>2 +ΔX>1ΔX>2.
После усреднения найдем, что:
– коэффициент парной корреляции между X>1 и X>2, о котором речь пойдет дальше. 11,24/268,82 = 0,0418, или 4,18.
Тогда Y = X>1X>2 + R>12σ1σ2.
Вынося за скобки X>1X>2, получим:
Y = X>1X>2(1 + R>12V>1V>2). (1.22)
Дисперсию σ>y>2 найдем из выражения:
σ>y>2 = Y>2 – (Y)>2.
Подставив вместо Y его выражение через X>1 и X>2, после несложных преобразований получим:
Тогда коэффициент вариации будет равен:
Рассмотрим на конкретном примере (табл. 6).
Исходя из данной информации, определяем статистические параметры исследуемых явлений обычным способом:
X>1 = 6689,7 кг; X>2 = 4,038 %; Y = 268,95 кг;
Таблица 6. Данные об удое коров, жирности молока и количестве молочного жира
А теперь проверим предложенную методику и рассчитаем (Y>1, σ>y,V>y), исходя из известных данных X>1 и X>2 и неизвестной информации по Y. В нашем примере известными будем считать все статистические характеристики удоя молока и содержания жира в молоке; при этом ничего не известно о количестве молочного жира. Но так как количество молочного жира будет равно количеству молока, умноженному на содержание жира в молоке (например 5645×0,0435 = 245,6), то, используя вышеизложенную методику, определяем:
Сравнивая рассчитанные по данной методике характеристики с представленными ранее результатами, видим, что результаты получились одинаковые, т. е. в пределах допустимой статистической погрешности.
Так, например, ошибка средней величины составляет:
В относительном выражении она будет равна всего лишь:
11,24/268,82 = 0,0418, или 4,18 %.
Так же можно рассчитать погрешности и для других параметров. Рассмотрим случай, когда изучаемое явление представляет собой не произведение двух переменных, а частное, т. е.:
Также представляет интерес получить статистические характеристики сложного явления, состоящего из суммы или разности двух явлений.