Дисперсия

Мій кабінет
UA RU EN
Головна > Статті

Дисперсия в статистике — это мера, которая показывает разброс между результатами. Если все они близки к среднему, дисперсия низкая. А если результаты сильно различаются — высокая.

Что показывает дисперсия?

Если говорить о всей выборке, дисперсия показывает, насколько разнородны результаты. Например, в одной группе почти все — шатены. В другой половина — шатены, а остальные — блондины, рыжие и брюнеты. Вторая группа более разнородная, в ней выше дисперсия.

Более близкие к реальному миру примеры:

  • бизнесу дисперсия поможет рассчитать разброс между доходами за разные месяцы;
  • ученый с помощью дисперсии поймет, насколько совпадают между собой результаты серии экспериментов.

Еще дисперсия показывает вероятность того, что конкретный результат будет далек от среднего. Например, средний рост россиянина мужского пола — 175 см. Но если остановить на улице случайного мужчину, вряд ли он окажется ровно 175 см ростом — скорее всего, выше или ниже. Дисперсия высокая — вероятность встретить «не среднее» значение выше.

В реальном мире это можно использовать так:

  • проверять, насколько предсказуемы бизнес-показатели;
  • оценивать риски — для компании, продвижения или даже обычной жизни.

Логика тут такая: чем меньше предсказуемости — тем больше хаоса и, соответственно, больше рисков.

Формула дисперсии

Сначала дадим формальное определение, а потом объясним простыми словами. Дисперсия рассчитывается по формуле как среднее квадратичное отклонение от среднего значения:

D(X) =1ni=1n(xi-x)2 ,

где
n — количество элементов,
xi – i-й элемент в выборке,
x — среднее арифметическое.

Звучит и выглядит сложно, но фактически все не так страшно. Вот как выглядит расчет пошагово:

  1. Найти среднее арифметическое x. Для этого нужно сложить все элементы и разделить полученную сумму на их количество.
  2. Потом от каждого элемента по очереди нужно отнять среднее арифметическое, а получившееся число возвести в квадрат. Это называется квадратами отклонения от среднего.
  3. Найденные квадраты отклонения от среднего нужно сложить.
  4. Сумму разделить на количество элементов в выборке.

Формула дисперсии случайной величины рассчитывается так: D(X)=M(X?M(X))2

Найти дисперсию случайной величины также можно по формуле, записанной в более удобном для расчетов виде: D(X)=M(X2)?(M(X))2.

Все перечисленное посчитать несложно — достаточно школьных знаний математики. А вот чтобы понять, почему формула именно такая, уже нужно разбираться в статистике.