Статистические термины

В социологическом исследовании при анализе данных часто используют статистические методики. Некоторые из них чрезвычайно оригинальны и сложны, но те, которые используют наиболее часто, просты для понимания. Чаще всего применяются меры главной или основной тенденции (способы подсчета средних величин) и коэффициенты корреляции (измерение степени связи одной переменной с другой).

Существует три метода подсчета средних величин, каждый из которых имеет свои преимущества и недостатки. В качестве рабочего примера возьмем уровень личного богатства (включая все виды благ, такие, как дома, автомобили, банковские счета и капиталовложения) тринадцати индивидов. Предположим, что эти тринадцать человек владеют следующим объемом благ:

1. £0

2. £5000

3. £10000

4. £20000

5. £40000

6. £40000

7. £40000

8. £80000

9. £100000

10. £150000

11. £200000

12. £400000

13. £10000000

Среднее здесь соответствует усреднению в его обычном понимании, и получается сложением вместе личного богатства всех тринадцати человек и делением результата на их общее число, то есть на 13. Итоговая сумма будет £11085000, разделив это на тринадцать, получаем значение, равное £852692. Среднее часто полезно потому, что оно основывается на использовании всего объема имеющихся данных. Тем не менее, эта операция может ввести в заблуждение там, где один или небольшая часть случаев очень сильно отличаются от большинства. В приведенном примере среднее значение фактически не будет мерой главной тенденции, поскольку присутствие одной очень большой величины £10000000 искажает все остальное. Может сложиться впечатление, что большинство этих людей владеет гораздо большим объемом благ, чем на самом деле.

В таких случаях может быть использована одна из оставшихся мер. Мода — значение, встречающееся в наборе данных наиболее часто. В примере, приведенном здесь, это £40000. Проблема с модой заключается в том, что этот метод не учитывает общее распределение данных, т. е. весь диапазон величин. Наиболее часто встречающийся случай не обязательно будет представительным для распределения в целом, и поэтому в качестве “средней величины” не очень полезен. В нашем случае £40000 не дают точного представления об основной тенденции, поскольку эта сумма располагается слишком близко к нижнему уровню приведенных значений.

Третьей мерой является медиана — значение, находящееся в середине набора. В примере, приведенном здесь, это седьмое значение — £40000.

В нашем примере дано нечетное количество значений. Если бы оно было четным, например, двенадцать вместо тринадцати то медиана исчислялась бы средним двух чисел, находящихся в середине — шестого и седьмого. Как и мода, медиана не дает представления о реальном диапазоне полученных данных.

Чтобы не дать ошибочной картины среднего, исследователь может использовать не только меру главной тенденции. Чаще всего вычисляется стандартное отклонение для набора данных. Это способ подсчета степени разброса, или диапазона, для набора значений, который в этом случае лежит между £0 и £10 000 000.

Коэффициенты корреляций предлагают полезный способ выражения того, как связаны друг с другом две (или больше) переменных. Если две переменные полностью коррелируют, мы можем говорить о полной положительной корреляции, выражаемой коэффициентом 1. Там, где связи между двумя переменными не обнаружено (они могут быть вовсе не связаны), коэффициент будет нулевым. Абсолютная отрицательная корреляция, выражаемая как -1, существует там, где две переменные находятся в точном обратном отношении друг к другу. В общественных науках абсолютные корреляции никогда не обнаруживаются. Корреляции порядка 0,6 и более, будь то положительные или отрицательные, обычно являются индикатором сильной связи между любыми анализируемыми переменными. Положительные корреляции такого уровня можно, например, обнаружить между классовым происхождением и поведением на выборах. Чем выше англичанин располагается по социально-экономической шкале, тем вероятнее он предпочтет консерваторов лейбористам.

Перейти на страницу:

Похожие книги