В нашем исследовании очень сложная база данных – в частности в описываемом блоке анкеты – «двойные» открытые вопросы, сопровождающиеся количественными оценками значимости. Для обработки такого рода информации нужна специальная компьютерная программа. Хранение первичных данных (составление базы данных) и их анализ проводились в рамках компьютерной системы «Вега». Система «Вега»[12] – предназначена для хранения в специализированном виде текстовых, цифровых, смешанных (текстовых/цифровых, цифровых/ текстовых) и других признаков, приписанных отдельным объектам (например, респондентам), и имеет развитые возможности классификации и анализа текстовых признаков, проведения сравнений структур текстовых массивов, статистическую обработку цифровых признаков. Обработка текстовых полей позволяет, в частности, получать словари нескольких типов – словари слов, полных ответов, фраз (ответ с множеством тем разбит на отдельные суждения), пермутационные словари; словари можно получать с частотами и с адресами; словари можно получать для любого отдельного текстового поля, для нескольких текстовых полей или всех текстовых полей. Более интересный и эффективный способ анализа массивов текстовых суждений – это разработка классификатора и последующая классификация массивов текстовых элементов в соответствии с классификатором, что позволяет затем получать текстовые и статистические распределения, сравнивать структуры сопоставимых текстовых массивов.
Классификатор, как правило, состоит из категорий двух уровней – более мощные «классы», затем деление внутри «классов» на более конкретные и более мелкие «подклассы» или «группы». Каждое отдельное суждение может быть отнесено только в один «класс» и внутри него только в одну «группу». Итог обработки результатов классификации – представляет собой составную таблицу одномерных распределений: один класс – одна строчка, которая при этом разбивается на отдельные ячейки в соответствии с количеством «внутренних» групп, в клетках таблицы даются числовые частоты классов и групп. Итог классификации – своего рода концепция наличного массива текстов, наполненная широкими (с большими объемами/ частотами) и узкими (с малыми объемами) рубриками, с развитой внутренней структурой (с несколькими подклассами) или вообще без внутреннего деления.
В результате первоначальной классификации всех 1745 ответов с называнием ценностей было выделено 56 первичных групп суждений. Мы объединили затем близкие по смыслу группы, с тем, чтобы получить более обобщенные группы, дающие хоть и более грубую, но и одновременно более обозримую и интерпретируемую ситуацию. В результате объединения и укрупнения классов было выделено 18 интегральных категорий, в которые распределены 56 субгрупп, и всего 1745 единичных суждений. Вот что в итоге мы получили.
Мы видим, что на первом месте ценность
Что касается категории
В принципе эти результаты могут выступать своего рода справочником при выборе «молодежной» проблематики для исследований. Например, тут определенно видно, что попадаются только отдельные упоминания религиозных ценностей. Отсутствует фактически проблематика экологии. Совершенно не представлены коллективистские ценности, идеи служения обществу.
В целом материал представляет богатые возможности идентифицировать интересы и чаяния разных категорий молодежи, позволяет проводить регулярные замеры, отслеживать изменение ценностных ориентиров.
Библиография
1. Здравомыслов А. Г., Ядов В. А. Человек и его работа в СССР и после. – М., 2003.
2. Каневский Е. А., Саганенко Г. И., Гайдукова Л. М., Клименко Е. Н. Диалоговая система классификации и анализа текстов // Социология: 4М. – 1997. – № 9.
3. Магун В. Как меняются российские трудовые ценности // Отечественные записки. – 2007. – № 3.
4. Многообразие возможностей социологического изучения сферы образования / науч. ред. Г. И. Саганенко: сборник. Ч. 1.: Обоснование и технологии социологических исследований, базированных на текстах. – СПб.: ГНУ ИОВ РАО, 2004. Ч. 2.: Прикладные технологии в социологическом изучении сферы образования. – СПб.: ГНУ ИОВ РАО, 2005.