October 7, 2006
Перспективная методика анализа данных: контент-мониторинг
«В простейшем виде идею контент-мониторинга можно сформулировать как постоянное выполнение узко очерченного своими задачами контент-анализа беспрерывных информационных потоков». Это определение контент-мониторинга я встретила в статьях «Контент-мониторинг информационных потоков» А.Г. Федорчука и «Феномены современных информационных потоков» Д. Ландэ и А. Литвина.
Напомню, что в основе контент-анализа лежит изучение документов в их социальном контексте. (подробнее можно почитать, например, - здесь)
Казалось бы, идея лежит на поверхности – выявить не только частоту упоминания того или иного объекта в СМИ, но также и выявить и проанализировать контекст данного упоминания.
Берется какой-то объем информации (некоторая база данных) и к ней применяются методы Data Mining - ( Data mining — это процесс автоматического выделения действительной, эффективной, ранее неизвестной и совершенно понятной информации из больших баз данных и использование ее для принятия ключевых бизнес-решений - Э. Пройдаков "Что такое Data Mining?" ), точнее, более специализированный инструментарий – Text Mining (Технология глубинного анализа текста - Text Mining - это тот самый инструментарий, который позволяет анализировать большие объемы информации в поисках тенденций, шаблонов и взаимосвязей, способных помочь в принятии стратегических решений. Кроме того, Text Mining - это новый вид поиска, который в отличие традиционных подходов не только находит списки документов, формально релевантных запросам, но и помогает ответить на вопрос: "Помоги мне понять смысл, разобраться с этой проблематикой". – Д. Ландэ «Глубинный анализ текстов. Технология эффективного анализа текстовых данных .
Однако же в настоящий момент при проведении анализа не удается полностью автоматизировать процесс. На начальном и на заключительном этапе интуиция эксперта играет неоценимую роль, без нее невозможно как отобрать критерии анализа, так и построить модель для объяснения полученных данных. В статье Н. Некипелова и А. Арустамова «Методика анализа данных: подход решению» предлагается такой подход к анализу данных: «использование опыта и интуиции специалиста в своей области для последовательного приближения ко все более точной модели анализируемого процесса. Основное требование при этом – наличие качественной информации достаточного объема, что невозможно без системы автоматизации сбора и хранения информации»
Эта идея с контент-мониторингом захватывает меня в связи с запуском обновленной версии поиска по блогам и форумам (http://blogs.yandex.ru) от компании Яндекс (хотя, собственно, старая версия меня тоже вполне устраивала). Какой простор открывается! Можно практически мгновенно узнать реакцию на интересующее событие, можно даже попытаться проанализировать динамику изменения мнений относительно того или иного события.
Posted by KatzeCat at 6:15 PM | Comments (0)
November 7, 2005
Конкурс провидцев
Общественное мнение – не мнение большинства, упаси Боже. Можно дать множество определений, я приведу одно, часто использующееся в политологии, оно мне нравится более остальных. Общественное мнение – это мнение лидирующей в обществе группы, претендующее на универсальность.
Изучение общественного мнения – серьезная проблема. Некоторые серьезные ученые считают, что изучение ОМ принципиально невозможно. Но если уж попробовать провести исследование, надо принимать во внимание некоторые особенности ОМ, так называемые «комплексы общественного мнения». И о том, и о другом я подробнее расскажу в другой раз.
А сейчас я хочу предложить погадать на общественном мнении, проверить, правильные ли у нас ожидания и ощущения того, что же происходит в социуме и как думают люди. Собственно, предлагается угадать (или спрогнозировать – для кого как), как ответят люди на вопросы анкеты. Конкурс провидцев регулярно проводится в Клубе Фонда Общественного Мнения.
Для участия необходимо лишь зарегистрироваться – это легко и быстро.
В данный момент представлены вопросы об общественной безопасности – отношении к милиции, терактами и т.п. Спешите поучаствовать – скоро появятся результаты, с которыми будут сравниваться ответы участников и будет открыт новый тур конкурса.
Посмотреть результаты предыдущего тура можно здесь.
Posted by KatzeCat at 11:00 PM | Comments (2)
