« July 2006 | Main | November 2006 »

October 7, 2006

Перспективная методика анализа данных: контент-мониторинг

«В простейшем виде идею контент-мониторинга можно сформулировать как постоянное выполнение узко очерченного своими задачами контент-анализа беспрерывных информационных потоков». Это определение контент-мониторинга я встретила в статьях «Контент-мониторинг информационных потоков» А.Г. Федорчука и «Феномены современных информационных потоков» Д. Ландэ и А. Литвина.
Напомню, что в основе контент-анализа лежит изучение документов в их социальном контексте. (подробнее можно почитать, например, - здесь)
Казалось бы, идея лежит на поверхности – выявить не только частоту упоминания того или иного объекта в СМИ, но также и выявить и проанализировать контекст данного упоминания.
Берется какой-то объем информации (некоторая база данных) и к ней применяются методы Data Mining - ( Data mining — это процесс автоматического выделения действительной, эффективной, ранее неизвестной и совершенно понятной информации из больших баз данных и использование ее для принятия ключевых бизнес-решений - Э. Пройдаков "Что такое Data Mining?" ), точнее, более специализированный инструментарий – Text Mining (Технология глубинного анализа текста - Text Mining - это тот самый инструментарий, который позволяет анализировать большие объемы информации в поисках тенденций, шаблонов и взаимосвязей, способных помочь в принятии стратегических решений. Кроме того, Text Mining - это новый вид поиска, который в отличие традиционных подходов не только находит списки документов, формально релевантных запросам, но и помогает ответить на вопрос: "Помоги мне понять смысл, разобраться с этой проблематикой". – Д. Ландэ «Глубинный анализ текстов. Технология эффективного анализа текстовых данных .
Однако же в настоящий момент при проведении анализа не удается полностью автоматизировать процесс. На начальном и на заключительном этапе интуиция эксперта играет неоценимую роль, без нее невозможно как отобрать критерии анализа, так и построить модель для объяснения полученных данных. В статье Н. Некипелова и А. Арустамова «Методика анализа данных: подход решению» предлагается такой подход к анализу данных: «использование опыта и интуиции специалиста в своей области для последовательного приближения ко все более точной модели анализируемого процесса. Основное требование при этом – наличие качественной информации достаточного объема, что невозможно без системы автоматизации сбора и хранения информации»

Эта идея с контент-мониторингом захватывает меня в связи с запуском обновленной версии поиска по блогам и форумам (http://blogs.yandex.ru) от компании Яндекс (хотя, собственно, старая версия меня тоже вполне устраивала). Какой простор открывается! Можно практически мгновенно узнать реакцию на интересующее событие, можно даже попытаться проанализировать динамику изменения мнений относительно того или иного события.

Posted by KatzeCat at 6:15 PM | Comments (0)