ПО от EPAM Systems для анализа форумов и блогов

0
463 views

Компания EPAM Systems выводит на рынок первый русскоязычный инструмент для анализа информации в интернет-ресурсах (форумах и блогах) – «ЕРАМ-Голос клиента». Система автоматизирует процесс обработки и анализа информации и дает возможность получать актуальную и своевременную (в режиме он-лайн) обратную связь от клиента с помощью анализа мнений в интернет-форумах и блогах по темам, которые интересны конкретной компании.

Наибольший интерес инструмент представляет для компаний, работающих в высококонкурентных секторах В2С: банковском, страховом, FMCG, телеком, ритейл, электронная торговля.

Инструмент представляет собой корпоративную систему (бизнес-приложение), в основе которой лежат лингвистические алгоритмы и технологии Opinion Mining, позволяющие извлекать данные из различных неструктурированных источников и структурировать информацию в виде базы данных. В результате уже структурированные данные можно обрабатывать любыми аналитическими инструментами, начиная с MS Excel и заканчивая системами OLAP, Business Intelligenсe (BI) и Data Mining. Система подключается к любым аналитическим инструментам любых вендоров в том числе SAP, Oracle, SPSS, Cognos и т.д. Подходы, которые лежат в основе данного программного продукта, существенно расширяют возможности представленных сегодня на российском рынке корпоративных и онлайн поисковых систем (Yandex.ru, Google.ru и др.), поскольку последние предполагают последующую ручную обработку информации (просмотр ссылок, извлечение нужны данных, заведение их в базу данных). В ситуации, когда объем потоков информации достигает десятков тысяч документов в день, ручная обработка просто неприемлема.

При этом инструмент может работать как с внешними (блоги, форумы, интернет-сайты, СМИ и т.д.), так и с внутренними (CRM, записи колл-центров, различного рода мессенджеры, переписка по электронной почте и т.д.) источниками. Система использует для анализа как структурированную (базы данных), так и неструктурированную (тексты, графика и т.д.) информацию. Инструмент соответствует самым высоким требованиям информационной безопасности.

Система была разработана компанией EPAM Systems для американской компании Clarabridge, которая реализует данный инструмент на территории США, при этом в работе были задействованы собственные программисты, консультанты и лингвисты ЕРАМ. На территории стран СНГ эксклюзивным дистрибутором системы является EPAM Systems. Качество обработки информации составляет: точность – порядка 95-97%, производительность более 20 тыс. документов в день. Система продуктивно работает с данными характеристиками с английским и русским языками и предназначена для автоматизации анализа больших массивов информации из разнообразных источников.

Антон Носик, руководитель службы блогов компании «СУП», отметил: "На сегодняшний день блогосфера – и российская, и общемировая – это самая быстрорастущая часть интернета, которая в последнее время демонстрирует практически троекратный рост за год. В мире насчитывается 75 млн блогов, в России, по данным Яндекса, чуть больше 2 млн уникальных адресов. Причиной такого бурного роста является то, что нет никакого технологического барьера для входа и фактически каждый желающий может создать собственный блог. Кроме того, что эти дневники ведутся, есть множество людей, которое их читает. Например, в русскоязычной части Lifejournal cуществуют блоги, аудитория которых исчисляется десятками и сотнями тысяч читателей в день. Посещаемость самого популярного блога – 150-200 тыс. уникальных читателей в день. Фактически блоги представляют собой социальную сеть и становятся реальной альтернативой традиционных медиа".

Анатолий Гавердовский, старший вице-президент компании EPAM Systems, отметил: "Основные проблемы традиционных маркетинговых исследований (опросов, фокус-групп) – опосредованность, стоимость, время и человеческий фактор. Сегодня появился альтернативный источник маркетинговой информации – мнения клиентов в форумах и блогах. Но обработать миллионы сообщений ручным способом просто нереально или будет стоить бешеных денег… Конечно, если мы хотим, чтобы информация поступала в реальном времени, а не через несколько месяцев. Например, по банковской тематике количество сообщений достигает порядка 40 тысяч в день, это летом, а что будет в сезон. Представьте, если десятки тысяч людей в день вводят сообщения, то сколько нужно человек, чтобы это все обработать. Здесь нужны машинные способы обработки интернета, машинные способы извлечения мнений из всего того хаоса, который каждый день добавляется в сеть. Причем с помощью «ЕРАМ-Голос клиента» можно смотреть разные источники: форумы, блоги, переписку, например, жалобы клиентов, которые приходят либо по электронной почте, либо записываются в колл-центре, – и реально понимать, что происходит. Вот это настоящий Web 2.0".