Интернет-библиотека СМИ Public. Ru отметила
28 апреля в РИА Новости прошла презентация прототипа, совместно разрабатываемого Интернет-библиотекой СМИ Public. Ru и компанией Авикомп Сервисез, основанного на технологиях семантического поиска и анализа текстовой информации.
Перспективность семантического поиска основана на расширении возможностей и упрощения процедур для пользователя, что и продемонстировал в тестовой версии новой системы директор по развитию Интернет-библиотеки СМИ Public. Ru Дмитрий Шемигон. В отличие от контекстного поиска, исключающего из результатов небуквальные совпадения, семантический поиск оперирует не словами, а объектами, учитывает связи между ними. Дополнительная система фильтров позволяет мгновенно делать медиа-срез, оценивать тональность и жанры публикаций.
Ежедневно архив Public. Ru пополняется 30 000 публикаций. По словам Д. Шемигона, историческую миссию компания видит в обеспечении «достоверности истории» — уже сейчас идет работа по увеличению временной глубины библиотеки — на 20 лет и дальше. Причем, как и в случае современной информации, речь идет об создании интегрированных из разных источников баз знаний, что подразумевает и новые возможности визуализации объектов изучения и их связей, и исключение всевозможных дублей. Уровень лингвистической проработки позволяет идентифицировать (при поиске) и учитывать все возможные словоформы, синонимы и логические смыслы. Причем, что немаловажно, система позволяет насториться на опеределенные режимы работы с информацией — кого-то интересуют первоисточники, а кого-то, наоборот, все возможные упонимания.
Процесс обработки основывается на созданном компанией «Авикомп Сервисез» семантическом процессоре — Ontos Miner, который включает тысячи лингвистических правил распознавания информационных объектов, их свойств и взаимоотношений в естественно-языковых текстах. По словам Филиппа Дудчука, директора по маркетингу Авикомп Сервисез, это позволяет ввести семантическое представление любого текста и создать специализированное семантическое хранилище. Система семантического анализа неструктурированной информации, разработанная Авикомпом, будет интегрирована с крупнейшими и постоянно обновляющимися фондами русскоязычных СМИ Public. Ru — более 3 500 источников, около 40 млн. документов.
По словам генерального директора Интернет-библиотеки СМИ Public. Ru Олега Владеса, «семантические технологии в перспективе дают возможность новых форм управления знаниями, создания интегрированной модели данных. Это изменит специфику работы с информацией и расширит сферы ее применения».
Пока система будет работать в тестовом режиме и будет формироваться поле потребностей клиентов, их обслуживание будет происходить на существующих тарифных планах.
pr-files.