Навигационная система по информационным ресурсам ГСНТИ. Технологические аспекты.
Кузнецов М.Ю.

Основная задача данной системы - обеспечение мониторинга и эффективной навигации пользователей в информационном пространстве российских информационных ресурсов (ИР) научно - технического профиля.
Отражению в системе подлежат как научно-значимые ИР (электронные - например, в виде баз данных, веб - сайтов, и неэлектронные - статьи и т.д.), так и организации - физические и юридические лица.
Основное требование к системе - достоверность представленных данных. В связи с этим создана 5-уровневая система доступа - уровень простого пользователя, зарегистрированного пользователя, редактора раздела, редактора системы и администратора. Все информационное пространство системы разделено на разделы. За каждый раздел отвечают несколько редакторов, организационно за ними закреплена одна из организаций - участников проекта.
Для каждого зарегистрированного пользователя создается "личный кабинет".
Ввод данных может осуществляться любым пользователем, зарегистрированным в системе. Данные, введенные зарегистрированным пользователем, проходят проверку редактором и только после этого попадают в основную базу системы.
Индексация информации осуществляется только по основным полям карточки ресурса, организации или персоны. Содержание самого ресурса не индексируется.
Атрибуты в системе реализованы в виде дерева с общей виртуальной вершиной. Данное построение позволяет идентифицировать атрибуты ресурсов с узлами дерева, что обеспечивает расширяемость системы, а также функциональную полноту описания ресурсов.
В системе предусмотрены следующие виды поиска: тематический (по графу каталога), атрибутный по текстовым полям, атрибутный по нормированным полям, полнотекстовый по содержимому ИР, комбинированный. Результаты поиска могут быть отфильтрованы, отсортированы или уточнены ("поиск в найденном").
Большую роль играет XML. Стандарты данных созданы на основе DUBLIN CORE и представлены в формате XML-Schema. В этих форматах можно вводить данные, а также получать результаты поиска. Также функционируют XML-RPC модуль поиска информации и веб-служба. Для редакторов создан механизм выборки из базы необходимой информации. Запрос на поиск такой информации дается в XML-формате, который посредством XSLT преобразуется в SQL-запросы к базе.
Администрирование состоит в периодическом резервном копировании данных, проверки целостности информации, формировании нестандартной статистики и т.п.