Главная Обратная связь

Дисциплины:






Другие проекты электронных библиотек



Электронная библиотека «Нормативная база ГСНТИ»

Успешные концептуальные и программные решения, полученные при создании Фундаментальной электронной библиотеке «Русская литература и фольклор», в 2002 г. привлекли внимание специалистов Минпромнауки РФ и по их инициативе начались разработка электронной библиотеки «Нормативная база ГСНТИ». В создании библиотеки принимали участие специалисты ВИНИТИ.

Данный проект преследовал следующие цели:

· информирование широкой общественности о деятельности ГСНТИ

· предоставление свободного доступа к текстам официальных документов, регламентирующих деятельность в сфере научно-технической информации, архивного, библиотечного и издательского дела,

· повышение эффективности как научных исследований, так и информационной деятельности.

Электронная библиотека состоит из следующих разделов:

· Нормативно-правовые документы, регулирующих деятельность в сфере научно-технической информации смежных областях. К ним относятся Федеральные законы, Постановления и Распоряжения Правительства, Указы и Распоряжения Президента, ведомственные и региональные приказы и т. п.

· Стандарты двух систем: Государственной системы стандартизации (ГСС) и Системы стандартов по информации, библиотечному и издательскому делу (СИБИД).

· Классификаторы и терминологические словари:

Универсальная десятичная классификация

Государственный рубрикатор научно-технической информации

Терминологический словарь по информатике

Англо-русский словарь по информатике.

Термины Юникод.

Термины SGML, HTML, XML.

· Публикации

· Ссылки

При создании электронной библиотеки «Нормативная база ГСНТИ» в полной мере были использованы не только опыт и основные решения, но и программно-технологические средства, разработанные для Фундаментальной электронной библиотеке «Русская литература и фольклор». Кроме того, использование значительной части материалов, представленных в ЭНИ «Библио–норматив», существенно сократило затраты на подготовку информации. Это позволило достаточно быстро — в декабре 2002 г. открыть новую библиотеку для свободного доступа всем заинтересованным лицам. Работы по информационному наполнению библиотеки продолжались в течение 2003 и 2004 гг. после чего Минпромнауки РФ прекратило финансирование этой работы.

Всего было подготовлено и представлено в библиотеке около 500 полнотекстовых документов, в том числе около 400 нормативно-правовых акта, 60 стандартов, два классификатора и четыре документа типа "справочники—словари". Вскоре после открытия электронная библиотека «Нормативная база ГСНТИ» стала пользоваться достаточной популярностью: в среднем ежедневно к ней обращалось более 3 тыс. пользователей. С момента прекращения обновления (декабрь 2004 г.) количество обращений стало уменьшаться, что объясняется просто: появляются новые нормативные акты, отменяются действовавшие и все это не находит отражения в информационном фонде. Тем не менее, в настоящее время ежедневно к библиотеке обращается около 1 тыс. пользователей.



Информационно-аналитической системы «Русская поэзия»

С 2005 г. сотрудники отдела участвуют в работах по созданию информационно-аналитической системы «Русская поэзия» (ИАС РП). Проект ведется при поддержке Российского фонда фундаментальных исследований; руководитель проекта акад. В.Е. Захаров. Фундаментальная теоретическая проблема, на решение которой направлен проект — аккумуляции знания в гуманитарных науках. Конкретная область приложения – русская поэзия на протяжении всей ее истории. Цель проекта – создание информационно-аналитической системы, интегрирующей теоретико-литературные, историко-литературные и лингвостиховедческие знания о русских поэтах и русской поэзии.

Осуществление проекта предполагает создание программно-технологического инструментария, обеспечивающего разнообразные информационные поиски. Это прежде всего поиск слов и словосочетаний с учетом морфологии русского языка разных исторических периодов по текстам, реализованным в разных орфографических системах. Затем, это поиск нужных словоформ по заданным морфолого-синтаксическим параметрам с учетом акцентологической структуры слов и места слова в стихе. Далее, это разработка специальных алгоритмов и создание программ автоматического лингвостиховедческого анализа и автоматизированной лингвостиховедческой разметки. Наконец, это поиск в области метаданных, т. е. поиск произведений по формальным атрибутам, набор которых будет уточняться по мере тезаврирования проблемной области.

Разработка экспертной системы по русской поэзии представляет собой сложную задачу, которая решается поэтапно.
Первый этап: предварительная "инвентаризация" и формирование основы информационного фонда, разработка базовой понятийной системы, формулирование основных типов решаемых задач.
Второй этап: создание информационно-справочной системы по русской поэзии как площадки для дальнейшего формирования экспертной системы. Одной из основных задач данной системы является интенсивный сбор информации и накопление знаний по указанной тематической области.
Третий этап: выбор основных научных и технических решений для создания ядра экспертной системы.
Четвертый этап: формирование и сдача в эксплуатацию экспертной системы по русской поэзии.
Пятый этап: интеграция экспертной системы с проектами аналитической и библиотечной ориентации.

ИАС РП представляет собой экспертную систему, аккумулирующую разнообразную информацию в данной предметной области и продуцирующую новые знания.

ИАС РП предназначена для системного накопления и сохранение произведений русской поэзии и комментариев, библиографии и результатов научных исследований в этой области; широкого распространение произведений русской поэзии и связанных с ней исследовательских работ, в частности организация свободного и удобного сетевого доступ к ним; содействия научным исследованиям и образованию в гуманитарной сфере; фиксирования формализованного знания в гуманитарной области.

В соответствии с задачами, стоящими перед системой, аккумулируемая в ней информация представляет собой: полные тексты произведений; формализованные сведения о декларируемых в системе сущностях (произведениях, авторах и т.д.); понятийный аппарат предметной области, представленный тезаурусом; формализованные утверждения, правила вывода и алгоритмы решения заданного множества задач.

В ходе работ сотрудники нашего отдела участвовали в разработке концепции ИАС РП, проектировании экспериментального варианта первой очереди системы и подготавливали информацию. При этом были сформированы четыре БД:

· Personalia – коллекция биографической информации о русских поэтах и ученых, работающих в области поэтологии;

· Библиография – библиографический указатель публикаций поэтических произведений и научных работ по поэтологии;

· Поэтология – коллекция текстов научных работ по поэтологическим дисциплинам;

· Поэзия – коллекция текстов поэтических произведений.

В 2006 г. была подготовлена программно-технологическая база для создания и ведения тезауруса по русской поэзии и сформирована экспериментальная БД.

Созданный экспериментальный вариант системы использует СУБД MS SQL Server 2000 и обеспечивает сетевой доступ с информации; устойчивость к увеличению количества пользователей системы; устойчивость к увеличению объемов информации; минимальные требования для доступа к системе; возможность ее модификации. Для реализации информационных поисков (лексического и атрибутного) использована модификация поисковой машина компании «Яндекс», применяемая в Фундаментальной электронной библиотеке «Русская литература и фольклор».

С 2007 г. осуществляется загрузка информации в систему и формирование тезауруса.

Подготовка информации для сервиса «Яндекс–словари»

В конце 2004 г. компания «Яндекс» пригласила НТЦ «Информрегистр» участвовать в проекте создания нового раздела (сервиса) портала "Яндекс". Этот раздел должен представлять собой интегрированную словарно-энциклопедическую систему широкого профиля, использующую информационные ресурсы высокого качества. Основанием для этого предложения стал большой опыт специалистов нашего отдела по подготовке высококачественной информации сетевых полнотекстовых информационных систем и профессиональное знание различных видов отечественных информационных ресурсов.

В течение последующего года велась совместная подготовка концепции сервиса — «Основных проектных решений», определивших основные направления работ, принципы отбора и подготовки информации. В этом документе были также отражены наиболее существенные организационные, правовые и технологические вопросы. В соответствии с концепцией была создана редакция сервиса, в состав которой вошли специалисты «Яндекса» и НТЦ «Информрегистра». Перед редакцией поставлен широкий круг задач, в частности, планирование работ по подготовке информации, оперативное управление технологическим процессом, организация экспертизы контента, управление юридическим сопровождением проекта.

Фактически, основной целью проекта является создание электронной библиотеки, которая должна предоставлять пользователям интернета максимально качественную, достоверную и актуальную информацию обо всех сферах жизни человека. Источниками такой информации выступают универсальные и тематические энциклопедии, справочники, различные словари русского языка и иностранных языков. Для структуризации накапливаемой информации разрабатывается рубрикатор контента. Адекватное представление в сети некоторых энциклопедических изданий, в частности обладающих иерархической структурой, потребовало определенной доработки программного обеспечения сервиса.

С января 2006 началась практическая деятельность по подготовки контентента. Эта деятельность включает приобретение прав на издание, подготовку информации и публикации ее в разделе «Яндекс–словари». В свою очередь подготовка информации складывается из оцифровки печатного издания, вычитки полученных электронных текстов, разметки информации и преобразование в загрузочные форматы.

В среднем ежемесячно обрабатывается 4—5 книг для раздела «Яндекс–словари». Обработка ведется с учетом всех требований к качеству информации, установленных в Фундаментальной электронной библиотеке «Русская литература и фольклор». В связи с этим представляет интерес оценка Максима Мошкова, создателя крупнейшей в России электронной библиотеки Lib.ru.:

«Новая затея Яндекса меня, конечно, радует. Особенно приятно, что оцифровкой словарей займется "Информрегистр". Я видел, как они тотально и глубоко прорабатывали оцифровки собраний сочинений русских классиков. Недостижимый класс, огромная и очень дорогая работа. Если они на таком же уровне отработают и в этом проекте — останется только снять шляпу. Также приятно видеть, что крупный поисковик не только ищет информацию, которую в сеть размещают контент-проекты, но и сам решился взяться за подготовку этого самого контента. Желаю удачи, ребята!»





sdamzavas.net - 2020 год. Все права принадлежат их авторам! В случае нарушение авторского права, обращайтесь по форме обратной связи...