Главная Обратная связь

Дисциплины:






Электронные издания на компактных оптических дисках

Одновременно с началом работ по созданию концепции полнотекстовой информационно–поисковой системы и разработки технологии подготовки информации для такой системы в 1994 г. были начаты практические работы по преобразованию печатной информации в электронную форму, а также выбор программных средств, обеспечивающих полнотекстовый поиск. В процессе подготовки электронной информации были опробованы четыре существовавшие в то время системы автоматического распознавания текста (OCR). Примерно через полтора года окончательный выбор пал на систему FineReader, которая в виде своих последующих модификаций и используется до настоящего времени. Сложнее обстояло дело со средствами полнотекстового информационного поиска — законченных программных продуктов, обеспечивающих качественную обработку русскоязычных текстов, еще не было. Первым шагом в решении этой проблемы стало создание информационно-поисковой системы «РЕГИСТР» на базе ИПС МИРС (руководитель разработки программного обеспечения системы — Пархоменко В.Ф.). Эта система была рассчитана на использование в операционной системе MS-DOS, начиная с версии 5.0. Однако становилось ясным, что на рынке все большую популярность завоевывает операционная среда Windows, к работе с которой ИПС «РЕГИСТР» была не готова. Выход был предложен в 1996 г. компанией «CompTek International», отделение которой «Аркадия» уже разработала Windows–версию поисковой системы «Яндекс». С тех пор все наши продукты (на компактных оптических дисках или сетевые), оснащаются этой поисковой системой.

Полученные результаты исследований и экспериментов по перечисленным выше направлениям естественным образом привели к идее создания серии электронных научных изданий (ЭНИ) для определенной сферы деятельности. Эти издания должны были содержать основополагающие материалы, наиболее важные для данной предметной области, которые бы в электронной форме оптимально соответствовали печатным оригиналам. Электронные издания должны были выпускаться на компактных оптических дисках. Предшествующий опыт работ по стандартизации и сертификации в области баз и банков данных обусловил направленность первой серии электронных изданий — нормативные документы и классификаторы в области информатизации. В результате были созданы три ЭНИ: «Классификационные системы», «Информ–норматив» и «Библио–норматив». Развитием этого направления работ стало создание электронной библиотеки «Нормативная база ГСНТИ».

Стремление к освоению других тематических направлений привел к контактам в середине 1995 г. с Институтом мировой литературы им. А.М. Горького РАН (ИМЛИ). В последующие годы эти контакты расширялись и укреплялись, что привело к тесному и плодотворному сотрудничеству двух организаций. Это взаимодействие положило начало работам по подготовке серии ЭНИ, посвященных классикам русской литературы. После подготовки двух ЭНИ: «Пушкин» и «Грибоедов» идея выпуска серии трансформировалась в проект создания Электронного фонда русской классической литературы. Этот проект, просуществовав два года, привел к созданию Фундаментальной электронной библиотеки «Русская литература и фольклор».



ЭНИ «Классификационные системы»

Электронное научное издание «Классификационные системы» создавался в 1994—95 гг. по заданию Миннауки РФ. ЭНИ было тиражировано на CD-ROM и находилось в коммерческом распространении в 1995—97 гг. Оно являлось первым в России машиночитаемым собранием разнообразных широко используемых классификационных систем (классификаторов):

· Универсальная десятичная классификация (УДК).

· Библиотечно-библиографическая классификация для научных (ББК-Н) и массовых (областных) библиотек (ББК-О).

· Международная классификация изобретений (МКИ), редакция 5.

· Государственный рубрикатор научно-технической информации (ГРНТИ).

· Классификатор научных специальностей ВАК (ВАК).

· Товарная номенклатура внешнеэкономической деятельности (ТН ВЭД).

· Общероссийский классификатор продукции (ОКП).

· Общероссийский классификатор видов экономической деятельности, продукции и услуг (ОКДП).

· Система обозначений объектов административно-территориального деления России (СОАТО).

· Система обозначений органов государственного управления России (СООГУ).

· Классификатор форм собственности (КФС).

· Классификатор организационно-правовых форм хозяйствующих субъектов (КОПФ).

· Классификатор стран мира (КСМ) - проект ГОСТ Р на базе стандарта ISO.

· Классификатор языков (КЯ) - проект ГОСТ Р на базе стандарта ISO.

· Общеправовой классификатор отраслей законодательства (ОКОЗ).

Информационные массивы перечисленных классификаторов были получены, как правило, у их владельцев или официальных держателей в объемах, соответствующих действующим официальным версиям, и актуализированы по состоянию на ноябрь 1994 г.

Все классификаторы представлены полными текстами в составе специализированной информационно-поисковой системы (ИПС РЕГИСТР), обеспечивающей поиск по лексике с учетом грамматики русского языка и классификационным кодам, просмотр результатов поиска, а также сохранение отобранной информации в текстовом файле. ИПС РЕГИСТР позволяет работать как с каждым классификатором отдельно, так и со всеми вместе. ЭНИ было рассчитано на эксплуатацию на IBM-совместимых персональных компьютерах, начиная с i386, в операционной системе MS-DOS, начиная с версии 5.0.

ЭНИ «Грибоедов» и «Пушкин»

ЭНИ «Грибоедов» посвящено жизни и творчеству классика русской литературы А.С. Грибоедову. Оно явилось дальнейшим развитием идей, сформированных при создании ЭНИ «Классификационные системы». Фактически это издание стало полигоном для отработки основных принципов и технологических решений создания ЭНИ.

В работе по созданию ЭНИ, выполненных в 1995—96 гг. принимали участие компания «CompTek International» и ИМЛИ им. А.М.Горького РАН.

ЭНИ «Грибоедов» включало более 15 тысяч страниц печатной информации:

· полные тексты всех известных произведений Грибоедова по 5–10 наиболее авторитетным изданиям;

· полные тексты более 300 наиболее значимых работ о жизни и творчестве Грибоедова;

· библиографию Грибоедова и литературы о нем (около 10 тыс. описаний);

· летопись жизни и творчества Грибоедова;

· несколько указателей;

· около 400 изображений
и ряд других материалов.

В специальном разделе был представлен впервые подготовленный в России в полный словарь языка Грибоедова, содержащий около 13 тыс. лексем и более 130 тыс. словоупотреблений. Для каждой лексемы и словоформы представлены грамматические характеристики, каждое словоупотребление сопровождается контекстом. Полнота и точность представления информации в ЭНИ «Грибоедов» должна в полной мере обеспечить потребности квалифицированного специалиста–филолога.

Информационная система ЭНИ обеспечивает:

· работу с полными текстами различных видов,

· использование развитой системы гипертекстовых и гипермедийных связей,

· различные способы навигации во всем информационном пространстве издания,

· эффективные информационные поиски как по произвольным словам (словосочетаниям), так и по различным формальным признакам,

· удобный пользовательский интерфейс
и другие возможности.

В качестве для реализации полнотекстового информационного была использована поисковая система «Яндекс». ЭНИ «Грибоедов» был рассчитан на эксплуатацию на IBM-совместимых персональных компьютерах, начиная с i486 в операционной среде Windows 3.х/95.

***

Подготовка ЭНИ «Пушкин» была приурочена к 200-летнему юбилею поэта. Оно охватывало все творческое наследие Пушкина, сопровождаемое научным комментарием, фундаментальную научную библиографию, наиболее значимые работы о его жизни и творчестве. В ЭНИ были представлены изобразительные материалы (портреты, рисунки, фотографии), а так-же факсимиле пушкинских рукописей. Общий объем информации составил более 20 тыс. печатных страниц текста, около 400 изобразительных материалов и примерно 40 тыс. библиографических описаний. Подготовка ЭНИ «Пушкин» имело принципиальное значение не только как одно из юбилейных мероприятий. Во-первых, это издание было беспрецедентно по охвату материала и средствам работы с ним и, во-вторых, оно должно было отразить уровень развития информационных технологий и их связь с гуманитарными науками и культурой в целом. ЭНИ «Пушкин» было сопоставимо с такими национальными электронными изданиями мирового значения как «Шекспир» (Великобритания), «Гете» (Германия).

Работы по подготовке этого издания проводились в рамках программы подготовки Пушкинского юбилея. В реализации проекта помимо НТЦ «Информрегистр» принимали участие ИМЛИ им. А.М.Горького РАН, РГГУ, РГБ и Центр ПИК. К работам были также привлечены компании «CompTek International» и «АНЕТ». Работы проводились в два этапа. На первом (завершение — май 1999 г.) подготовлена тиражируемая на CD-ROM версия электронного издания. На втором (завершение — декабрь 1999 г.) — подготовлена полная сетевая версия издания. Существенным отличием ЭНИ «Пушкин» от предыдущих разработок стала смена пользовательского интерфейса и изменение средств реализации некоторых функциональных возможностей. В информационной системе как в тиражируемом, так и в сетевом варианте стал использоваться стандартный браузер — MS Internet Explorer. Следует отметить, что эта замена привела к некоторому сокращению состава функциональных возможностей.

ЭНИ «Информ–норматив», «Библио–норматив»

ЭНИ «Информ–норматив» было предназначено для обеспечения информационных центров, разработчиков различных информационных и программных продуктов, а также средств вычислительной техники, для специалистов, занятых разработкой стандартов в области информатики и вычислительной техники, комплексной информацией в машиночитаемой форме об отечественных и международных нормативных документов.

Подготовка этого издания осуществлялось в 1996—97 гг. при участии ИПК «Издательство стандартов» и компании «CompTek International». При его создании в полной мере использовались все научно-технические и технологические решения, полученные к тому времени при подготовке ЭНИ «Грибоедов». В частности, в нем была использована также информационная система и поисковая машина «Яндекс». В результате функциональные возможности этого издания совпали с основными функциональные возможности ЭНИ «Грибоедов».

Информационная база состояла из четырех частей: стандарты, правовые документы, классификаторы и словари. Первая часть — стандарты, содержала около описания более 2.5 тыс. стандартов, в числе которых стандарты ISO, IEC, CCITT, национальные стандарты США, России и др. Из этого числа около 200 стандартов были представлены полными текстами. Вторая часть — правовые документы, включала около 500 нормативно–правовых актов: законов, указов, постановлений и др., принятых за десять предшествующих лет. Все нормативные акты были представлены полными текстами. Правовые документы были сгруппированы в следующие рубрики: Конституция и конституционные законы, Кодексы, Законы РФ, Акты Президента и Правительства РФ, законы и акты иных органов. Третью часть составили четыре классификационные системы, представленные своими фрагментами, действующими в области информатики и вычислительной техники: ГРНТИ (Государственный рубрикатор научно-технической информации), УДК (Универсальная десятичная классификация), ОКП (Общероссийский классификатор продукции), ОКС (Общероссийский классификатор стандартов). В четвертую группу вошли два словаря по информатике: словарь сокращений и терминологический словарь. Основным источником словарных статей являются терминологические стандарты и терминологические приложения к стандартам.

ЭНИ было тиражировано на CD-ROM в 1997 г. и находилось в коммерческом распространении.

***

После успешного распространения ЭНИ «Информ–норматив» в 2000 г. было принято решение о подготовке на его основе нового электронного издания. Это ЭНИ должно было отличаться от предшественника, во-первых, актуальностью информации и, во-вторых, некоторым изменением состава его потенциальных потребителей. Электронное издание, получившее название «Библио–норматив», было предназначено для специалистов в области научно–технической информации, библиотекарей и издателей. В связи с этим в новое издание не вошли стандарты, имеющие чисто техническую направленность, но были введены новые материалы, представляющие интерес для указанных категорий потенциальных читателей.

В программном обеспечении ЭНИ «Библио–норматив» были использованы результаты работ, полученные за годы прошедшие после выпуска предыдущего издания, в частности результаты работ по ЭНИ «Пушкин». Кроме того, был существенно изменен пользовательский интерфейс.

ЭНИ «Библио–норматив» подготавливалось совместно с ВИНИТИ. Оно было тиражировано на CD-ROM и распространялось с конца 2001 г.





sdamzavas.net - 2017 год. Все права принадлежат их авторам! В случае нарушение авторского права, обращайтесь по форме обратной связи...