Электронные коллекции в зоологии и электронные библиотеки
И.С. Смирнов, А.Л. Лобанов, О.Н. Пугачев, А.Ф. Алимов, Е.П. Воронина
Зоологический институт РАН
Аннотация
Создание электронных зоологических коллекций и развитие технологий электронных библиотек - во многом сопряженные процессы, хотя первоначально они были достаточно независимы. В статье делается попытка взглянуть на электронные коллекции в зоологии с точки зрения теории и практики электронных библиотек, найти некоторые точки соприкосновения, определить специфику электронных зоологических коллекций.
Работа по теме осуществляется частично при поддержке грантов РФФИ 05-07-90179-в, 05-07-90354-в и 06-04-08020-офи, проекта N11 «Исследование Антарктики. Проведение комплексного изучения антарктической биоты», Федеральной Программы «Мировой Океан» и программы «Биоразнообразие».
...........
Коллекционные базы данных
Если рассматривать зоологические коллекционные базы данных как наборы электронных документов или образов, то среди институтских разработок и проектов найдется немало заслуживающих внимания [21]. Причем все разработки представлены сегодня на веб-портале Зоологического института (http://www.zin.ru).
Это, во-первых, база данных по кольцеванию птиц (http://www.zin.ru/rybachy/ringing0.htm).
Создание компьютерной БД Биологической Станции «Рыбачий» (Балтийское море, Россия) началось в 1979 г. Теперь она содержит более чем 2 300 000 записей по окольцованным птицам, 113 000 записей по перелетным птицам и более чем 12 000 записей по возвратам птиц [19].
Во-вторых, ЗООИНТ – ЗООлогическая ИНТегрированная система - информационный проект-ветеран, который уже 5 раз поддерживался грантами Российского фонда фундаментальных исследований (РФФИ) в 1993, 1996, 1999, 2002 и 2005 годах [19, 22, 37]. Именно от него берут начало многие разработки сотрудников ЗИН в области таксономических баз данных [19, 31]. В 2005 г. разработка системы «ЗООИНТ» как основы электронной фондовой коллекции научного Интернет-музея получила поддержку РФФИ (проект 05-07-90354) (http://www.zin.ru/projects/zooint_r/index.html).
По мере развития отдельные аспекты концепции ЗООИНТ превратились в самостоятельные направления. Многолетняя работа над коллекционными БД дала целое дерево ответвлений. Центральный ствол представлен интегрированной системой ЗООИНТ. Одна из ветвей системы ЗООИНТ дала ИПС «ОКЕАН», которая коллективно используется и совершенствуется в лабораториях Морских исследований и Ихтиологии. Мощное ответвление представлено информационно-аналитической системой по мировой фауне блох PARHOST, развиваемой С.Г.Медведевым с коллегами (http://www.zin.ru/Animalia/Siphonaptera/index.htm). Другая ветвь системы ЗООИНТ развивается с участием А.Ф.Алимова и его коллег. Это ИПС INVADER, которая служит для накопления и анализа данных об организмах-вторженцах (http://www.zin.ru/rbic/).
Особое значение базы данных имеют в исследованиях, проводимых в Лаборатории систематики насекомых [19]. Эта Лаборатория имеет самую большую коллекцию в Институте - около 25 млн. единиц хранения, а объекты исследования ее сотрудников относятся к самому большому классу животных - насекомым, включающему более миллиона видов. Поэтому представить себе более или менее полную компьютеризацию сведений об этих коллекциях в настоящее время невозможно. Но разработки баз данных, ориентированных на коллекционные сведения, ведутся, и примером такого проекта может служить информационная система «ZInsecta», разрабатываемая В.А.Кривохатским с коллегами и включающая разнообразные авторские БД по иерархической классификации и коллекциям насекомых (http://www.zin.ru/projects/zinsecta/index.html).
Информационно-поисковая система «Океан» представляет собой первую в ЗИНе распределенную базу данных [19, 34, 39]. В Интернете ИПС «Океан» развивается на сайтах арктической и антарктической программ по биоразнообразию ArcOD (http://www.zin.ru/projects/arccoml/eng/index.html) и CAML (http://www.zin.ru/projects/ecoant/index.html). К вводу данных, осуществляемому в СУБД Fox-Pro for Windows, прибавились работы по миграции данных из формата Fox-Pro в формат MS SQL Server с одновременной тщательной стандартизацией полей и унификацией данных, созданием словарных таблиц. Организуется вывод данных по запросам в веб-интерфейсе на базе ASP-технологии пока в пределах институтского Интранета.
Электронные публикации и технология гипербаз данных
Среди компьютерных технологий определенное место занимают электронные публикации на компакт-дисках CD-ROM и в виде файлов на серверах сети Интернет [20]. Эти типы публикаций во многом превосходят традиционные бумажные - позволяют использовать большое число высококачественных цветных изображений, аудио- и видеофрагменты, интерактивные карты и т.п.
Первая серьезная электронная публикация на веб-портале ЗИН - интерактивный каталог коловраток пресных вод Северо-запада России [10], осуществленная В.С.Шестаковым. База данных включает сведения о 703 видах и разновидностях, относящихся к 94 родам и 26 семействам. Исследованиями авторов охвачены около 100 озер, более 70 рек, свыше 10 водохранилищ и другие водоемы.
В ЗИНе разработана концепция построения компьютерных зоологических руководств типа «Фауна России» и «Определители по фауне России» [6, 11-13, 15, 16, 24]. Эта концепция реализована в пакете программ, получившем название DIALOBIS (DIALOgue Biological Identification Systems). В полном объеме эта идеология и оригинальный пакет программ впервые на практике использованы немецкой фирмой «dialobis edition» для подготовки серии биологических изданий на лазерных дисках [14 и др.]. В основе этого подхода лежат: 1) использование иерархических классификаций как основы для всей информации на диске, а не как вспомогательного средства; 2) применение специальных средств для работы с многоуровневой иерархической классификацией, имеющей произвольное число любых таксономических уровней (представление ее в виде дерева, набора взаимосвязанных окон и т.п.); 3) использование в качестве определителя многовходового, полностью иллюстрированного политомического ключа с активным использованием иллюстраций к признакам; 4) использование для работы с данными по географическому распространению таксонов интерактивной карты, позволяющей не только синтезировать ареалы надвидовых таксонов любого заданного уровня, но и использовать карту для формирования запросов о наборе видов для произвольно выбранного региона; 5) применение для формирования и выполнения запросов к базе данных не обычных одноуровневых словарей, а многоуровневых тезаурусов, в которых отражены родо-видовые связи терминов; 6) новые методы работы с большими наборами высококачественных изображений организмов.
Функциональная основа DIALOBIS - многоаспектное представление об исходном наборе таксонов, который можно исследовать и редуцировать разными способами. Для этого используются специализированные прикладные программы, одновременно являющиеся инструментами исследования какого-то аспекта и фильтрами. Эти программы получают на входе набор таксонов (либо в виде копии исходного полного набора, либо как результат одной из предыдущих редукций, сам текущий набор или то его подмножество, которое проходит через все фильтры), а на выходе могут редуцировать его в соответствии с желанием пользователя. Такие действия отдельных программ не сразу влияют на состав текущего набора, а накапливаются в виде совокупности фильтров, информация о которых постоянно выводится на экран главной управляющей программой пакета. Такой пакет программ и управляемая им информация получили название - гипербаза данных. Гипербаза дает возможность пользователю с помощью отдельных шагов многоаспектного поиска активно конструировать требуемый для детального изучения массив данных. Широкое применение такой технологии позволяет создавать очень эффективные зоологические электронные руководства. С использованием базы данных по камбалообразным рыбам, разработанной Е.П.Ворониной, был подготовлен и опубликован каталог фондовой коллекции Зоологического института [7].
Информационная система «Биоразнообразие России»
В 2001 г. Институту удалось выиграть конкурс и заключить на два года контракт с Министерством промышленности и науки на разработку информационной системы по биоразнообразию России (http://www.zin.ru/BioDiv/) [33]. Соисполнителями стали Институт проблем экологии и эволюции РАН, Ботанический институт РАН и Институт цитологии и генетики СО РАН. Победе на конкурсе предшествовала почти тридцатилетняя история компьютеризации Зоологического института. Основной целью проекта «Информационная система по биоразнообразию» (ИСБР) было создание комплекса программных средств и БД для работы с классификацией животного и растительного мира, которые должны послужить основой формирования информационно-поисковой системы по биоразнообразию России, поддерживающей неоднородные коллекции распределенных информационных ресурсов, содержащих сведения систематического, коллекционного и экологического характера. Основные задачи ИСБР - разработка стандартов, форматов и методологии создания единой национальной распределенной БД по биологическому разнообразию в рамках российского сегмента глобальной сети Интернет, и создание пилотной информационной сети по видовому разнообразию России, объединяющей БД, поддерживаемые институтами-соисполнителями, по видовому составу всех таксонов (микроорганизмов, растений и животных) и данные о коллекциях, хранящиеся в этих учреждениях. Исходными данными для проведения работы стали результаты исследований структурных подразделений перечисленных выше институтов-соисполнителей в области биологии, в том числе уже созданный и частично опубликованный ими научный продукт в области систематики животных и растений.
Объектом наполнения БД проекта служили номенклатурные и таксономические данные о бактериях, простейших, грибах, растениях и животных, обитающих на территории России и сопредельных территориях. Общий объем сайта BIODIV (август 2006 г.) - 61 мегабайт (http://www.zin.ru/BioDiv/index.html).
В 2006 году проект «Разработка Всероссийской информационной системы по биоразнообрaзию животных в Интернете (ИСиБР)» получил поддержку РФФИ по конкурсу «Ориентированные фундаментальные исследования» на развитие зоологической составляющей ИПС, на базы данных, развиваемые и поддерживаемые в Зоологическом институте РАН.
В дальнейшем предполагается обеспечить весь имеющийся массив данных адекватной поисковой системой, завершить работу по наполнению главных ветвей классификатора животного мира, проиллюстрировать основные таксоны и перевести титульные страницы на английский язык.
За основу для классификатора животных принята оригинальная макросистема царства Animalia, разработанная специально для этого проекта профессором МГУ В.В.Малаховым. Особое место занимает изучение антарктических животных и растений, которое имеет важное геополитическое значение и благодаря которому особенно ощущается весомость вклада отечественных ученых в исследование биоразнообразия всей Земли. В процессе работы над проектом проводятся теоретические и прикладные исследования, а также разрабатываются и усовершенствуются прикладные программы, БД, информационные системы и Интернет-сайты по различным таксономическим группам живых организмов. Разрабатываемые информационные системы и базы данных будут способствовать решению многих фундаментальных научных, прикладных, образовательных и природоохранных задач, связанных с поддержанием и сохранением биологического разнообразия России.
.....
Заключение
Разными путями цифровые методики и технологии проникают в различные области, не только собственно зоологических исследований, но и в представление их результатов как в Интранете, так и в Интернете.
Использование новейших компьютерных технологий и методов приобретает в Зоологическом институте РАН все более широкие масштабы и, несомненно, будет способствовать повышению эффективности и достижению высокого научного уровня проводимых исследований, а также превращению коллекций, доступных в настоящее время только узким специалистам, в «общечеловеческое достояние».
Ссылки
[1] Алимов А.Ф. Компьютеризация биологического учреждения (на примере Зоологического института РАН) // Рысс А.Ю., Смирнов И.С. (ред.). Информационно-поисковые системы в зоологии и ботанике. Труды Зоологического института РАН, т. 278, Санкт-Петербург, 1999. С. 7, 8.
[2] Алимов А.Ф., Лобанов А.Л., Пугачев О.Н. Сравнительный анализ реляционного и сетевого подходов к созданию банков данных по систематике, экологии и географическому распространению животных // Журн. общ. биол. 1993. Т. 54, № 1. С. 96-103.
[3] Алимов А.Ф., Лобанов А.Л., Пугачев О.Н. Использование компьютерных технологий в Зоологическом институте РАН // Базы данных и компьютерная графика в зоологических исследованиях (Труды Зоологического института, т. 269). 1997. С. 11-15.
[4] Алимов А.Ф., Смирнов И.С., Рысс А.Ю., Дианов М.Б., Лобанов А.Л., Голиков А.А. Современные биологические электронные публикации: коллекции, идентификационные системы и базы данных // Информационные и телекоммуникационные ресурсы в зоологии и ботанике. Труды 2-го международного симпозиума. 2001. С. 13-19.
[5] Армс В. Электронные библиотеки. (перевод С.А.Арнаутова). ПИК ВИНИТИ, 2001. - 275 с.
[6] Дианов М.Б., Лобанов А.Л. PICKEY - Программа для определения организмов с интерактивным использованием изображений // В:Степаньянц,А.Лобанов, М.Дианов, ред., Базы данных и компьютерная графика в зоологических исследованиях // Труды Зоологического института РАН, 1997. Т. 269. С. 35-39.
[7] Каталог фондовой коллекции Зоологического института РАН. Класс Костистые рыбы (Osteichthyes). Отряд Камбалообразные (Pleuronectiformes) // Сост. Воронина Е.П., Волкова Г.А. Исследования фауны морей. Т. 55(63). - СПб., 2003. 198 с.
[8] Когаловский М.Р. Стандарты XML и электронные библиотеки // Электронные библиотеки, 6 (2). 2003.
http://www.elbib.ru/index.phtml?page=elbib/rus/journal/2003/part2/kogalovskii [9] Кривохатский В.А., Лобанов А.Л., Медведев Г.С., Белокобыльский С.А., Дианов М.Б., Смирнов И.С., Халиков Р.Г. Информационная система по энтомологическим коллекциям в Интернете // Труды Русского энтомологического общества, Т. 74, СПб., 2003: С. 59-70.
[10] Кутикова Л.А., Николаева И.П. Каталог видов коловраток (Rotifera) пресных вод Севера-Запада России // [Электрон. ресурс]. СПб, ЗИН РАН, 2002. (Рус.).
http://www.zin.ru/books/rotcatalog/default.asp [22 ноября 2006]
[11] Лобанов А.Л. Диалоговые компьютерные биологические диагностические системы BIKEY5 и BIKEY6 // В: Степаньянц, Лобанов, Дианов, ред., Базы данных и компьютерная графика в зоологических исследованиях // Труды Зоологического института РАН, Т. 269. 1997а. С. 61-65.
[12] Лобанов А.Л. Компьютерные определители в биологии: результаты 30-летней эволюции // Компьютерные базы данных в ботанических исследованиях. Сборник научных трудов. 1997б. С. 51-55.
[13] Лобанов А.Л. Компьютерные определители животных и растений: современное состояние и перспективы // В: Рысс, Смирнов, ред., Информационно-поисковые системы в зоологии и ботанике. Тезисы международного симпозиума, май 1999 // Труды Зоологического института РАН. Т. 278. 1999. С. 79-80.
[14] Лобанов А.Л., Дианов М.Б. Мир жуков ("Wir bestimmen Kaefer") - CD-ROM и краткое руководство. 1996. - Berlin: dialobis edition.
[15] Лобанов А.Л., Дианов М.Б. CD-ROM: новый инструмент изучения биологического разнообразия // Компьютерные базы данных в ботанических исследованиях. Сборник научных трудов. 1997. С. 55-57.
[16] Лобанов А.Л., Дианов М.Б. Комплекс программ для создания компьютерных зоологических монографий на компакт-дисках // Отчетная научная сессия по итогам работ 1997 г. Тезисы докладов. 1998. С. 27-28.
[17] Лобанов А.Л., Дианов М.Б. Средства мультимедиа в электронных зоологических и ботанических публикациях // Информационно-поисковые системы в зоологии и ботанике (Тезисы международного симпозиума, май 1999). Труды Зоологического института РАН. 1999. Vol. 278. P. 100.
[18] Лобанов А.Л., Рысс А.Ю. Компьютерные идентификационные системы в зоологии и ботанике: современное состояние и перспективы // Информационно-поисковые системы в зоологии и ботанике (Тезисы международного симпозиума, май 1999). Труды Зоологического института РАН. 1999. Vol. 278. P. 17-29.
[19] Лобанов А.Л., Смирнов И.С. Место и роль информационных технологий в исследованиях Зоологического института РАН // Фундаментальные зоологические исследования: Теория и методы. (По материалам Международной конференции «Юбилейные чтения, посвященные 170-летию Зоологического института РАН», 23-25 октября 2002 г.), М.-СПб.: Товарищество научных изданий КМК. 2004: 283-318 (резюме на англ. яз.).
[20] Лобанов А.Л., Дианов М.Б., Рысс А.Ю. Современные типы биологических электронных публикаций: CD-ROM и Internet // Информационно-поисковые системы в зоологии и ботанике (Тезисы международного симпозиума, май 1999). Труды Зоологического института РАН. 1999а. 278. С. 39-44.
[21] Лобанов А.Л., Дианов М.Б., Смирнов И.С. Результаты разработок и использования зоологических информационно-поисковых систем // Информационно-поисковые системы в зоологии и ботанике (Тезисы международного симпозиума, май 1999). Труды Зоологического института РАН. 1999б. 278. С. 54, 55.
[22] Лобанов А.Л., Смирнов И.С., Дианов М.Б. ZOOCOD - концепция представления зоологических иерархических классификаций в реляционных базах данных // Информационно-поисковые системы в зоологии и ботанике (Тезисы международного симпозиума, май 1999). Труды Зоологического института РАН. 1999в. 278. С. 65, 66.
[23] Лобанов А.Л., Смирнов И.С., Дианов М.Б., Алимов А.Ф., Кирейчук А.Г., Кривохатский В.А. Российские зоологические базы данных в Интернете // Научный сервис в сети ИНТЕРНЕТ: Труды Всероссийской научной конференции (23-28 сентября 2002 г., г. Новороссийск). 2002. С. 51-53.
[24] Смирнов И.С., Лобанов А.Л. Компьютерный определитель по офиурам как база данных для хранения таксономической информации // Бюллетень Московского общества испытателей природы (МОИП). Отд. геологии. Т. 72, Вып. 1. 1999. С. 87-88.
[25] Смирнов И.С., Рысс А.Ю. Биологические коллекции и базы данных // Рысс А.Ю., Смирнов И.С. (ред.). Информационно-поисковые системы в зоологии и ботанике // Труды Зоологического института РАН, Т. 278, Санкт-Петербург. 1999. С. 30-38.
[26] Смирнов И.С., Лобанов А.Л., Дианов М.Б. Зоологические виртуальные музеи // Научный сервис в сети Интернет. Тезисы докладов Всероссийской научной конференции (20-25 сентября 1999 г., г. Новороссийск), Изд-во Моск. ун-та, 1999а. С. 185-187.
[27] Смирнов И.С., Лобанов А.Л., Голиков А.А.., Дианов М.Б. Электронные зоологические коллекции // Электронные библиотеки: перспективные методы и технологии, электронные коллекции. Труды Первой Всероссийской научной конференции (19-22 октября 1999 г., г. С.-Петербург), Изд-во Санкт-Петербургского ун-та, 1999б. С. 236-240.
[28] Смирнов И.С., Лобанов А.Л., Алимов А.Ф., Голиков А.А.. От электронных коллекций к виртуальным коллективам зоологов в сети Интернет // Интернет и современное общество. Тезисы докладов II Всероссийской научно-методической конференции, (29 ноября-3 декабря 1999 г., г. Санкт-Петербург), Санкт-Петербург, 1999в. С 61-62.
[29] Смирнов И.С., Лобанов А.Л., Дианов М.Б., Голиков А.А., Алимов А.Ф. Зоологические виртуальные музеи: настоящее и будущее // Научный сервис в сети Интернет: Труды Всероссийской научной конференции (24-29 сентября 2001 г., г. Новороссийск). – М.: Изд-во МГУ, 2001. С. 22-24.
[30] Смирнов И.С., Лобанов А.Л., Дианов М.Б., Голиков А.А., Алимов А.Ф., Неелов А.В., Гаврило М.В. Создание информационно-поисковой системы по экологии бентоса и птиц Антарктики (ECOANT) на основе электронной коллекции беспозвоночных, рыб и птиц. «Электронные библиотеки: перспективные методы и технологии, электронные коллекции». Сборник докладов Третьей Всероссийской конференции RCDL’2001. Петрозаводск, 11-13 сентября 2001 г. – Карельский научный центр РАН, 2001. С. 197-198.
[31] Смирнов И.С., Лобанов А.Л., Алимов А.Ф., Медведев С.Г., Голиков А.А.. Итоги развития проекта ЗООИНТ и его дальнейшие перспективы // Электронные библиотеки: перспективные методы и технологии, электронные коллекции: Труды Четвертой Всероссийской научной конференции RCDL’2002, (Дубна, 15-17 октября 2002 г.). Дубна: ОИЯИ, 2002. Т. 2: 308-315.
[32] Смирнов И.С., Лобанов А.Л., Алимов А.Ф., Кривохатский В.А. Электронные коллекции Зоологического института РАН. Электронные библиотеки: перспективные методы и технологии, электронные коллекции: Труды Пятой Всероссийской научной конференции RCDL’2003, (Санкт-Петербург, 29-31 октября 2003 г.): – Санкт-Петербург: НИИ Химии СПбГУ, 2003: 275-278.
[33] Смирнов И.С., Лобанов А.Л., Алимов А.Ф., Пугачев О.Н., Кривохатский В.А.. Информационная система по биологическому разнообразию России // Научный сервис в сети ИНТЕРНЕТ: Труды Всероссийской научной конференции (22-27 сентября 2003 г., г. Новороссийск). – М.: Изд-во МГУ, 2003. С. 12-14.
[34] Смирнов И.С., Воронина Е.П., Лобанов А.Л., Голиков А.А., Неелов А.В. Создание информационно-поисковых систем по коллекциям морских животных (рыб и беспозвоночных) в Зоологическом институте РАН // Электронные библиотеки: перспективные методы и технологии, электронные коллекции: Труды Шестой Всероссийской научной конференции RCDL’2004, (Пущино, 29 сентября - 1 октября 2004 г.): – Москва, типография ООО «Мультипринт», 2004: 30-33.
[35] Современный словарь иностранных слов. М, «Русский язык». 1992. 740 с.
[36] Сюнтюренко О.В. Информационное общество и информатизация науки. Вестник РФФИ, 3(17), 1999. С. 4-8.
[37] Соколов Е.П., Смирнов И.С., Лобанов А.Л. Интегрированная система ZOOINT для ведения и использования зоологических баз данных // Степаньянц С.Д., Лобанов А.Л., Дианов М.Б. (ред.). Базы данных и компьютерная графика в зоологических исследованиях // Труды Зоологического института РАН, Т. 269. 1997. С. 136-144.
[38] Тирас Х.П., Жукова Д.В., Ильясов Э.Ф. Виртуальные коллекции планарий // Рысс А.Ю., Минтер Д. (ред.). Информационные и телекоммуникационные ресурсы в зоологии и ботанике. Тезисы 2-го международного симпозиума. СПб. 2001. C. 120.
[39] Smirnov I.S., Voronina E.P., Lobanov A.L., Neyelov A.V. The information system of the marine animals collection (fish and invertebrates) in the Zoological Institute Russian Academy of Sciences // Ocean Biodiversity Informatics. International Conference on Marine Biodiversity Data Management. Hamburg, Germany: 29/11-1/12/2004, 2004. p. 27.
[40] Ocean Biodiversity Informatics International Conference on Marine Biodiversity Data Management Hamburg, Germany: 29 November to 1 December 2004. (Engl.).
http://www.vliz.be/obi/ [22 November 2006]
--------------------------------------------------------------------------------
Об авторах
Игорь Сергеевич Смирнов - ст. н. с, Зоологический институт РАН,
http://www.zin.ru/Animalia/Coleoptera/rus/smiris.htm,
E-mail: smiris@zin.ru
Андрей Львович Лобанов - вед. н. с., Зоологический институт РАН,
http://www.zin.ru/Animalia/Coleoptera/rus/lobanov.htm,
E-mail: all@zin.ru
Олег Николаевич Пугачев - директор, Зоологический институт РАН,
http://www.zin.ru/labs/worms/rus/persons/pugachev/pugachev_r.htm,
E-mail: director@zin.ru
Александр Федорович Алимов - зав. лабораторией, Зоологический институт РАН,
http://www.zin.ru/labs/freshwater/staff_main.htm,
E-mail: Alimov@zin.ru
Елена Петровна Воронина - ст. н. с., Зоологический институт РАН,
E-mail: voron@zin.ru
=====
http://www.elbib.ru/index.phtml?page=elbib/rus/journal/2006/part4/SLPAV