Компьютеризация палеонтологии. Используемые в палеонтологии системы кодирования.

 

ПАЛЕОНТОЛОГИЯ

 

 

Палеонтология и математика. Компьютеризация палеонтологии. Используемые в палеонтологии системы кодирования

 

Формализация, математизация и применение ЭВМ в палеонтологии

Развитие математических и математико-логических методов в палеонтологии теснейшим образом связано с историей использования аналогичных методов биологией, геологией и другими областями естествознания. Рассматривая эту историю в целом, можно подразделить ее на три больших этапа [773].

Первый этап охватывает время с начала прошлого, столетия до начала девяностых годов. Его можно назвать этапом стихийного развития логических методов. Математика в традиционном понимании этого термина в ту пору еще не вошла в практику палеонтологических и стратиграфических исследований. Однако быстрое развитие биологических наук, в том числе палеобиологии, вызвало необходимость установления соглашений о содержании понятий, разработки формальных языков, унификации схем описаний и стандартизации форм представления результатов.

В этот период создаются системы таксономических признаков, предлагаются диагностические ключи, формы табличного представления данных и различные способы кодирования морфологических характеристик древних организмов (например, формальные описания замочного аппарата моллюсков, зубные формулы и т. п.), вводятся стандартные системы измерений и отношений морфологических параметров. В этом плане исследователями XIX в. сделано очень многое, причем немалое число рекомендаций полностью сохраняет свое значение и сейчас, когда палеонтология вновь требует повышения строгости методов исследования.

Началом второго этапа можно условно считать 1894 г., когда в Лондоне в философских трудах Королевского общества вышел сборник работ Карла Пирсона под названием "Вопросы математической теории эволюции". В этих работах, во многом основанных на палеонтологическом материале, рассматривается ряд математических методов, которые могут и сегодня представить интерес для палеобиометрии. Вслед за тем на протяжении более 30 лет К. Пирсон и его последователи опубликовали ряд статей по вопросам применения математической статистики к изучению объектов органического мира. Именно в это время было предложено, например, использование в палеонтологии анализа значений средних, коэффициента вариации, критерия Стьюдента и др. Существенной вехой на пути внедрения статистико-биометрических методов явился выход в свет в 1939 г. первого издания учебника Дж. Г. Симпсона и А. Роя "Количественная зоология", после которого количество и качество работ с использованием математики значительно возросло.

Одновременно с прогрессом вычислительных методов данный этап характеризуется новыми успехами в развитии формальнологического подхода. Уже в 1900 г. научный мир принял учение о наследственности, дорогу которому проложили представленные еще в середине прошлого века гениально простые математические доказательства Г. Менделя. Продолжаются работы по кодированию и формализации понятий. В их числе можно назвать, например, проведенные в начале века исследования С. Бакмена, предложившего для аммоноидей непозиционный аббревиатурный код, передающий форму оборотов, различные типы умбо, характер скульптурных образований и т. п.; буквенный код Б. К. Лихарева для обозначения морфологических признаков брахиопод [838]; создание различных синоптических таблиц.

Обработка формализованного исходного материала позволила значительно пересмотреть сущность явлений эволюции. И неслучайно, что почти одновременно с учебником по биометрии (в 1940 г.) появляется "Новая систематика" Дж. Гексли.

В конце 40-х годов во всех областях естествознания вновь начинают сравнительно широко применяться статистические методы. И палеонтология, стоящая на стыке наук об органическом и неорганическом мире, испытывает ощутимое влияние данного процесса. В это время все отчетливее проявляется, что вероятностно-статистические методы способствуют главным образом прогрессу в изучении видов и внутривидовых категорий и не находят эффективного применения при изучении высших таксонов. Это можно объяснить непригодностью классического аппарата статистики для исследования высших таксономических категорий, что в свою очередь вызвало необходимость поиска новых методов, в частности более широкого применения логического анализа. Круг вопросов, связанных с привлечением формально-логических методов, был в общей форме рассмотрен в эти годы И. И. Шмальгаузеном и Б. Реншем, а несколько позднее, в 1953 г. - Дж. Г. Симпсоном.

На грани 40-х и 50-х годов начинается новый этап внедрения математики в естественнонаучные дисциплины, в том числе и в палеонтологию, связанный со вступлением в строй быстродействующей электронно-вычислительной техники.

В настоящее время очевидно, что постоянная интенсификация геологических работ требует оперативного решения ряда вопросов, которое не может быть осуществлено без применения в палеонтологических исследованиях комплекса точных и строго формализованных, в частности математических методов. Непрерывный рост объема палеонтологической информации приводит к тому, что без помощи математических методов невозможна оперативная диагностика массовых органических остатков, затруднена реконструкция палеоклиматических обстановок (особенно в метаморфизованных толщах), сложна корреляция осадочных образований, чрезвычайно затруднительно достижение соглашений о единообразном понимании объема таксонов и т. д. В связи с этим математические методы с каждым годом все шире проникают в теорию и практику палеонтологии.

Можно назвать три основные задачи, решению которых призвана содействовать математизация палеонтологии:

1) сведение к минимуму субъективного элемента в работе палеонтолога;

2) минимизация влияния объективной случайности (неполноты материала, неполной сохранности и т. п.) на характер и повышение надежности палеонтологических выводов и заключений;

3) сокращение затрат времени на определительскую работу.

Решение этих задач осуществляется различными путями. Выделяются четыре главнейших взаимосвязанных направления, по которым в настоящее время происходит математизация палеонтологии и биостратиграфии [774].

Первое из этих направлений включает изучение главным образом количественных признаков древних организмов. Применяемые здесь методы предусматривают использование математического аппарата при обработке числовых результатов наблюдений. Сюда относится прежде всего биометрия, основанная главным образом на теории вероятностей и математической статистике. В нашей стране работы этого плана были начаты в 1914 г. исследованием Д. В. Наливкина [726] и в последние годы находят большое применение в палеонтологии.

Использование биометрических методов способствует получению четкой цифровой характеристики видовых признаков, установлению закономерностей изменчивости морфологических параметров, позволяет выяснить наличие и оценить корреляционные связи между признаками, осуществить выявление характеристик, имеющих таксономическое значение для систематических категорий различного ранга.

Математико-статистические количественные методы особенно эффективны при изучении массового материала (микрофауны, миоспор и т. п.). Установление пределов индивидуальной, экологической и географической изменчивости древних организмов, а также изменчивости, обусловленной половым диморфизмом, цикловым полиморфизмом и стадийностью развития, позволяет перейти к обоснованию закономерностей распространения таксонов во времени и пространстве. Решение этого круга вопросов предоставляет возможность использования результатов математической обработки палеонтологического материала в биостратиграфических целях - при выявлении экологических ассоциаций и их связей со средой обитания, а также при палеогеографических реконструкциях, расчленении разрезов и стратиграфической корреляции палеонтологически охарактеризованных отложений.

Применение биометрических методов в большинстве случаев требует знания генетической связи между признаками, и для представительного и надежного использования этих методов в палеонтологии необходим биологический анализ палеонтологического материала.

Современная палеонтология включила в свой актив практически весь аппарат математической статистики [693, 822, 880]. Имеющийся положительный опыт внедрения этого класса методов свидетельствует, что использование алгоритмов и программ решения типовых задач во много раз ускоряет процедуру выявления эмпирических закономерностей, обеспечивает комплексный анализ значительного объема данных. Это позволяет извлекать больше полезной информации.

Наряду с классическим аппаратом математической статистики (дисперсионный, корреляционный и регрессионный анализ, теория функций распределения и т. д.) в последние годы все шире применяется совокупность эвристических методов, позволяющих, в частности, использовать достижения математической логики. Первое место среди них занимают алгоритмы, основанные на разработках в области теории распознавания образов. Их использование может дать полезные результаты при решении таких повседневных задач палеонтолога-практика, как диагностика и классификация палеонтологических объектов, в том числе при условии их неполной сохранности.

В некоторой мере самостоятельное положение среди количественных методов занимают методы аналитической геометрии, продуктивно используемые при изучении морфологических признаков древних организмов - аммоноидей, брахиопод, остракод и других [2123], а также методы проективной геометрии, применяющиеся при контроле корреляции осадочных толщ [776].

Второе направление, в плане которого совершается внедрение математики в палеонтологию и биостратиграфию, заключается в исследовании преимущественно качественных характеристик изучаемых объектов.

Исследование качественных соотношений между признаками, установление логических связей и определение систематического значения неколичественных понятий лежит, как известно, в основе классического сравнительно-описательного метода палеонтологии. Однако с учетом того обильного материала, который накоплен к настоящему времени во всех областях палеонтологической науки, необходимо по-новому взглянуть на характер качественных особенностей палеонтологических объектов, осуществить формализацию существующих понятий и перевод их на язык, исключающий возможность субъективной трактовки содержания.

Подобная работа приобретает огромное значение еще и потому, что она должна обеспечить унификацию палеонтологической терминологии и стандартизацию труда палеонтолога по определению и описанию органических остатков, что, в свою очередь, является естественным и необходимым шагом к автоматизированной обработке палеонтологического материала. Эта задача составляется из нескольких частных заданий:

а) унификации и упорядочения морфологической терминологии;

б) унификации схем описания различных групп организмов;

в) разработки и внедрения в практику систем кодовых обозначений морфологических признаков, включая использование специализированных символов, формул и т. п.

Один аспект этой работы предполагает создание формализованных описаний и определителей для различных групп животных и растений и создание систем кодирования признаков, обеспечивающих возможность обработки материалов на электронно-вычислительных машинах, а также с помощью средств малой и средней механизации документального поиска [1132].

Другой аспект охватывает систематическую обработку формализованного материала. Он включает в себя также разработку основ общей теории кодирования систематических признаков и теории классификации с широким использованием символической логики, методов формально-логического и информационного анализа, прикладной кибернетики. В результате будет возможно корректное выявление иерархического соподчинения таксонов, построение и контроль филогенетических гипотез, а также максимальная объективизация результатов классификации и диагностики [4, 772].

Многочисленные используемые в палеонтологии системы кодирования можно подразделить на две группы - позиционные и непозиционные.

В непозиционных системах кодирования каждый признак обозначается самостоятельным знаком. Количество знаков практически неограничено и зависит лишь от числа признаков, рассматриваемых в данной системе. В позиционных системах имеет значение не только форма знака, но и его место (позиция) в кодовой записи. Типы кодирования могут быть различными и представлять собой переходные формы от непозиционного к позиционному.

Первые системы кодирования, примененные в биологии, были построены на непозиционном принципе. Одна из таких систем, использовавшая обозначение доминантных признаков прописными, а рецессивных - строчными буквами латинского алфавита, была предложена Г. Менделем [672]. Из работ палеонтологического направления можно назвать диагностическую схему Б. К. Лихарева [1883], предложившего для брахиопод подсемейства Orthotetinae буквенные обозначения признаков, причем понятия "примитивность", "кратность", "отсутствие" передавались строчными буквами, а "усложненность", "протяженность", "наличие"- прописными. На непозиционном принципе основывалось также кодирование некоторых морфологических элементов раковины аммоноидей и обозначения элементов крыла насекомых.

Переходный к позиционному тип кодирования издавна использовался в различных формулах зубного аппарата двустворчатых моллюсков и при описании зубного аппарата млекопитающих.

Непозиционные системы кодирования представляют удобство при работе с ограниченным числом признаков, а также в тех случаях, когда должна быть выполнена обработка числа объектов. Эмпирически устанавливается, что оптимальное число признаков, оправдывающее применение непозиционных систем, не должно превышать пяти - семи при количестве объектов менее 100.

В случае большого количества признаков и наличия массового материала расширение объема кодового алфавита и увеличение объема кодовых слоев вызывает существенные трудности в работе палеонтолога. Кроме того, непозиционные системы неудобны для представления информации в виде, пригодном для обработки как средствами малой механизации, так и на ЭВМ и требуют предварительного перекодирования в позиционном коде.

Позиционные системы предопределяют ограниченный объем кодового алфавита и обеспечивают пригодность кодированной информации для машинной обработки. С этой точки зрения они имеют явное преимущество перед непозиционными системами. При малом числе признаков (и визуальной обработке данных) обнаруживается меньшая наглядность записанной в позиционном коде характеристики объектов. Однако при сравнительном анализе массового материала число ошибок исследователя существенно уменьшается в случае работы с позиционными кодами. Кроме того, при увеличении объема кодовых слов, вызванном возрастанием количества исследуемых признаков, имеется возможность сделать кодовое описание более компактным за счет введения групповых признаков. Последние представляют собой комплекс элементарных характеристик, рассматриваемых совместно в качестве одного признака, и в этом отношении идентичны "искусственным" признакам К. Линнея [1885].

Таким образом, если принять, что основными требованиями к палеонтологическим кодам являются обеспечение максимальной надежности в работе специалиста-палеонтолога, максимальная емкость кода, компактность описания и пригодность кодовой записи палеонтологических данных для последующей информационно-логической и статистической обработки, можно признать, что более удобны позиционные системы.

В качестве знаков кодового алфавита могут использоваться различные типы символов. В соответствии с этим различаются цифровое, буквенное, геометрическое и цветовое кодирование [1123].

Цифровое кодирование оптимально при решении задач опознавания, счета, сравнения и контроля данных, что определяет предпочтительность использования этих кодов при кодировании морфологических признаков древних организмов. Следующее место по эффективности при опознавании занимают буквенные коды. Цветовое кодирование наиболее эффективно при определении местонахождения объекта на плоскости. По-видимому, целесообразно более широко использовать его для изображения ареалов на палеобиографических картах в сочетании с применяемыми в настоящее время буквенно-цифровыми индексами [1213]. Геометрический код был успешно использован в палеонтологии Г. Потонье [2099] при создании системы диагностики спор и пыльцы в рамках формальной классификации, однако он затрудняет ввод информации в ЭВМ.

Цветовое кодирование (моно- и полихроматическое) употребляется в палеонтологической литературе весьма ограниченно. Полихроматические коды используются исключительно в картографических работах (палеобиогеография), монохроматические коды (черные знаки на белом фоне или наоборот) обычно применяются в дополнение к геометрическому или пространственному кодированию.

Использование смешанных кодов, состоящих из комбинаций символов различных типов, неизбежно вызывает возрастание числа ошибок при декодировании [492] и также затрудняет подготовку информации к машинной обработке. Применение таких методов допустимо лишь при малом числе признаков и небольшом количестве исследуемых объектов.

Решение задач диагностики палеонтологических объектов предполагает использование различных специализированных ключей, представляющих собой совокупность упорядоченных признаков и набор правил, предписывающих определенную последовательность выполнения логических операций. Иногда "ключами" называются и сами определители.

Различаются три основных типа ключей: монотомические (линейные), дихотомические и политомические.

Монотомические - наиболее примитивные - ключи строятся на принципе простого перечисления. Линейная диагностическая схема обычно представляет собой перечень признаков, характерных для каждого из таксонов рассматриваемой группы организмов. Наибольшую популярность у практиков находят линейные ключи, предназначенные для диагностики видов и внутривидовых категорий. При этом во главу угла обычно ставятся специфические, т. е. характерные для того или иного таксона признаки. Существенным преимуществом монотомических ключей является их простота. Группы признаков (и таксоны соответственно) могут располагаться в ключе в любой последовательности (таксономической, возрастной, алфавитной и др.). Это позволяет неограниченно расширять объем определителя по мере включения в него новых таксонов. Недостаток линейных ключей - их чрезвычайная громоздкость. Для достоверной диагностики необходим просмотр всего текста определителя, что обусловливает малую оперативность работы с ключами подобного типа.

Большинство диагностических алгоритмов (и палеонтологических определителей) строится в настоящее время по дихотомическому принципу. Дихотомический ключ представляет собой широко известный прием установления характеристики исследуемого объекта по парам взаимоисключающих характеристик, сгруппированных по признаку их альтернативности (тезы и антитезы). Дихотомические ключи удобны при наличии небольшого количества диагностических признаков и для определения групп объектов, объем которых постоянно остается стабильным. При этом обязательным условием является полная сохранность исследуемого материала. Очевидно, что в работе палеонтолога все эти требования могут быть выполнены крайне редко. Обилие признаков создает весьма сложное сплетение тез и антитез, громоздкость которого возрастает по мере накопления сведений о видах, включаемых в определитель. Ошибки, нередко возникающие в результате недостаточной формализации признаков, при дихотомическом методе определения складываются и усиливают искажение конечного результата.

С практической точки зрения наибольшее удобство для диагностики ископаемого материала может представлять ключ, разрешающий фиксировать реально наблюдаемые признаки с учетом наиболее полного комплекса морфологических особенностей объектов таким образом, чтобы отсутствие одного или нескольких признаков (например, вследствие неполной сохранности материала) не нарушало хода определения. Известные перспективы в этом отношении открывает применение политомических ключей [44, 45].

Политомический ключ (термин введен в 1960 г. Б. Е. Балковским) предполагает отказ от традиционных тез и антитез и осуществление диагностики по совокупности комбинаций признаков. Использование политомических ключей при условии цифрового кодирования признаков разрешает унифицировать описание палеонтологического материала, обеспечивает возможность его математической обработки и позволяет применить в практике палеонтологических исследований стандартные типы носителей информации (бланки, перфокарты и т. п.), что, в свою очередь, создает предпосылки к использованию электронно-вычислительной техники. Политомические ключи упрощают процедуру сравнения таксонов, установления сходств и различий между ними, облегчают выявление синонимов и гомонимов. Преимущества политомических ключей (по сравнению с дихотомическими) - значительно меньшее число поисковых ходов, позволяющих установить таксономическую принадлежность исследуемого объекта; возможность расширения определителя без его перестройки (новые кодовые слова могут включаться в диагностическую таблицу в произвольном порядке); высокая надежность работы определителя (в том числе при отсутствии на изучаемом образце части признаков).

Проекты ключей с использованием принципа политомии известны в геологии и биологии, по крайней мере, с начала XX столетия (синоптические таблицы), однако основные элементы подобного ключа мы находим еще у К. Линнея и немецких ботаников прошлого века. В первых образцах ключей этого типа признаки представлялись в текстовой форме. Использование цифрового кодирования признаков в сочетании с политомическим методом было предложено в 1947 г. Б. Е. Балковским и впоследствии развивалось в работах ряда исследователей. Большое значение сыграли работы биологов кишиневской школы [489, 490] и палеонтологов ВСЕГЕИ, посвященные конкретным приложениям метода.

Подготовительная работа к созданию политомического кода заключается в унификации и упорядочении морфологической терминологии. Каждое понятие, обозначаемое некоторым термином, должно быть формализовано, т. е. определено настолько четко, чтобы любой исследователь, пользующийся принимаемой схемой описания, мог понимать данный термин однозначно. Затем составляется полный перечень признаков, подлежащих кодированию. Объектами кодирования могут быть морфологические элементы, взаимоотношения между ними, их размеры, качественные характеристики и др. Можно включать в код также данные о синонимике, стратиграфической приуроченности вида, ареалах его распространения и экологии.

На следующем этапе строится позиционная шкала, вертикальные графы которой соответствуют признакам палеонтологических объектов. Горизонтальные графы (строки) предназначаются для записи кода и наименований таксонов. Расположение таксонов в горизонтальных рядах может быть произвольным. Удобно, например, располагать кодируемые объекты либо в систематической последовательности, либо в алфавитном порядке их латинских наименований.

Если политомическую таблицу предполагается в дальнейшем использовать в качестве определителя, то целесообразно расположить материал в порядке возрастания цифровых значений признаков таким образом, чтобы кодовые слова, будучи прочтены как многозначные числа, располагались в порядке возрастания их величин.

Полное совпадение кодового слова, характеризующего диагностируемый объект, с некоторой строкой таблицы однозначно указывает на принадлежность данного объекта к соответствующему таксону.

Обычно диагностика возможна и в тех случаях, когда на ископаемом материале некоторые признаки не сохранились. Нередко это осуществимо благодаря наличию у палеонтологических объектов специфических признаков, т. е. признаков, свойственных исключительно тому или иному таксону. При отсутствии специфических признаков представляется возможным выявить выборку, составленную из всех видов, охарактеризованных комплексом признаков, которые наблюдаются на данном диагностируемом объекте. Как показывает практика, объем этой выборки обычно мал и позволяет установить принадлежность данного объекта к одному из таксонов более высокого ранга, а иногда сокращает вероятное число таксономических подразделений, к которым может принадлежать этот объект, до нескольких единиц.

Цифровое кодирование может быть использовано для преобразования определителей, основанных на монотомическом принципе, в политомические таблицы, а также для представления текстовых описаний в формализованной компактной форме (свертка информации).

Создание полных кодовых описаний определенной группы палеонтологических объектов обычно сопряжено с необходимостью уточнения характеристик кодируемых таксонов. Решение этой задачи осуществимо путем логического сложения значений по каждому из столбцов (вертикальных граф) политомической таблицы. При этом в роли слагаемых выступают кодовые описания объектов предыдущего таксономического ранга (например, виды - для подродов и родов; подроды и секции - для родов; роды - для семейств и т. д.). Признаки отдельных особей древних организмов могут использоваться для суммарной характеристики видов. Полученная в результате этой операции логическая сумма признаков может рассматриваться в качестве уточненной характеристики таксона.

Третье направление математизации палеонтологии охватывает задачи, связанные с моделированием палеобиологических систем, реконструкцией процессов, имевших место в ходе онто- и филогенетического развития древних организмов, а также в процессе изменения среды их обитания.

При моделировании палеобиологических систем, тесно связанном с решением задач палеонтологической классификации, как правило, возникает необходимость оценки степени сходства исследуемых объектов по определенным заданным критериям или их совокупности. В качестве критериев подобной оценки могут использоваться различные меры морфологического сходства или различия ("таксономические расстояния"), а также показатели интенсивности связей между объектами и их признаками.

Самостоятельную проблему составляет выбор классификационных порогов [769].

Для решения задач рассматриваемого класса обычно используются интерационные (многошаговые) классификационные алгоритмы, позволяющие устанавливать синонимию, состав и иерархию таксономического соподчинения исследуемой группы палеонтологических объектов, а также выявлять количество таксономических уровней, имеющих место в данной классификационной системе. Так, положительные результаты при обработке палеонтологического материала получены с помощью алгоритма "Таксон-2".

Палеобиологическое значение выделяемых таксономических единиц может быть установлено палеонтологом традиционным путем.

Широкие возможности применения математических методов открываются при проведении работ по ревизии таксономических группировок [2302]. В общем виде задача ревизии сводится к построению модели иерархической системы, минимизирующей влияние субъективного подхода к материалу. В целом методика построения такой модели системы близка к обще классификационной [318]. Однако в данном случае имеется ряд специфических особенностей, обусловленных значительной неоднородностью исходного материала, дающих о себе знать, в частности, в начальном этапе выявления связей, характерных для систематических единиц, состоящих из ряда таксонов более низкого ранга (например, получение обобщенной картины связей для вида на материале по исследованным популяциям; установление характеристик надвидовых категорий по результатам исследований вида и т. п.). В подобных случаях применение аппарата корреляции к обобщенным выборкам, составленным из представителей разных групп (популяций, подвидов и т. п.), может привести к заведомо неверным результатам [1080]. При этом для получения обобщенной характеристики связей, свойственных таксону, может быть использован метод поэлементного сравнения корреляционных матриц [770].

Итерационные алгоритмы в применении к объектам, охарактеризованным морфологическими признаками, предназначены, в общем, для построения классификаций генетического типа. Однако, в силу многократного учета свойств, определяемых уровнями сходства различных порядков, они позволяют косвенным образом учесть систему связей (как между самими объектами, так и между их признаками), которая в ряде случаев, по-видимому, может быть интерпретирована как филогенетическая. Во всяком случае, они вполне могут использоваться на первом этапе изучения филогении, в частности при решении задач, связанных с выявлением распределения генетических связей во времени.

При этом допустимо задать некоторые априорные ограничения, заведомо известные исследователю. Это могут быть достоверно установленные родственные отношения между таксонами и, наоборот, система "запрещенных" связей между признаками. С учетом подобной информации позволяют работать, например, алгоритм "Дендрограф" [138] и его модификации.

Комплекс классификационных методов может быть использован также при алгоритмизации процедур биогеографического картирования [771]. В качестве исходного материала в этом случае используются таблицы распространения представителей таксонов. Группы районов, полученные на различных циклах классификации, могут быть интерпретированы как биогеографические единицы различного порядка (например, области, провинции, зоны и т. д.). Решение задачи картирования идентично в таком случае построению энкапсиса этих групп.

Кроме того, исследование фактических значений мер сходства, осуществимое, например, с помощью методов, основанных на теории графов, позволяет выявлять экологические барьеры, препятствовавшие расселению организмов. Нанесение соответствующих барьеров на карты древних акваторий позволяет проверять гипотезы о возможном направлении палеотечений, наличии или отсутствии континентальных преград и т. д.

В качестве сопоставляемых объектов могут быть взяты не районы, а таксоны. Тогда в результате классификации будут получены географические группы таксонов, в известной мере отражающие экологию исследуемой группы фауны. Дендрограммы сходства могут быть использованы при установлении зависимости между биоценозами и характером седиментогенеза, выявлении викариирующих таксонов, реконструкции путей миграции фауны и т. п.

Многошаговые логические методы классификации, наряду со статистическими, могут быть использованы и в тех случаях, когда в качестве единиц исследования принимаются некоторые элементарные подразделения стратиграфического разреза, охарактеризованные наличием определенных органических остатков. В качестве элементарных единиц разреза могут приниматься любые его подразделения - лито-, ритмо-, климатостратиграфические и т. п., либо абстрактные отрезки мощности, которым не придается иного содержания, кроме их палеонтологической характеристики. При этом предъявляется единственное требование - все рассматриваемые элементарные единицы должны быть соизмеримы и выделены по единообразному принципу [1014].

Наиболее надежны результаты, полученные на основе анализа распределения какой-либо одной группы органических остатков. Обобщенные выводы для нескольких групп организмов могут быть получены суперпозицией результатов частных классификаций. Количество классификационных циклов, в результате которых была сформирована дендрограмма (шкала соподчинения биостратиграфических единиц), может свидетельствовать о числе биостратиграфических уровней, подлежащих выделению в исследуемом разрезе. Вопрос о таксономическом ранге полученных группировок должен, как и в других случаях, решаться традиционными методами.

Построение стохастических и детерминированных моделей изучаемых процессов позволяет воссоздавать тенденции эволюции и исследовать закономерности их пространственно-временной динамики. Функциональный подход к изучению древних организмов, в частности в отношении установления динамики связей организма и отдельных его элементарных признаков со средой, позволяет выявлять закономерности становления палеогеографических обстановок прошлого и специфики формирования геологических тел, формаций и фациальных образований.

Четвертое направление внедрения математических, информационных методов и ЭВМ в палеонтологию состоит в оптимизации процессов сбора, хранения, поиска и обработки палеонтологической информации. Теоретическое обоснование решения этих задач предполагает, в частности, широкое использование методов теоретической информатики и средств технической документалистики [4].

Ближайшие задачи этого направления - работы по унификации и упорядочению терминологии и схем описания палеонтологических объектов, а также теоретическое обоснование выбора форм носителей информации, наилучшим образом отвечающих целевому назначению конкретных палеонтологических работ. Разработка формализованных языков, обеспечивающих сравнимость описаний, выполненных различными исследователями, использование при характеристике признаков определенных систем символов и формул, а также создание и внедрение в практику палеонтологии стандартных монограмм, палеток и других эталонизирующих приспособлений, без сомнения, будет также способствовать дальнейшему повышению строгости результатов палеонтологического исследования.

В тех случаях, когда палеонтологическое описание создается преимущественно в целях диагностики, в качестве возможного носителя информации могут быть рекомендованы перфокарты [775]. В настоящее время большинство картотек представляет собой информационно-поисковые системы, обеспечивающие лишь удобство поиска данных. При необходимости математической обработки материала неизбежно требуется перекодирование всех сведений, заключенных в картотеке, что не всегда осуществимо. Поэтому созданию любой перфокартотеки должно предшествовать составление политомических таблиц, которые должны храниться в качестве эталона исходных данных, а при необходимости использоваться для контроля (например, при утрате отдельных карт). Применение неперфорированных картотек (за исключением оптических суперпозиционных карт), как показывает практика, не оправдывает себя в многоаспектных и больших по объему системах.

При значительном объеме материала и частом обращении к массивам исходных данных политомические системы целесообразно переводить на машинный метод обработки. В качестве накопителя могут использоваться политомические таблицы, записанные на любом из машинных носителей информации, - перфокартах, перфоленте, магнитных лентах или дисках.

Цифровые кодовые языки позволяют предельно сократить объем и повысить емкость палеонтологического описания. При этом они обеспечивают сравнимость описываемых объектов и предоставляют палеонтологический материал в форме, пригодной для математической и формально-логической обработки. Надежность цифровых описаний значительно выше, чем словесных, и, вероятно, в будущем они приобретут большое значение в палеонтологии. Во всяком случае, бесспорную пользу принесет использование цифровых кодов параллельно со словесными характеристиками палеонтологических объектов.

Политомический принцип кодирования предопределяет желательность использования информационно-поискового языка позиционного типа. Не исключена, однако, возможность применения языков фасетного типа.

Существенную помощь в практической работе палеонтолога могут оказать также дескрипторные информационно-поисковые языки, создаваемые с целью документального и фактографического поиска в непозиционных системах. Необходимо при этом подчеркнуть, что подобные информационно-поисковые системы, создаваемые обычно на базе отделов научно-технической информации и библиотек, будут эффективны, если в их разработке примут участие опытные палеонтологи.

В том случае, когда в состав исходной информации введены сведения о стратиграфическом распространении, географической привязке, фациальной приуроченности, а также данные о голотипе, авторе, годе и месте публикации таксонов, система может быть использована в качестве справочной фактодокументографической, позволяющей отвечать на поисковые запросы, касающиеся синонимики, и проводить многоаспектный поиск по вопросам экологии, возрастного и территориального распределения определенных групп фауны.

Наличие в системе сведений о морфологических признаках древних организмов и их изменчивости позволяет выполнить серию биометрических исследований, оперирующих как количественными, так и качественными характеристиками. При этом может быть использован комплекс соответствующих алгоритмов и программ, имеющихся в распоряжении тех центров, где реализуется система.

Палеонтологическая картотека (например, на уровне видов), включающая полное описание таксонов и данные об их распространении, будучи введена в память ЭВМ, позволяет автоматизировать выдачу информации о закономерностях размещения древних организмов в пространстве и времени и решать, многие задачи: подразделение совокупности таксонов на группы по отдельным заданным признакам и их сочетанию; выявление синонимов; сопоставление образцов изучаемой коллекции с видами, включенными в картотеку таксонов; диагностика таксонов по совокупности признаков; распознавание зависимостей между признаками; определение обобщенных характеристик объектов; построение соответствующих графиков, гистограмм, карт изолиний или трендов.

Представляет интерес и разработка алгоритмов автоматизации описания палеонтологических объектов, позволяющих преобразовывать материал, записанный в политомических кодах в традиционную текстовую форму. Соответствующие программы могут быть использованы для оперативного описания отдельных палеонтологических коллекций, расшифровки информации, записанной в полевых условиях, а также при составлении систематических описаний по группам палеонтологических объектов.

Целесообразно построение документальной палеонтологической системы в рамках нескольких контуров:

1) первый контур должен содержать полное описание палеонтологических объектов, их изображения, полную синонимику, исчерпывающие данные о распространении и другие необходимые сведения. Каждый описываемый морфологический признак должен иметь свой порядковый номер в соответствии с единой нумерацией для данной системы. Словесные характеристики признака желательно дублировать цифровым кодом. Эти требования, по-видимому, было бы целесообразно учитывать при создании Видовой палеонтологической картотеки;

2) второй контур включает политомические таблицы, содержащие цифровые описания объектов. Степень полноты и детальности описания может выбираться в соответствии с задачами конкретного исследования;

3) третий контур может быть представлен в любой форме, позволяющей производить обработку материалов. Форма эта полностью определяется целевым назначением системы (определители, справочники, перфокартотеки, автоматизированные устройства и др.).

Среди математико-технических исследований в области палеонтологии необходимо отметить создание специализированных информационно-логических устройств, предназначенных для диагностики древних организмов. Такие устройства могут быть реализованы в портативном либо стационарном вариантах на базе использования как дихотомического, так и политомического принципа диагностики.

Дихотомический принцип предполагает создание логической схемы, характеризующейся наличием "старших" и "младших" признаков. "Старшие" признаки разделяют исследуемую совокупность объектов на ряд групп. "Младшие" признаки делят образовавшиеся группы на подгруппы и в свою очередь являются "старшими" по отношению к признакам следующего ранга и т. д. Дихотомические схемы обладают всеми достоинствами и недостатками, свойственными дихотомическим определителям. Поэтому их целесообразно применять лишь для тех групп органических остатков, которые характеризуются небольшим количеством признаков, ограниченным количеством подлежащих диагностике таксонов и, как правило, хорошей их сохранностью.

Политомические схемы позволяют устранить некоторые из отмеченных недостатков. В простейшем виде в соответствии с общими требованиями политомического принципа предполагается, что диагностические признаки являются независимыми и равноправными (в диагностическом отношении). Политомические определяющие устройства позволяют, в частности, наращивать схему по мере поступления сведений о новых таксономических категориях, не нарушая ее целостности, и осуществлять диагностику при неполной сохранности объектов.

Оба типа диагностических схем могут быть выполнены электромеханическим способом или на полупроводниках.

Известны отечественные модели электромеханических схем для диагностики ископаемых харофитов [1132] и фузулинид [312]. Разработаны принципиальные схемы политомических диагностических устройств для определения двумешковых форм пыльцы голосеменных - в электромеханическом и полупроводниковом вариантах [68].

В плане автоматизации диагностического поиска представляет также интерес получение суммарной характеристики признаков, присущих исследуемым объектам. Так, например, применение методов частотной фотофильтрации [698] позволяет представить основные элементы конфигурации исследуемых палеонтологических объектов в виде штрихового (контурного) рисунка, который затем может быть введен в ЭВМ с помощью соответствующих считывающих устройств.

Перспективно использование оптических устройств, предназначенных для анализа обобщенной информации об объектах. Примером материала такого типа могут служить различные морфологические структуры, исследование которых в последнее время вызывает все больший интерес палеонтологов. С этой целью могут быть использованы различные аналоговые устройства [2132], анализаторы статистических характеристик, а также комплекс дифракционных методов, в том числе голографии.

В настоящее время ЭВМ может выступать в роли помощника палеонтолога практически на всех этапах обработки материала (описание, классификация, построение филогенетических схем, обоснование стратиграфических позиций, сравнительный анализ сосуществующих точек зрения, выбор гипотез и т. д.). Но при всех возможностях машина не может, оставаясь рентабельной, полностью заменить человека. Поэтому следует рационально сочетать возможности палеонтолога и машины, справедливо отводя последней роль подсобной силы. Дальнейшие перспективы использования математических и информационных методов в палеонтологии связаны прежде всего с расширением круга решаемых с их помощью задач.

Важнейшая проблема компьютеризации состоит в использовании ЭВМ для оценки степени достоверности, диагностики, контроля и экспертизации объемов таксонов, а также для получения характеристик несохранившихся звеньев эволюционных рядов организмов.

Существующие в настоящее время группы автоматизированных систем обработки палеонтолого-стратиграфической информации, как правило, решают задачи по обработке какого-либо одного класса данных, что позволяет создать для них достаточно экономичные организационно-структурные схемы. Вместе с тем возникает необходимость разработки в будущем автоматизированных систем значительно более сложной организации.

В общем виде модель палеонтологической информационной системы должна быть пригодной для решения по крайней мере четырех основных классов задач, таких, как таксономические построения, изучение филогении, разработка биостратиграфических шкал и палеобиогеографическое картирование [795].

Для каждого из этих классов задач следует формализовать выполнение операций формирования перечней имеющихся алгоритмов решения, обосновать методику сравнительного анализа алгоритмов, установить ограничения и сферы приложения каждого, осуществить выбор алгоритмов, подлежащих использованию в системе, и разработать инструктивные указания по смысловой обработке материала с учетом конкретных задач, подлежащих решению в системе.

По традиции информация обычно подразделяется на два типа - документографическую и фактографическую. В соответствии с этим автоматизированные информационно-поисковые системы также подразделяются на документо- и фактографические (АДИПС и АФИПС). Нетрудно доказать, что такое подразделение в значительной мере искусственно и во многом зависит от принятого подхода к организации информации. Так, если рассматривать совокупность поисковых образов документов в качестве индексного файла, дескрипторы которого являются сообщениями о факте наличия искомой геологической характеристики, любая документографическая система может рассматриваться в качестве ФИПС, а степень полноты и точности выдачи сведений о геологических фактах будет целиком зависеть от принятой стратегии индексирования и, наоборот, любой массив фактографических сведений может быть организован таким образом, что ответ на поисковый запрос представится возможным свести к поиску документа, содержащего совокупность определенных данных.

В связи с этим подразделение на факто- и документографические системы имеет в значительной мере условный характер и, по-видимому, должно отражать не столько характер информации, подлежащей обработке в системе, сколько форму выдачи результатов информационного поиска; документ как таковой или некоторый перечень сведений о характеристиках геологического объекта. Именно этот принцип определяет также структуру и содержание математического обеспечения информационно-поисковой системы (ИПС).

Сказанное создает предпосылки создания методов хранения, поиска и обработки данных, позволяющих рационально сочетать оба подхода к обработке информации. В этом отношении перспективны системы, предназначенные для комплексной обработки палеонтологической информации, требующие совместного использования документографических данных, первичной параметрической и образной информации, а также опосредованной фактографической документации. При этом должны предусматриваться возможность взаимоувязки разноплановых смысловых полей, многократная корректировка данных и внесение дополнительных сведений на всем протяжении эксплуатации системы.

Создание подобных многоконтурных факто- и документографических систем итеративного типа сопряжено со значительными трудностями. Имеющиеся достижения в создании информационных систем по различным группам фауны позволяют унифицировать палеонтологические описания и более рационально организовать хранение, поиск и обработку палеонтологических данных.

На первых порах перспективно осуществление комплексирования систем этого типа с фактографическими системами других направлений, в первую очередь с фактографическими информационно-поисковыми системами по картам геологического содержания и отдельным направлениям исследований вещества, позволяющим реконструировать обстановку палеоседиментогенеза, климатических условий и других параметров палеогеографического режима как основы для создания моделей экосистем и восстановления обстановок эволюционного развития различных ветвей органического мира. В ближайшее время необходимо обратить основное внимание на автоматизацию тех звеньев этих систем, которые связаны с наиболее трудоемкими операциями обработки данных. Степень дальнейшей автоматизации комплексных блоков этих систем потребует дополнительной разработки ряда решений, связанных с их эксплуатацией в режиме человек - машина. Немаловажная задача - создание информационно-поисковых систем, воспринимающих информацию через электронно-оптическое (телевизионное) устройство и полностью автоматизирующих рядовую определительную работу.

При реализации рассматриваемых систем, наряду с использованием универсальных ЭВМ, будет возрастать роль мини- и микрокомпьютеров. Значительный прогресс в развитии интегральных схем обусловливает все возрастающее расширение возможностей мини-ЭВМ и появление моделей, приближающихся по своим эксплуатационным характеристикам к электронно-вычислительным машинам универсального типа. Достаточно показателен тот факт, что в настоящее время в мире около 30% информационных систем различных классов действует на базе мини-компьютеров.

Преимущества применения мини-ЭВМ для предварительной обработки информации, по-видимому, можно считать общепризнанными. Однако единая методология организации программного обеспечения для машин этого типа пока отсутствует. Поэтому при разработке соответствующих палеонтологических систем непременной задачей является обоснование конструктивного подхода к выводу структуры данных, стратегии управляющих процедур, методов распределения памяти и оптимальной организации работы систем в реальном масштабе времени.

Эффект компьютеризации палеонтологии, по-видимому, должен оцениваться по результатам решения двух основных задач - научной (разработка теории, повышение надежности выводов, минимизация субъективного элемента в работе палеонтолога) и экономической.

Среди задач, повседневно возникающих в практике палеонтологических исследований, имеются такие, для решения которых могут быть использованы существующие стандартные математические методы.

К ним относятся, например, многие задачи, касающиеся изучения внутривидовой изменчивости, решаемые методами классической биометрии. Однако прогресс геологии как естественной науки выдвигает новые классы задач, решение которых не может быть получено посредством известных математических аппаратов, в связи с чем возникает необходимость разработки принципиально новых математических методов. Поэтому крайне важно, чтобы все работы, связанные с использованием математики, производились специалистами или содружествами специалистов, владеющими как математикой, так и палеонтологией на высоком профессиональном уровне.

Не подлежит сомнению, что в условиях интенсивной компьютеризации палеонтологических исследований специалист должен не только обнаруживать глубокое знание палеобиологической и геологической специфики решаемых задач, но и владеть достаточно широким кругом математических методов, с тем чтобы правильно учитывать разрешающие возможности и ограничений при создании или использовании математических алгоритмов и, при необходимости, суметь грамотно поставить задачу перед математиком.

 

 

К содержанию: «Современная палеонтология»

 

Смотрите также:

 

ПАЛЕОНТОЛОГИЯ ПОЗВОНОЧНЫХ  геология с основами палеонтологии  По следам минувшего