Сверхъестественное. Боги и демоны эволюции - Хэнкок Грэм (книги полностью бесплатно .txt) 📗
Всем человеческим языкам присуща одна общая и несколько неожиданная тенденция. Она получила название закона Зипфа — по имени лингвиста Джорджа Зипфа, который открыл ее в 1939 году. Он изучал тексты на самых разных языках и организовывал слова в порядке их значимости. Как оказалось, существует точное математическое соотношение между уровнем значимости слова и частотой его употребления в тексте. И это справедливо для любого языка — будь то английский, японский, арабский, урду, коса и так далее. Вне зависимости от текста, стоило Зипфу вычертить диаграмму, которая сопоставляла частоту употребления слова и его значимость, и у ученого выходила прямая линия "с уклоном в –1 для каждого национального языка" [1232].
Для того, чтобы понять общий принцип, представьте книгу с любым количеством слов — в 60 тысяч, или в 114 тысяч, или какого-либо иного объема. И если наиболее частое слово — то есть слово со степенью значимости номер 1 — будет употребляться в этой книге 10 тысяч раз, то вы можете быть уверены в том, что десятое по частоте употребления (а следовательно, и по значимости) слово встретится в книге 1 тысячу раз, а сотое наиболее частое слово — только 100 раз. Разумеется, цифры будут варьироваться от текста к тексту — в зависимости от общей длины сочинения. Однако точная математическая пропорция между значимостью и частотой употребления слова останется все та же. В этом, вкратце, и состоит закон Зипфа [1233].
А вот и еще одна, даже более странная, вещь. В середине девяностых годов XX века исследователи из Бостонского университета и Гарвардского медицинского факультета изучили 37 последовательностей ДНК, в каждой из которых содержалось как минимум 50 тысяч парных базовых элементов, две более коротких последовательности и еще одну, с общим содержанием в 2,2 миллиона парных элементов. И там, где было возможно, изучались как кодирующие, так и некодирующие области ДНК [1234]. Ученые обнаружили, что во всех последовательностях существовали отчетливые узоры из трех, четырех, пяти, шести, семи и восьми парных элементов — своего рода отдельные "слова". И это побудило их применить к материалу два стандартных лингвистических теста. Один из этих тестов был основан на методе Зипфа. Все "слова" ДНК распределили в соответствии с их повторяемостью, после чего вычертили гистограмму, соотносящую значимость каждого слова с фактической частотой его употребления в "тексте".
Оценка кодирующих регионов показала, что они не подчиняются закону Зипфа. Этого-то как раз и следовало ожидать, учитывая, что подобные регионы представляют собой всего лишь коды, а не языки. И служат они всего лишь образцами для создания особых протеинов [1235]. "В кодирующих частях нет грамматики, — замечает по этому поводу ведущий специалист Эжен Стэнли. — Каждый триплет [базовых элементов] соответствует определенной аминокислоте [входящей в состав протеина]. Здесь нет никакой высшей структуры" [1236].
Что ж, вполне предсказуемо и весьма утешительно. Разумеется, в ДНК нет никаких разумных посланий, и она не пытается передать их нам с помощью своего языка. Ведь если бы это и в самом деле было так, то все принципы современного эволюционного знания оказались бы перевернуты с ног на голову. Однако далее произошло нечто неожиданное и "по-настоящему удивительное", как сказал об этом Эжен Стэнли [1237]. Это поистине непостижимое и удивительное открытие заключалось в том, что всякий раз, когда исследовались некодирующие регионы ДНК, они полностью подпадали под закон Зипфа [1238]. Если бы эти последовательности ДНК представляли собой книги, страницы которых оказались бы заполнены неизвестными нам буквами, то мы вынуждены были бы сделать вывод, что перед нами не просто мешанина из букв, но полноценный, организованный язык.
Сопоставление частоты употребления со значимостью "слов" в некодирующей ДНК позволяет вычертить гистограмму, характерную для обычных языков. Зато кодирующие части ДНК не соответствуют этому закону (по Эжену Стэнли, Science, 25 ноября 1994 года)
И Стэнли, не колеблясь, делает подобный вывод. По его мнению, некодирующие части ДНК заключают в себе "структурированный язык, который самым кардинальным образом отличается от кодирующей системы генов" [1239]. Таким образом, мы должны принять во внимание возможность того, что "бросовая" ДНК потенциально содержит некий вид послания" [1240].
Столь смелая идея получила дальнейшее подтверждение благодаря второму лингвистическому тесту, который эта группа ученых также применила к последовательностям ДНК. Этот тест был разработан в пятидесятых годах XX века теоретиком информатики Клодом Шэнноном. С его помощью можно отличить тексты, написанные на настоящих языках, от текстов, представляющих набор из букв. Происходит это благодаря количественной классификации любой цепочки последовательных элементов текста. Этот тест работает и является универсальным, поскольку "языки представляют собой множественные последовательности… Выявив подобные характеристики, вы сможете даже обнаружить типографскую ошибку. Что касается случайной последовательности букв, то она никогда не отличается подобной множественностью" [1241].
И вновь, когда тест применили к кодирующим регионам ДНК, они не выказали никаких особенностей человеческого языка — чего, собственно, и следовало ожидать. Генетический код не является и не может являться логической последовательностью, ошибки в которой легко исправимы благодаря соотнесению с целым. Напротив, все генетики прекрасно знают о том, что единственная ошибка, затронувшая пару основных элементов даже в одном из генов, способна настолько перетряхнуть весь код, что это приведет к самым катастрофичным последствиям для организма. И опять же, с помощью этого теста исследователи выяснили, что некодирующие секции ДНК "обнаруживают удивительное количество логической множественности — еще один признак того, что на этих загадочных лентах было записано нечто важное" [1242].
Иными словами, все эти неожиданные открытия позволяют нам выдвинуть поистине экстраординарную гипотезу. Не исключено, что химическая "запись", сделанная на так называемой бросовой ДНК, может не только обладать "всеми чертами человеческого языка" [1243], но и в самом деле представлять собой настоящий язык. В июне 2005 года я связался с профессором Эженом Стэнли из Бостонского университета и поинтересовался у него, по-прежнему ли он придерживается тех идей, которые были выдвинуты им в 1994 году, или же он успел отказаться от столь смелых выводов. И вот что сказал мне по этому поводу профессор Стэнли: "Будьте уверены, я не изменил своего мнения и не собираюсь менять его в дальнейшем!"
Как правило, чем более сложным является организм, тем больше содержится в нем некодирующих секций ДНК. Тем не менее существует большое количество достаточно простых организмов, в которых также имеется немало подобных секций. На самом деле эти длинные последовательности якобы бесполезного кода столь широко распространены среди всех категорий живых существ, что они вполне могут являться наследством наших наиболее отдаленных предков — тех первых одноклеточных бактерий, которые колонизовали Землю около четырех миллиардов лет назад [1244].