Жизнь VS Энтропия - страница 7







где P(x) – априорное, а P(x|y) – апостериорное распределение вероятностей сообщений x после приема сообщения y. Назовем эти постулаты Системой Символьной Передачи Сообщений (ССПС).

Интегральная характеристика всей системы передачи – это среднее количество взаимной информации I(X;Y) между множествами X и Y. Прямое вычисление по формулам теории вероятности дает


I (X ; Y) = H(X) – H(X | Y),


где H(X), H(X | Y) – априорная и апостериорная энтропия распределений вероятностей множества X, преобразуемого каналом в множество Y [2]. Эта формула определяет глубинный смысл информации, как меры снижения энтропии.

В том же 1948 году математик Н. Винер опубликовал книгу «Кибернетика, или Управление и связь в животном и машине». Эта работа открыла целое направление моделирования «живого» техническими средствами. Дж. фон Нейман формулирует концепцию самовоспроизводящихся машин. В ней он приходит к выводу, что их конструкция требует наличия памяти и канала передачи наследственной информации. Он же формулирует принципы построения вычислительных машин «фон-Неймановского» типа, которые до сих пор доминируют в компьютерном мире. Их особенностью является наличие памяти, хранящейся в ней программы и обрабатывающего ее инструкции процессора. Несколько позже Ф. Розенблатт создает персептрон – альтернативу фон-Неймановским компьютерам. Персептрон непосредственно моделировал процессы распознавания образов в животном мире. Алгоритм работы персептрона задавался не в виде текста на неком языке программирования, а в виде структуры связей между его элементами. Важным его отличием от машин фон-Неймана является наличие процедуры обучения в процессе работы. Сегодня «машины Розенблатта» превратились в нейронные сети, а распознавание образов в искусственный интеллект.

Синтез этих новых направлений привел к формированию обширной области современной науки – информатики. Новое великое открытие XX века – расшифровка в 1953 году Ф. Криком и Дж. Уотсоном структуры молекулы ДНК, стимулировало бурное проникновение ее в генетику. Выяснилось, что эта молекула действительно представляет собой закодированный текст. Алфавитом этого текста служат четыре вида химических соединений – нуклеотидов. Их обозначают буквами А (аденин), Г (гуанин), Т (тимин) и Ц (цитозин). Текст линеен, т. е. представляет собой полимерные цепи, состоящие из названных нуклеотидов. Но его общая структура гораздо сложнее, чем просто последовательность букв (А, Г, Т, Ц). У сложных организмов, состоящих из клеток, имеющих ядро (эукариот), цепи двойные. Буквы одной цепи соединены с буквами другой по принципу комплементарности: аденин соединяется только с тимином, а гуанин только с цитозином. Химические свойства нуклеотидов таковы, что цепи закручиваются в знаменитую «двойную спираль», которую математически корректно было бы называть «двойным винтом». Еще нагляднее модель закручивающейся веревочной лестницы. Аналогия с веревочной лестницей возникает потому, что молекула ДНК способна, сохраняя кручение, сворачиваться в клубок и вообще образовывать сложные вторичные формы. Ее текст может разбиваться на отдельные «главы», называемые хромосомами. Например, ДНК человека образует структуру из 23 отдельных частей, каждая из которых состоит из пары хромосом (рис. 1).




Рис. 1. 23 пары хромосом человека, пара X/Y определяет мужской пол


Хромосомы в парах содержат, как норму, один и тот же «по смыслу» текст. Их поэтому называют гомологичными. Как и положено осмысленному тексту, текст ДНК состоит из «предложений», получивших название генов. При передаче наследственной информации между поколениями живых организмов именно гены являются минимальными неделимыми смысловыми единицами. Заложенный в них смысл – это программа синтеза белков. «Жизнь есть способ существования белковых тел…» – Ф. Энгельс. Уже во времена этого классика было известно, что основным материалом живого служат химические соединения, по-русски названные белки, а по-научному – полипепти́ды. Их формулы представляют собой линейные полимерные цепи, составленные из 20 видов химически модифицированных молекул из класса аминокислот. Иначе говоря, это тоже тексты, но написанные алфавитом из 20 букв. Помимо основных полимерных связей между соседними звеньями цепи, в молекулах белков образуются дополнительные связи между разными их участками. В результате молекулы белков образуют весьма сложные пространственные вторичные, третичные и даже четвертичные структуры. На рис. 2 показана такая структура белка аспартатаминотрансфераза (АСТ), первого белка, текст которого был установлен в полном объеме в 1972 году.