Все возможные протоалфавиты жизни являются ближайшими структурными аналогами АУЦГ

 

В статье предпринята попытка найти ответ на вопрос почему алфавитом жизни является именно АУЦГ.

 

К молекулам, которые должны выполнять функцию алфавита первичного репликатора, сформулированы следующие шесть требований:
(1) прочность соединения в супрамолекулы,
(2) устойчивость к растворению,
(3) устойчивость к УФ-облучению,
(4) однотипность конфигурации циклической части,
(5) способность к полимеризации при нормальных условиях,
(6) равенство расстояния между радикалами, через которые происходит полимеризация в парах связанных водородными связями.

 

Из шести требований последовательно определяются ограничения на конфигурации молекул. Результат не является предопределенным. В некотором смысле, неожиданным является то, что эти шесть требований приводят к земному протоалфавиту (А)УЦГ в нескольких его модификациях.

 

(А) -- не аденин, а 2,6-диаминопурин

аденин                                       2,6-диаминопурин

 

Переход с протоалфавита (А)УЦГ на алфавит АУЦГ мог быть вызван разными причинами, об этом -- в разделе Обсуждения.

 

Здесь восемь возможный модификаций (А)УЦГ, 4-я -- земная.

 

 

В восьми возможных модификациях протоалфавита (А)УЦГ: пиримидины -- только изомеры У и Ц, пуриноподобные молекулы в 4-х протоалфавитах являются изомерами (А) и Г, а в 4-х -- имеют один атом азота в пятиугольнике и так же являются изомерами друг друга.

 

Первое требование к молекулам проанализировано без учета возможных гипотетически существующих вариантов со сложными и сложно согласованными радикалами. Учитывая это, результат анализа можно сформулировать более строго: 8 модификаций (А)УЦГ является простейшими возможными протоалфавитами жизни.

 

Для научно-популярных ресурсов заголовок статьи можно сформулировать менее корректно, но более коротко: АУЦГ -- единственно возможный алфавит жизни во Вселенной. Впрочем, вероятно, специалисты в азотистых гетероциклах смогут предъявить химические причины невозможности существования некоторых или всех, кроме земной модификации (А)УЦГ, и тогда такая формулировка результата станет более обоснованной.

 

 

Введение

 

Вся генетическая информация на Земле записывается в виде полимера РНК или ДНК. Алфавитом для этой записи являются 4 молекулы -- нуклеотиды. Для РНК их азотистые основания выглядят так:

 

Исключением являются некоторые вирусы (цианофаги), которые вместо аденина используют 2,6-диаминопурин, это исключение рассмотрено в разделе Обсуждение.

 

Нуклеотиды переменной "алфавитообразующей" частью которых являются азотистые основания, создаются живыми организмами. Почему именно конкретно эти молекулы или их химически близкие предшественники, изначально возникшие абиогенно, являются алфавитом для записи генетической информации и могут ли в других условиях (на экзопланетах) образовываться другие алфавиты жизни, до сих пор не известно. В данной статье предпринята попытка найти ответ на этот вопрос, опираясь на логику и самые базовые сведения о свойствах циклических молекул.

 

К молекулам, которые должны выполнять функцию алфавита первичного репликатора, сформулированы следующие шесть требований:
(1) прочность соединения в супрамолекулы,
(2) устойчивость к растворению,
(3) устойчивость к УФ-облучению,
(4) однотипность конфигурации циклической части,
(5) способность к полимеризации при нормальных условиях,
(6) равенство расстояния между радикалами, через которые происходит полимеризация в парах связанных водородными связями.

 

Статья посвящена молекулам, однако в ней не использовано знание о химических свойствах молекул, кроме трех известных:    

     1.  Циклические молекулы содержащие гидроксильные группы –ОН имеют повышенную химическую активность и, соответственно, пониженную устойчивость (ссылка на статью …) , циклические молекулы содержащие  –ОН далее не рассматриваются.

     2. Полимеризация циклических молекул происходит через N-гликозидную связь, которая, в отличие от гликозидной легко образуется при обычных условиях и обладает повышенной устойчивостью (это надо обосновать или обосновать ее преимущества другим образом)

     3. Рассматриваются супрамолекулы образованные только циклическими 5-ти и 6-ти угольными молекулами, как самыми простыми и обладающими самой высокой стабильностью среди всех циклических (3-х и 4-х угольные циклы являются напряженными и не стабильны) и других молекул (насчет других надо обосновать).  

 

Кроме этих трех результатов химической науки, рассуждения основываются только на представление о ковалентных связях, которые достаточно однозначно для логических построений данной статьи определяют конфигурацию и геометрию рассматриваемых молекул. В какой-то смысле, рассматриваются вообще все циклические молекулы, которые в принципе не противоречат элементарным представлениям о ковалентных связях и удовлетворяют правдоподобным требованиям для осуществления функции алфавита репликатора (это и дает возможность не прибегать к знаниям о химических свойствах этих чрезвычайно разнообразных молекул).

 

 

Супрамолекулы

 

Правдоподобные репликаторы должны быть способны к матричному копированию. Единственно возможный способ матричного копирования -- через водородные связи между молекулами. В статье супрамолекулами названы конструкции состоящие из двух ковалентно связанных молекул соединенных межмолекулярными водородными связями.

 

Межмолекулярные связи через водород создаются между атомами фтора, кислорода и азота. Водородные связи через фтор самые сильные, но фтора в природе мало, на втором месте по силе водородные связи через кислород и самые слабые через азот. Таким образом, водородные межмолекулярные связи имеющие существенное значение создаются только атомами кислорода и азота.

 

Чтобы образовалась водородная связь, водород должен быть на атоме кислорода или азота. Существует три устойчивые водородные связи N--H-N, O--HH-N, O--H-N. Причем, связь N--H-N самая слабая.

 

 

 

Тройные связи
Требование №1

 

Чем больше поляризационных связей, тем прочнее циклические молекулы связаны и тем устойчивее возникающая супрамолекула в водном растворителе.

 

5-ти угольные циклы геометрически могут создать супрамолекулы только с двумя связями, 6-ти угольные геометрически могут создавать супрамолекулы с тремя связями.

 

 

 

Введем Требование №1: для прочной стабильной связи циклические молекулы должны быть связаны тремя поляризационными связями .

 

Геометрическая совместимость сразу 3-х водородных связей налагает существенные ограничения на соотношение размеров радикалов, которыми они образуются. В статье рассматриваются только простейшие радикалы, другие будут более сложными и длинными, геометрическое согласование дополнительно усложнится. Далее, в тексте статьи простейшие водородные связи будем называть водородными связями.  

 

Тройные связи без короткой связи N--H-N в средней вершине геометрически невозможны. 

 

 

 

Использовать связь O--HN в верхних и нижних вершинах так же не получается, не хватает длины

 

 

Существуют только 2 геометрически совместимых супрамолекулы с 3-мя водородными связями

 

 

 

 

 

 

Устойчивость к растворению

Требование №2

 

Для каждой возможной супрамолекулы с тройными связями прорисуем следующие ковалентные связи:

 

 

Назовем сторону циклической молекулы, которая участвует в трех поляризационных связях, поляризационной стороной. Заметим, что в каждой супрамолекуле с тремя поляризационными связями один гетероцикл имеет между поляризационной и неполяризационной сторонами конфигурацию ковалентных связей 2/1, а второй 1/1.

 

В общем виде супрамолекулы с тройными связями выглядят так:

 

 

Требование №2: для противодействия растворению в водном растворе на неполяризационной стороне каждого гетероцикла в паре должно быть не более одного самого слабого радикала водородной связи N-H.

 

Для конфигурации 2/1 возможны 8 вариантов, для конфигурации 1/1 -- 8 вариантов

 

 

 

 

 

 

 

Устойчивость к УФ-облучению

Требование №3

 

В работе Peeters et al., 2005. The effect of nitrogen on the photostability of small aromatic molecules проводилось сравнительное исследование УФ-устойчивости трех простых (без боковых групп) 6-угольных гетероциклов: с одним азотом (пиридин), с двумя азотами (пиримидин) и с тремя (1,3,5-триазин). Оказалось, что чем больше атомов азота в цикле, тем ниже устойчивость к УФ. Быстрее всего разрушается триазин, потом пиримидин, а устойчивее всех оказался пиридин.

 

Требование №3: 6-ти угольные циклы должны содержать не более 2-х атомов азота.

 

Остаются только гетероциклы содержащие не более 2-х атомов азота (в средней вершине полярной стороны уже есть один атом азота)

 

 

 

 

 

 

Однотипность 6-ти угольников всех молекул
Требование №4

 

Логично предположить, что  молекулы в супрамолекулах должны быть однотипны. Оставим на кандидаты в левую молекулу только такие, у которых 6-ти угольник такой же, как в правой молекуле в смысле, что содержит 2 атома азота расположенные через один атом углерода. Необходимые для правой части такие циклы обязательно должны образоваться, значит в конкретной локации химический путь для них уже существует, а их способность к трансформации в левую молекулу делает систему более гибкой и простой, чем если бы  6-ти угольники имели бы разное количество или разное расположение атомов азота.

 

Требование №4: Расположение атомов азота в циклах правой и левой молекул должно быть одинаковым.

 

Для левой молекулы остается только один вариант.

 

 

 

 

 

 

Способность к полимеризации
Требование №5

 

Далее супрамолекулам необходимо объединиться с молекулами способными создавать полимеры.

 

Супрамолекулы могут ковалентно присоединять сахарофосфаты или аминокислоты, но для этого они должны иметь на неполяризационной стороне именно один слабый поляризационный конец N--H, через который в виде N-гликозидной связи произойдет присоединение. Правые конфигурации 1/1 имеют такой конец, а левая конфигурация 2/1 не имеет.

 

Самая стабильная (циклическая) молекула соответствующая 6-ти угольному циклу -- соединенная из 5-ти и 6-ти угольника "пуриноподобная" молекула.

 

Требование №5: Для "пуриноподобных" левых частей супрамолекул, так же, как для правых пиримидиновых частей, должно выполняться Требование №2.

 

Возможны следующие 4 варианта "пуриноподобных" молекул удовлетворяющих Требованию №5

 

 

Покажем здесь полные наборы вариантов левых и правых молекул.

 

 

Могут быть реализованы следующие 16 вариантов удовлетворяющих требованиям от 1 до 5 

 

 

 

 

 

Расстояние между N-гликозными связями в супрамолекулах Требование №6

 

Чтобы супрамолекулы могли полимеризоваться на регулярных остовах, расстояние между N-гликозидными связями в супрамолекулах одного алфавита должны быть равными.

 

16 супрамолекул по этому размеру распадаются на 4 группы

 

 

Каждая строка в таблице из 16 молекул соответствует одной из этих размерных групп, в каждой группе по 4 супрамолекулы.

 

В каждой группе есть модификации по количеству атомов азота в 5-ти угольном цикле. Пока предположим, что абиогенный отбор не чувствителен к этому различию и не распознает эти различия, т.е. модификации с одним и с двумя атомами азота в 5-ти угольном цикле назовем различными "написаниями" одной и той же буквы. Каждая группа обладаем главным свойством алфавита -- однозначностью, т.е. каждой букве соответствует только одна другая буква (с точностью до "написания").

 

Все 4 группы имеют равную перспективу стать 4-х буквенным алфавитом жизни. Выигрыш одной из групп может определяться конструкцией и размерами остова. Скорее всего при полимеризации с сахорофосфатным остовом лучшие результаты по устойчивости дает группа 2-й строки ("земная группа"). Далее рассмотрим ее.

 

В алфавите, как носителе информации, пуриноподобные варианты с одним и с двумя атомами азота в 5-ти угольниках равнозначны. Но, в РНК (или полимере с азотистыми основаниями построенном на другом остове) комплементарные друг к другу цепочки информационно одинаковые, но химически разные. Это дает возможность одной из цепочек быть после распада двойной цепи носителем информации, а второй -- рибозимом (или его аналоге). Для рибозимной цепочки, в отличие от информационной (информационная цепь менее чувствительна к химической разнице, чем рибозимная), нужно иметь однозначные химические свойства, поэтому не может быть использован алфавит с модификациями букв.

 

Можно обойти проблему модификаций и по-другому (если считать, что при эволюции рибозимов такая небольшая разница не замечается отбором): сначала может использоваться алфавит с модификациями, но уже на биогенном уровне синтеза нуклеотидов возникла полная унификация.

 

Можно, конечно, посмотреть пути создания пуринов и, вероятно, будут химические причины по которым на первобытной Земле не возможны варианты из колонок 1 и 3 (с одним атомом азота в 5-ти угольнике), но это не гарантирует от того, что в неизвестных условиях (на экзопланетах) могут найтись такие пути. Т.е. можно допустить, что возможна жизнь не на (А)УЦГ, а на их модификациях из 1-й и 3-й колонок.

 

 

 

 

Протоалфавиты жизни возможны в 8-ми вариантах

 

 

 

Пиримидины -- только изомеры У и Ц. Пуриноподобные молекулы в 4-х протоалфавитах являются изомерами (А) и Г, а в 4-х -- имеют один атом азота в пятиугольнике и так же являются изомерами друг друга.

 

Все эти алфавиты являются ближайшими структурными аналогами (А)УЦГ-алфавита и обладают свойством максимально возможной простоты для первичного алфавита жизни построенного на супрамолеклах с тремя водородными связями.

 

 

 

 

Обсуждение

 

Абиогенно сгенерированная однозначность (А)УГЦ

 

Надо обратить внимание на то, что протоалфавит должен был обладать такой же однозначностью, которая предопределена при биогенном синтезе (А соответствует Г, а У -- Ц). Но при абиогенном синтезе однозначность никак не предопределена и, если бы однозначность не была бы сгенерирована абиогеннно, то даже при наличии (А), У, Ц и Г, при наличии других похожих молекул, информация не могла бы сохраняться.

 

 

 

Двойная связь (аденин вместо 2,6-диаминопурина)

 

Логично предполагать, что старт неферментативной репликации эффективнее происходит при трех связях в каждой паре. Но, когда устойчивость цепочек за счет действия первичных рибозимов повысилась настолько, что прочность водородных связей между комплементарными нуклеоноидами могла несколько ослабнуть, 2,6-диаминопурин заменился на аденин и в одной паре тройная водородная связь заменилась на двойную, вероятно, для повышения количества мутаций и ускорения дарвиновской эволюции.

 

Второй вариант объяснения -- при полимеризации именно потеря аминогруппы у 2,6-диаминопурина делает для него невозможным неправильную "зеркальную" полимеризацию.

 

 

 

(А)УЦГ-алфавит вирусов

 

2,6-диаминопурин с его способностью связываться с урацилом в комплементарную пару прочнее, чем аденин, не ускользнул от внимания химиков, изучающих неферментативную репликацию и репликацию, катализируемую рибозимами. Использование в таких экспериментах 2,6-диаминопурина вместо аденина облегчает репликацию последовательностей РНК. Например, в обзорной статье (A. I. Taylor et al., 2019. Beyond DNA and RNA: The Expanding Toolbox of Synthetic Genetics) говорится следующее:
«2,6-диаминопурин, по-видимому, имеет некоторые преимущества перед аденином, поскольку обеспечивает более стабильное спаривание с уридином или тимидином, что может помочь синтезу РНК рибозимами – РНК-полимеразами (Attwater et al. 2013) и мог бы упростить некоторые геномные преобразования за счет выравнивания энергетики спаривания оснований в разных парах оснований... Однако 2,6-диаминопурин встречается только у цианофагов (это вирусы цианобактерий) (Weigele and Raleigh 2016). Эта и другие модификации (имеются в виду модификации канонических нуклеотидов) могут представлять собой рудименты широкого круга пребиотических систем спаривания оснований, которые не были впоследствии стабильно инкорпорированы в биологию».


В цитируемой статье, как и в некоторых других работах, предполагается, что в пребиотической обстановке существовали и в каком-то смысле «конкурировали» друг с другом разнообразные системы комплементарно спаривающихся оснований, из которых сохранилась и стала основой жизни только одна, известная нам (А, У, Г, Ц).

 

Можно предположить, что у вирусов 2,6-диаминопурин не рудиментарный, а является более поздней заменой аденина, т.к. вирусам не нужны многие классы собственных ферментов, т.е. не нужно химическое разнообразие в их алфавите «жизни», для них важнее устойчивость генетической информации и, вероятно, им нужна частичная неферментативность репликации.

 

 

 

Азотистые гетероциклы в метеоритах

 

В статье Martins, 2018. The nitrogen heterocycle content of meteorites and their significance for the origin of life приведен полный список азотистых гетероциклов, найденных в метеоритах.

 

 

 

 

 

Видно, что в пуриноподобных молекулах нет 5-ти угольников с одним атомом азота. Но, вероятно, в других условиях, чем в Солнечной системе они могут возникать.

 

 

 

Ксенонуклеиновые кислоты

 

Ниже продемонстрировано на примере РНК Хатимодзи, как могут быть опровергнуты не соответствующие 8-ми модификациям (А)УЦГ протоалфавиты жизни.

 

Из Википедии

 

ДНК (РНК) Хатимодзи - синтетический аналог нуклеиновой кислоты, который использует четыре синтетических нуклеотида в дополнение к четырем, присутствующим в природных нуклеиновых кислотах, ДНК и РНК. Основания хатимодзи были продемонстрированы как в аналогах ДНК, так и в РНК с использованием дезоксирибозы и рибозы соответственно в качестве основного сахара.

 

Химик из Scripps Research Флойд Ромесберг, известный созданием первой пары неестественных оснований (UBP) и расширением генетического алфавита из четырех букв до шести в 2012 году, заявил, что изобретение системы ДНК хатимодзи является примером того факта, что природные основания (G, C, A и T) "не уникальны". Создание новых форм жизни может быть возможным, по крайней мере теоретически, с новой системой ДНК.

 

НАСА профинансировало это исследование, чтобы "расширить масштабы структур, с которыми мы можем столкнуться при поиске жизни в космосе". По словам Лори Глэйз из Отдела планетологии НАСА, "Обнаружение жизни становится все более важной целью миссий НАСА по планетологии, и эта новая работа [с ДНК хатимодзи] поможет нам разработать эффективные инструменты и эксперименты, которые расширят сферу того, что мы ищем". Руководитель исследовательской группы Стивен Беннер отмечает: "Тщательно анализируя роль формы, размера и структуры ДНК хатимоджи, эта работа расширяет наше понимание типов ДНК хатимодзи". о молекулах, которые могли бы хранить информацию о внеземной жизни в чужих мирах".

 

Две нижние пары на рисунке -- Основания хатимодзи

 

 

Видно, что супрамолекула B-rS совпадает с супрамолекулой земного протоалфавита У-(А), это 4-й вариант в таблице 8-ми алфавитов

 

правая пара в 4-м варианте в таблице из 8-ми вариантов
  

 

Молекула P не удовлетворяет требованию устойчивости к УФ-облучению (имеет 3 атома азота в цикле), а молекула Z не удовлетворяет требованию связываться через N-гликозидную связь (связывается через гликозидную). Вероятно, связь Z с рибозой происходит при специальных условиях. И еще надо узнать, как влияет группа O2N (которая, наверное, является следствием химического пути образования молекулы Z) на устойчивость и растворимость.