Все возможные протоалфавиты и алфавиты жизни являются ближайшими структурными аналогами AUGC

 

 

Терминология в статье

 

Супрамолекулы – молекулярные пары объединенные межмолекулярными водородными связями.

 

Протоалфавит жизни – возникающие на первобытной планете группы молекул способные к репликации основанной на двух или большем количестве супрамолекул с высокой прочностью соединения, т.е. имеющих три связи.

 

Алфавит жизни – возникающие на первобытной планете (возможным путем является трансформация молекул протоалфавита) группы молекул способные к репликации основанной на одной или большем количестве супрамолекул с тремя связями и на одной супрамолекуле с двумя связями. Это естественное название, поскольку, именно таким алфавитом является единственно известный реальный алфавит жизни (в обоих вариантах РНК и ДНК).

 

 

 

Краткое изложение

 

В статье предпринята попытка найти ответ на вопрос, почему алфавитом жизни является AUGC.

 

К молекулам, совокупность которых должна выполнять функцию первичного репликатора, сформулированы следующие шесть требований:

(1) прочность соединения в молекулярные пары,

(2) устойчивость пар к растворению,

(3) устойчивость к УФ-облучению,

(4) однотипность конфигурации циклической части,

(5) способность к реакциям присоединения при нормальных условиях,

(6) пары одного алфавита связанные водородными связями должны быть геометрически (по расстоянию и углам) одинаковыми относительно атомов, через которые происходит полимеризация.

 

Из шести требований последовательно определяются ограничения на возможные конфигурации молекул.

 

Окончательные конфигурации соответствуют восьми трехпарным 6-ти буквенным протоалфавитам типа (A)UGCBS, где:

1. (A) – не аденин (6-аминопурин), а 2,6-диаминопурин

2. Дополнительные буквы обозначены B и S, как в статье "ДНК и РНК Хатимодзи: генетическая система из восьми строительных блоков" (Ш. Хошик и др. 2019) [1], в которой авторы приводят результаты успешных испытаний 8-ми буквенного алфавита, включающего B и S и еще 2 молекулы не удовлетворяющие двум из шести требованиям (подробнее об этом в Обсуждении).

 

Здесь восемь возможных 6-ти буквенных модификаций, в первой строке – "земная"

 

 

 

Разница между двумя из трех парами букв (между G-C и B-S) намного меньше разницы с третьей парой букв ((A)-U). Если предположить, что близкие пары не могут сосуществовать внутри одного алфавита, то восемь 6-ти буквенных протоалфавитов распадаются на шестнадцать 4-х буквенных, в которых отсутствует одна из двух близких пар, т.е. на алфавиты типов (A)UBS и (A)UGC.

 

Здесь шестнадцать возможных 4-х буквенных модификаций

 

 

В смысле близкой изометрической схожести все протоалфавиты являются аналогами (A)UGC.

 

Первое требование – базовое для представленного рассмотрения и эквивалентно требованию 3-х водородных связей в каждой паре букв, что соответствует термину "протоалфавит". В поддержку правильности первого требования, кроме логичного предположения, что тройные связи принципиально лучше, чем двойные обеспечивают неферментативную репликацию (которая необходима для старта эволюции), непредопределенный итоговый результат – при принятии базового требования варианты протоалфавита сводятся к (A)UGC (с точностью до 24-х модификаций), т.е. к максимально близкому с единственно известным реальным.

 

Поскольку земной алфавит конкретно AUGC (а не его модификации), то земным протоалфавитом жизни был или (A)UGCBS или (A)UGC.

 

Первое требование к молекулам проанализировано без учета возможных гипотетически существующих вариантов со сложными и геометрически сложно согласуемыми для трех связей радикалами. Учитывая это, результат анализа можно сформулировать более строго: восемь 6-ти буквенных модификаций (A)UGCBS, восемь 4-х буквенных модификаций (A)UBS и восемь 4-х буквенных модификаций (A)UGC является простейшими возможными протоалфавитами жизни.

 

После анализа конфигураций удовлетворяющих всем шести требованиям, рассмотрена возможность снижения строгости Требования 1 (в ущерб эффективности неферментативной репликации) до уровня допускающего одну пару с двойной связью, что соответствует термину "алфавит". Удивительно, что такое снижение уровня строгости приводит к единственной замене (A) на A или на {A} ({A} – 2-аминопурин), т.е. AUGCBS, AUBS, AUGC и их варианты с {A} являются 48-мью возможными модификациями алфавита жизни.

 

В таблице приведем только варианты алфавита построенного на "земной" группе (одной из восьми возможных), соответствующих схеме

 

 

как и для других семи групп, их шесть

 

 

 

 

 

Переход с 2,6-диаминопурина (A) на аденин A мог происходить по разным сценариям, об этом – в разделе Обсуждение.

 

Ответ на вопрос, почему алфавитом жизни является AUGC

AUGC – одна из двух возможных трансформаций протоалфавита (репликатора построенного на супрамолекулах только с тремя водородными связями) (A)UGC в алфавит (репликатор допускающий одну супрамолекулу с двумя водородными связями). Трансформацией является замена (A) на A или {A}.

(A)UGC – одна из 24-х возможных совокупностей простейших молекул способная генерировать репликацию на трех водородных связях (гипотетически возможные более сложные могут быть только намного более сложными, их радикалы создающие водородные связи должны содержать в разы больше атомов). Структурная близость всех возможных модификаций протоалфавита – контринтуитивна, априори кажется, что разнообразие должно быть большим. Однако, анализ соответствия правдоподобным требованиям для молекул протоалфавита приводит строго к (A)UGC и еще 23-м его близким структурным аналогам.

При трансформации 24-х возможных протоалфавитов в алфавиты, количество возможных алфавитов – 48, один из которых, единственно известный реальный AUGC.

Вероятно, специалисты в азотистых гетероциклах смогут предъявить химические причины невозможности существования некоторых модификаций, тогда детерминированность нашего алфавита жизни дополнительно повысится.

 

 

 

Введение

 

Вся генетическая информация на Земле записывается в виде полимера РНК или ДНК. Алфавитом для этой записи являются 4 молекулы – нуклеотиды. Для РНК их азотистые основания выглядят так:

 

 

 

Исключением являются некоторые вирусы (цианофаги), которые вместо аденина используют 2,6-диаминопурин, это исключение рассмотрено в разделе Обсуждение.

 

Нуклеотиды, переменной "алфавитообразующей" частью которых являются азотистые основания, создаются живыми организмами. Сами эти молекулы или их химически близкие предшественники изначально должны были образовываться абиогенно и выиграть конкуренцию у других возможных вариантов. Почему именно конкретно эти молекулы или их химическии близкие предшественники стали протоалфавитом для записи генетической информации и, какие алфавиты могли и могут возникать в других условиях (на планетах Солнечной системы и экзопланетах), до сих пор не известно. В статье предпринята попытка найти ответ на этот вопрос опираясь на логику и самые базовые сведения о свойствах циклических молекул.

 

К молекулам, совокупность которых должна выполнять функцию первичного репликатора, сформулированы следующие шесть требований:

(1) прочность соединения в молекулярные пары,

(2) устойчивость пар к растворению,

(3) устойчивость к УФ-облучению,

(4) однотипность конфигурации циклической части,

(5) способность к реакциям присоединения при нормальных условиях,

(6) пары одного алфавита связанные водородными связями должны быть геометрически (по расстоянию и углам) одинаковыми относительно атомов, через которые происходит полимеризация.

 

Статья посвящена циклическим молекулам, однако в ней не использованы знания о химических свойствах циклических молекул, кроме четырех общеизвестных:

     1. В ациклических молекулах большее, чем в циклических количество степеней свободы, с их участием невозможны устойчивые межмолекулярные конфигурации связанные водородными связями. 3-х и 4-х угольные циклические молекулы являются напряженными и не стабильны. Самые простые из обладающих высокой стабильностью – 5-ти и 6-ти угольные циклические молекулы, дополнительную устойчивость дает их ароматическая структура.

    2. В 5-ти и 6-ти угольных циклических молекулах ни один атом углерода в цикле не создает две двойные связи. Стереохимически такая возможность возникает только начиная с 8-ми угольных циклов.

     3. Циклические молекулы содержащие гидроксильные группы ОН имеют повышенную химическую активность и быстро переходят в кето-форму =O, циклические молекулы содержащие ОН далее не рассматриваются.

     4. Циклические молекулы легче вступают в реакции присоединения через N-H, чем через C-H (связь N-H полярная, в отличие от связи C-H, где разница в электроотрицательности между углеродом и водородом слишком мала, поэтому группа N-H химически активнее), присоединение через N-H может происходить в нормальных условиях.

 

Кроме этих четырех положений химии циклических молекул, рассуждения основываются только на общих представлениях о ковалентных связях, которые достаточно однозначно (для логических построений данной статьи) определяют конфигурацию и геометрию циклических молекул. В каком-то смысле, рассматриваются вообще все циклические молекулы, которые в принципе не противоречат элементарным представлениям о ковалентных связях и удовлетворяют правдоподобным требованиям для осуществления функции алфавита репликатора (это и дает возможность не прибегать к знаниям о химических свойствах этих чрезвычайно разнообразных молекул).

 

 

 

 

 

Супрамолекулы

 

Правдоподобная репликация может быть организована только с помощью матричного копирования. Правдоподобный и, возможно, единственный способ матричного копирования при нормальных условиях -- через водородные связи между молекулами (ионные связи, вероятно, слишком прочные для нормальных условий).

 

Межмолекулярные связи через водород создаются между атомами фтора, кислорода и азота. Водородные связи через фтор самые сильные, но фтора в природе мало. Водородные межмолекулярные связи имеющие существенное значение создаются только атомами кислорода и азота.

 

Чтобы образовалась водородная связь, водород должен быть на атоме кислорода или азота. Существует три водородные связи N–H-N, O–H-N, O–HH-N. Причем, связь N–H-N, в силу меньшей электроотрицательности азота, самая слабая.

 

 

 

 

 

 

Тройные связи
Требование №1

 

Чем больше поляризационных связей, тем прочнее циклические молекулы связаны и тем устойчивее возникающая супрамолекула в водном растворителе.

 

5-ти угольные циклы геометрически могут создать супрамолекулы только с двумя связями, 6-ти угольные геометрически могут создавать супрамолекулы с тремя связями.

 

 

 

 

Введем Требование №1: для прочной связи (необходимой для неферментативной репликации, без которой не может стартовать эволюция) циклические молекулы должны быть связаны тремя поляризационными связями.

 

Супрамолекулы связанные двумя водородными связями рассмотрены в Обсуждении, где для молекул образующих такие супрамолекулы, кроме меньшей прочности соединения, обнаруживается дополнительная причина, почему они не подходят для алфавита первичной репликации: они не гарантируют соблюдения главного свойства алфавита – однозначности. Кроме этого, от обратного, правильность принятия Требования 1 подтверждается непредопределенным итоговым результатом – варианты протоалфавита сводятся к (A)UGC (с точностью до модификаций), т.е. к максимально близкому с единственно известным реальным.

 

Геометрическая совместимость сразу 3-х водородных связей налагает существенные ограничения на соотношение длин атомных групп, которыми они образуются. В статье рассматриваются только простейшие атомные группы, другие будут более сложными и длинными, геометрическое согласование дополнительно усложнится (вероятно, такие согласования вообще невозможны). Далее, в тексте статьи, простейшие конфигурации атомов создающие водородные связи будем называть водородными связями.

 

Тройные связи без короткой связи N–H-N в средней вершине геометрически невозможны. 

 

 

 

Использовать связь O–HN в верхних и нижних вершинах без аминогруппы, так же не получается, не хватает длины

 

 

Существуют 3 геометрически возможные конфигурации с 3-мя водородными связями с атомом кислорода в одном из 6-ти угольных гетероциклов супрамолекул

Однако, такие супрамолекулы заведомо не удовлетворяют Требованию №4 (обоснование в соответствующем параграфе), поэтому далее они не рассматриваются.

 

Существуют только 2 геометрически возможные конфигурации с 3-мя водородными связями (удовлетворяющих базовому Требованию №1) и не нарушающими априори ни одного из пяти не базовых  требований к молекулам, которые должны выполнять функцию алфавита первичного репликатора

 

 

 

 

 

 

 

 

Устойчивость к растворению

Требование №2

 

Для каждой возможной базовой конфигурации супрамолекулы с тройными связями прорисуем (в формате структурной формулы) ковалентные связи определяемые этими конфигурациями

 

 

 

Назовем сторону циклической молекулы, которая участвует в трех поляризационных связях, поляризационной стороной. Заметим, что в каждой супрамолекуле с тремя поляризационными связями один гетероцикл имеет между поляризационной и неполяризационной сторонами конфигурацию ковалентных связей 2/1, а второй 1/1.

 

В общем виде супрамолекулы с тройными связями выглядят так:

 

Требование №2: для противодействия растворению в водном растворе на неполяризационной стороне каждого гетероцикла в паре должно быть не более одной группы способной создавать водородную связь, причем самой слабой, а именно N-H.

 

Для конфигураций 2/1 и 1/1 возможны варианты

 

 

 

 

 

 

 

 

Устойчивость к УФ-облучению

Требование №3

 

В работе "Образование и фотостабильность N-гетероциклов в космосе" (Peeters et al., 2005) [2] проводилось сравнительное исследование УФ-устойчивости трех 6-угольных гетероциклов: с одним азотом (пиридин), с двумя азотами (пиримидин) и с тремя (1,3,5-триазин). Оказалось, что чем больше атомов азота в цикле, тем ниже устойчивость к УФ. Быстрее всего разрушается триазин, потом пиримидин, а устойчивее всех оказался пиридин.

 

Требование №3: 6-ти угольные циклы должны содержать не более 2-х атомов азота.

 

Остаются только гетероциклы содержащие не более 2-х атомов азота (в средней вершине поляризационной стороны уже есть один атом азота)

 

 

 

 

 

 

 

 

Однотипность 6-ти угольников всех молекул
Требование №4

 

Логично предположить, что  молекулы в супрамолекулах должны быть однотипны. Оставим на кандидаты в молекулы конфигурации 2/1 только такие, у которых 6-ти угольник такой же, как в молекулах конфигурации 1/1, в смысле, что содержит 2 атома азота расположенные через один атом углерода. Необходимые для конфигурации 1/1 такие циклы обязательно должны образоваться, значит в конкретной локации химический путь для них уже существует, а их способность к трансформации в молекулу конфигурации 2/1 делает систему более гибкой и простой, чем если бы  6-ти угольники имели бы разное количество или разное расположение атомов азота.

 

Требование №4: Расположение атомов азота в конфигурациях 2/1 и 1/1 должно быть одинаковым.

 

Для конфигурации 2/1 остаются только два варианта

 

 

 

 

 

 

 

 

Способность к полимеризации
Требование №5

 

Супрамолекулам необходимо вступать в реакции присоединения с молекулами способными создавать полимеры.

 

Супрамолекулы могут ковалентно присоединять, например, сахара или аминокислоты, но для этого они должны на неполяризационной стороне в одной из вершин иметь N-H. Конфигурации 1/1 имеют такую вершину, а конфигурации 2/1 не имеют.

 

Самая стабильная молекула соответствующая циклической 6-ти угольной – соединенная из 5-ти и 6-ти угольника "пуриноподобная" молекула (в ней присоединенная часть так же высокостабильная циклическая).

 

Требование №5: Для "пуриноподобных" частей супрамолекул, имеющих в 5-ти угольном цикле N-H, так же, как для пиримидиновых частей, должно выполняться Требование №2 (отсутствие других групп способных создавать водородные связи).

 

Возможны следующие 8 вариантов "пуриноподобных" молекул удовлетворяющих Требованию №5

 

 

 

 

 

 

Покажем здесь полные наборы вариантов молекул конфигураций 2/1 и 1/1

 

 

 

 

Могут быть реализованы следующие 32 варианта 

 

 

 

 

 

Перевернем молекулы в 2-х правых колонках и отметим одинаковые молекулы метками одного цвета

 

 

 

 

Уберем повторяющиеся, получим 24 уникальные пары удовлетворяющие требованиям от №1 до №5

 

 

 

 

 

 

 

 

Конгруэнтность пар присоединения супрамолекул одного алфавита

Требование №6

 

Требование 6: чтобы супрамолекулы могли полимеризоваться на регулярных остовах, конфигурации супрамолекул одного алфавита по геометрии расположения N-H должны быть одинаковыми.

 

24 супрамолекулы по конфигурациям расположения N-H распадаются на 4 группы, в каждой по 6 супрамолекул

 

 

 

 

 

 

Модификации по количеству атомов азота в 5-ти угольном цикле

 

В каждой группе есть модификации по количеству атомов азота в 5-ти угольном цикле

 

 

Можно предположить, что в алфавите могут встречаться обе модификации, тогда модификации с одним и с двумя атомами азота в 5-ти угольном цикле можно назвать различными "написаниями" одной и той же буквы.

 

Однако, есть фундаментальная причина невозможности сосуществования букв с разным "написанием" в одном протоалфавите жизни.

 

В алфавите, как носителе информации, пуриноподобные варианты с одним и с двумя атомами азота в 5-ти угольниках равнозначны. Но, в РНК (или полимере с азотистыми основаниями разных модификаций или построенном на другом остове) комплементарные друг к другу цепочки информационно одинаковые, но химически разные. Это дает возможность одной из цепочек после распада двойной цепи быть носителем информации (генотипа) и матрицей для размножения, а второй (кроме того, чтобы быть матрицей для размножении генотипа) – рибозимом или совокупностью рибозимов (или их аналогами, если основа не рибозная). Для рибозимной цепочки, в отличие от информационной (информационная цепь менее чувствительна к химической разнице, чем рибозимная), нужно иметь строго определенные химические свойства, поэтому не может быть использован алфавит с разными "написаниями" букв.

 

Можно обойти проблему различных "написаний" и по-другому (если считать, что и для рибозимов такая небольшая разница не замечается отбором): сначала может использоваться алфавит с вариантом "написания", но уже на биогенном уровне синтеза нуклеотидов возникает полная унификация.

 

Можно, конечно, посмотреть пути создания пуриноподобных молекул и, вероятно, будут химические причины по которым на первобытной Земле (или вообще в Солнечной системе) не возможны варианты с одним атомом азота в 5-ти угольнике пуриноподобной молекулы, но это не гарантирует от того, что в неизвестных условиях (на экзопланетах) могут найтись такие пути. Т.е. можно допустить, что возможна жизнь на модификациях пуриноподобных молекул с одним атомом азота в 5-ти угольнике (интересно отметить, что такой алфавит еще проще, уже предельно простой).

 

 

 

 

 

Протоалфавиты жизни возможны в 24-х вариантах

 

С учетом невозможности существования разных "написаний" (модификаций по количеству атомов азота в 5-ти угольном цикле) в одном алфавите, таблица из 4-х групп, распадается на 8 строк. Если в строке реализуются все варианты, то она соответствует 6-ти буквенному алфавиту, если один вариант не реализуется, то – 4-х буквенному.

 

Восемь вариантов 6-ти буквенных типа (A)UGCBS

 

 

Пиримидины – только изомеры U  и C. Пуриноподобные молекулы в 4-х протоалфавитах являются изомерами (A) и G, а в 4-х – имеют один атом азота в пятиугольнике и так же являются изомерами соответствующего "написания" (A) и G.

 

В "земном" варианте обозначены буквы (A),U,C,G, а две дополнительные буквы обозначены B и S, как в статье "ДНК и РНК Хатимодзи: генетическая система из восьми строительных блоков" (Ш. Хошик и др. 2019) [1]. В статье, авторы приводят результаты успешных испытаний 8-ми буквенного алфавита, включающего B и S и еще 2 молекулы, которые не удовлетворяют двум из шести требованиям, которым должны удовлетворять молекулы первичного репликатора (подробнее об этом в Обсуждении).

 

В 6-ти буквенных протоалфавитах типа (A)UGCBS, разница между двумя из трех парами букв (между G-C и B-S) намного меньше разницы с третьей парой букв ((A)-U).  Если предположить, что по химическим, статистическим или эволюционным причинам реализуется только одна из близких пар, то из каждого 6-ти буквенного алфавита получается два 4-х буквенных, всего шестнадцать, по восемь алфавитов типов (A)UBS и (A)UGC.

 

 

Все эти алфавиты, являются близкими изометрическими аналогами (A)UGC, а так же обладают свойством максимально возможной простоты для первичного алфавита жизни построенного на супрамолекулах с тремя водородными связями.

 

 

 

 

Алфавиты жизни возможны в 48-х вариантах

 

Здесь все возможные конфигурации поляризационных частей молекул с двойными связями

 

 

 

Для каждой соответствующей Требованию №1 конфигурации супрамолекул с тройными и аналогичной конфигурации супрамолекул с двойными связями прорисуем (в формате структурной формулы) прилегающие ковалентные связи определяемые этими конфигурациями.

 

Буквы обозначают соответствие азотистым основаниям

 

 

 

 

Обе конфигурации с тройными связями при выполнении требований №№ 2-5,соответствуют пиримидин-пурин-подобным супрамолекулам. Конфигураций с двойными связями соответствующих требованиям №№ 2-5 – десять, причем две из них повторяют одну из конфигураций с тройными связями с редукцией одной аминогруппы. Из оставшихся восьми, две конфигурации (справа внизу) не соответствуют Требованию №4. Остальные варианты с двойными связями, при анализе соответствия требованиям №№ 2-5, приводят к трем пурин-пурин-подобным и к трем пиримидин-пиримидин-подобным супрамолекулам, т.е. не соответствуют Требованию №6 и несовместимы для репликации с любой из пар (A)-U, G-C, A-U, {A}-U, B-S.

 

Вывод: 6-аминопурин наряду с 2-аминопурином являются единственными возможными вариантами трансформации прототоалфавита построенного на супрамолекулах с 3-мя водородными связями в алфавит с одной (из трех или из двух) супрамолекулой на 2-х водородных связях

 

 

 

 

Таким образом, возможны 48 вариантов алфавита жизни, они распадаются на 8 групп

 

                  

 

 

В таблице приведем только варианты алфавитов соответствующих "земной" группе, как и для других групп, их 6

 

 

 

 

 

 

 

Обсуждение

 

Сравнение алфавитов, использующих и не использующих двойную связь

 

2,6-диаминопурин с его способностью связываться с урацилом в комплементарную пару прочнее, чем аденин, не ускользнул от внимания химиков, изучающих неферментативную репликацию и репликацию, катализируемую рибозимами. Использование в экспериментах 2,6-диаминопурина вместо аденина облегчает репликацию. Например, в обзорной статье "За пределами ДНК и РНК: расширяющийся инструментарий синтетической генетики" (A. I. Taylor et al., 2019) [4] говорится следующее: "2,6-диаминопурин, по-видимому, имеет некоторые преимущества перед аденином, поскольку обеспечивает более стабильное спаривание с уридином или тимидином, что может помочь синтезу РНК рибозимами РНК-полимеразами (Attwater et al. 2013)".

 

Если предположить, что для эволюции уже на начальной стадии предпочтительнее вариант на одной 3-х и на одной 2-х водородных связях, чем на двух 3-х водородных связях, то уже протоалфавитом жизни должны быть (с точностью до 8 модификаций каждый) AUGC, {A}UGC, AUBS или {A}UBS.

 

Здесь некоторые вероятные причины (специально не рассматриваются причины связанные с легкостью синтеза и т.п., в статье с самого начала определено, что химические знания о циклических молекулах ограничены 4-мя общеизвестными), по которым протоалфавит использующий только тройные связи мог трансформироваться в алфавит использующий одну двойную связь:

     1. Когда скорость сборки цепочек за счет действия первичных рибозимов повысилась настолько, что прочность водородных связей между комплементарными нуклеотидами могла несколько ослабнуть, 2,6-диаминопурин заменился на аденин (6-аминопурин) и в соответствующей одной из двух пар тройная водородная связь заменилась на двойную. Причиной этого события были необходимость большего химического разнообразия для рибозимов или (и) повышения количества мутаций ускоряющих дарвиновскую эволюцию.

     2. Аденин и 2-аминопурин немного проще (легче и имеет на один атом азота меньше, чем 2,6-диаминопурин).

     3. При полимеризации именно потеря аминогруппы у 2,6-диаминопурина делает для него невозможным неправильную "зеркальную" ориентацию, что должно быть полезно при неферментативной репликации. Если работает эта причина, то она же является причиной того, что G и C не могут сосуществовать с B и S при неферментативной репликации, и абиогенный протоалфавит не может быть 6-ти буквенным.

 

 

 

 

 

 

(A)UGC – алфавит вирусов


В той же статье "За пределами ДНК и РНК: расширяющийся инструментарий синтетической генетики" (A. I. Taylor et al., 2019) [3] отмечается: "2,6-диаминопурин встречается только у цианофагов (вирусов цианобактерий) (Weigele and Raleigh 2016). Эта и другие модификации (имеются в виду модификации канонических нуклеотидов) могут представлять собой рудименты широкого круга пребиотических систем спаривания оснований, которые не были впоследствии стабильно инкорпорированы в биологию".

 

Идея о природе 2,6-диаминопурин в алфавите вирусов цианобактерий, как о рудиментарном проявлении конкурирующих разнообразных систем комплементарно спаривающихся оснований противоречит логике о необходимости абиогенно генерируемой однозначности супрамолекул уже на начальных этапах возникновения неферментативной репликации.

 

Можно предположить, что у вирусов 2,6-диаминопурин не рудиментарный, а является более поздней обратной заменой аденина (уже после события замены 2,6-димаминапурина на аденин), что помогает им избежать деградации бактериальными ферментами рестрикции (Yan Zhoy and Xuexia, 2021) [6].

 

 

 

 

Азотистые гетероциклы в метеоритах

 

В статье "Содержание гетероциклов азота в метеоритах и их значение для зарождения жизни" (Martins, 2018) [4] приведен полный список азотистых гетероциклов, найденных в метеоритах. В пуриноподобных молекулах нет 5-ти угольников с одним атомом азота. Но, вероятно, в других условиях, чем в Солнечной системе они могут возникать.

 

 

 

Ксенонуклеиновые кислоты

 

Ниже продемонстрировано на примере РНК Хатимодзи, как могут быть подвергнуты сомнению не соответствующие модификациям (A)UGCBS протоалфавиты жизни.

 

"ДНК (РНК) Хатимодзи - синтетический аналог нуклеиновой кислоты, который использует четыре синтетических нуклеотида в дополнение к четырем, присутствующим в природных нуклеиновых кислотах, ДНК и РНК".

"НАСА: Обнаружение жизни становится все более важной целью миссий по планетологии, и эта новая работа поможет разработать эффективные инструменты и эксперименты,... она расширяет наше понимание о молекулах, которые могли бы хранить информацию о внеземной жизни". (Wikipedia) [5]

 

Две нижние пары на рисунке – основания Хатимодзи

 

 

 

 

Молекулы B и S входят в 6-ти буквенный протоалфавит, который в нашей статье выведен как теоретически единственно возможный (с точностью до 8 модификаций) в рамках соответствия требованиям №№1-6.

 

В отличие от абиогенно созданного протоалфавита, искусственные дополнительные буквы-молекулы могут не удовлетворять 3-м из 6-ти требований:

(3) устойчивость к УФ-облучению,

(4) однотипность конфигурации циклической части,

(5) способность к реакциям присоединения при нормальных условиях.

Именно это мы видим в молекулах P и Z алфавита Хатимодзи.

 

Молекула P не удовлетворяет требованию устойчивости к УФ-облучению (имеет 3 атома азота в цикле), а молекула Z не удовлетворяет требованию иметь возможность присоединения при нормальных условиях, т.е. через N-H. Вероятно, связь Z с рибозой происходит при специальных (ненормальных) условиях. Нитрогруппа "утяжеляет" соединение, дополнительно расходует один атом азота и два кислорода, и не способствует устойчивости.

 

Интересно, что в двух дополнительных парах алфавита Хатимодзи используются только супрамолекулы с тройными связями. Вероятно, это следствие того, что супрамолекулы с двойными связями (которых можно "изобрести" большее разнообразие) хуже (недостаточно точно или медленнее) супрамолекузируются даже под контролем полимеразы.

 

В качестве не удовлетворяющего требованию №4 и, вероятно, не удовлетворяющего требованию №3, можно привести варианты гипотетических молекул с 3-мя водородными связями с атомом кислорода в одном из 6-ти угольных гетероциклов супрамолекул

 

 

 

 

 

 

Генезис и математика алфавита жизни

 

В статье поиск возможных алфавитов жизни проведен в порядке, который кажется наиболее естественным. Порядок применения требований, вероятно, соответствует генезису AUGC и демонстрирует вероятный эволюционный путь происхождения алфавита. Однако, скорее всего, математики занимающиеся теорией множеств решили бы задачу на более общем уровне. Требования от №1 до №6, почти наверняка, обладают свойством перестановочности: применение требований от №1 до №6 в любом порядке даст одинаковый результат.

 

 

 

 

 

 

 

 

 

Литература

 

[1]    Shuichi Hoshika et al. Hachimoji DNA and RNA: A genetic system with eight building blocks. Science Feb 2019

 

[2]    Z. Peeters, O. Botta, S. B. Charnley et al. The effect of nitrogen on the photostability of small aromatic molecules. A&A 433, 583-590 (2005)

 

[3]    Alexander I Taylor, Gillian Houlihan, Philipp Holliger. Beyond DNA and RNA: The Expanding Toolbox of Synthetic Genetics. National Center for Biotechnology Information. 2019 Jun

 

[4]    Zita Martins. The nitrogen heterocycle content of meteorites and their significance for the origin of life. National Center for Biotechnology Information. 2018 Jul

 

[5]    From Wikipedia. Hachimoji DNA

 

[6]    Y. Zhou, X. Xua et al. Widespread pathway for substitution of adenine by diaminopurine in phage genomes. Science Apr 2021