Все возможные протоалфавиты жизни являются ближайшими структурными аналогами AUGC
В статье предпринята попытка найти ответ на вопрос почему алфавитом жизни является именно AUGC.
К молекулам, которые должны выполнять функцию алфавита первичного репликатора, сформулированы следующие шесть требований:
(1) прочность соединения в молекулярные пары,
(2) устойчивость пар к растворению,
(3) устойчивость к УФ-облучению,
(4) однотипность конфигурации циклической части,
(5) способность к реакциям присоединения при нормальных условиях,
(6) пары одного алфавита связанные водородными связями должны быть геометрически (по расстоянию и углам) одинаковыми относительно атомов, через которые происходит полимеризация.
Из шести требований последовательно определяются ограничения на возможные конфигурации молекул.
Окончательные конфигурации соответствуют восьми трехпарным 6-ти буквенным протоалфавитам типа (A)UGCBS, где:
1. (A) – не аденин (6-аминопурин), а 2,6-диаминопурин
2. Дополнительные буквы обозначены B и S, как в статье "ДНК и РНК Хатимодзи: генетическая система из восьми строительных блоков" (Ш. Хошик и др. 2019) [1], в которой авторы приводят результаты успешных испытаний 8-ми буквенного алфавита, включающего B и S и еще 2 молекулы не удовлетворяющие двум из шести требованиям (подробнее об этом в Обсуждении).
Здесь восемь возможных 6-ти буквенных модификаций, в первой строке – "земная"
Разница между двумя из трех парами букв (между G-C и B-S) намного меньше разницы с третьей парой букв ((A)-U). Если предположить, что близкие пары не могут сосуществовать внутри одного алфавита, то восемь 6-ти буквенных протоалфавитов распадаются на шестнадцать 4-х буквенных, в которых отсутствует одна из двух близких пар, т.е. на алфавиты типов (A)UBS и (A)UGC.
Здесь шестнадцать возможных 4-х буквенных модификаций
В смысле близкой изометрической схожести все протоалфавиты являются аналогами (A)UGC.
Переход с 2,6-диаминопурина (A) на аденин A мог происходить по разным сценариям, об этом – в разделе Обсуждения.
Первое требование – базовое для представленного рассмотрения и эквивалентно требованию 3-х водородных связей в каждой паре букв протоалфавита. В поддержку правильности первого требования, кроме логичного предположения, что тройные связи принципиально лучше, чем двойные обеспечивают неферментативную репликацию (которая необходима для старта эволюции): 1. В результате анализа в статье обнаруживается, что тройные связи гарантируют главное свойство алфавита – однозначность (с каждой молекулой алфавита может связаться водородными связями только одна другая молекула алфавита), что не гарантируется в случае с двумя водородными связями, анализ которых – за пределами основной части статьи, на качественном уровне он проводится в разделе Обсуждение. 2. Непредопределенный итоговый результат – при принятии базового требования варианты протоалфавита сводятся к (A)UGC (с точностью до 24-х модификаций), т.е. к максимально близкому с единственно известным реальным.
Поскольку земной алфавит конкретно AUGC (а не его модификации), то земным протоалфавитом жизни был или (A)UGCBS или (A)UGC.
Первое требование к молекулам проанализировано без учета возможных гипотетически существующих вариантов со сложными и геометрически сложно согласуемыми для трех связей радикалами. Учитывая это, результат анализа можно сформулировать более строго: восемь 6-ти буквенных модификаций (A)UGCBS, восемь 4-х буквенных модификаций (A)UBS и восемь 4-х буквенных модификаций (A)UGC является простейшими возможными протоалфавитами жизни.
В разделе Обсуждение рассмотрена возможность снижения строгости Требования №1 (в ущерб эффективности неферментативной репликации) до уровня допускающего необходимость тройной связи только в одной паре. Удивительно, что такое понижение уровня строгости приводит к алфавитам с единственной заменой (A) на A и на {A} ({A} – 2-аминопурин), т.е. AUGCBS, AUBS, AUGC и их варианты с {A} и, таким образом, этап протоалфавита мог бы быть исключен.
Введение
Вся генетическая информация на Земле записывается в виде полимера РНК или ДНК. Алфавитом для этой записи являются 4 молекулы – нуклеотиды. Для РНК их азотистые основания выглядят так:
Исключением являются некоторые вирусы (цианофаги), которые вместо аденина используют 2,6-диаминопурин, это исключение рассмотрено в разделе Обсуждение.
Нуклеотиды, переменной "алфавитообразующей" частью которых являются азотистые основания, создаются живыми организмами. Сами эти молекулы или их химически близкие предшественники изначально должны были образовываться абиогенно и выиграть конкуренцию у других возможных вариантов. Почему именно конкретно эти молекулы или их химическии близкие предшественники стали протоалфавитом для записи генетической информации и, какие алфавиты могли и могут возникать в других условиях (на планетах Солнечной системы и экзопланетах), до сих пор не известно. В статье предпринята попытка найти ответ на этот вопрос опираясь на логику и самые базовые сведения о свойствах циклических молекул.
К молекулам, которые должны выполнять функцию алфавита первичного репликатора, сформулированы следующие шесть требований:
(1) прочность соединения в молекулярные пары,
(2) устойчивость пар к растворению,
(3) устойчивость к УФ-облучению,
(4) однотипность конфигурации циклической части,
(5) способность к реакциям присоединения при нормальных условиях,
(6) пары одного алфавита связанные водородными связями должны быть геометрически (по расстоянию и углам) одинаковыми относительно атомов, через которые происходит полимеризация.
Статья посвящена циклическим молекулам, однако в ней не использованы знания о химических свойствах циклических молекул, кроме четырех общеизвестных:
1. В ациклических молекулах большее, чем в циклических количество степеней свободы, с их участием невозможны устойчивые межмолекулярные конфигурации связанные водородными связями. 3-х и 4-х угольные циклические молекулы являются напряженными и не стабильны. Самые простые из обладающих высокой стабильностью – 5-ти и 6-ти угольные циклические молекулы, дополнительную устойчивость дает их ароматическая структура.
2. В 5-ти и 6-ти угольных циклических молекулах ни один атом углерода в цикле не создает две двойные связи. Стереохимически такая возможность возникает только начиная с 8-ми угольных циклов.
3. Циклические молекулы содержащие гидроксильные группы –ОН имеют повышенную химическую активность и быстро переходят в кето-форму =O, циклические молекулы содержащие –ОН далее не рассматриваются.
4. Циклические молекулы легче вступают в реакции присоединения через N-H, чем через C-H (связь N-H полярная, в отличие от связи C-H, где разница в электроотрицательности между углеродом и водородом слишком мала, поэтому группа N-H химически активнее), присоединение через N-H может происходить в нормальных условиях.
Кроме этих четырех положений химии циклических молекул, рассуждения основываются только на общих представлениях о ковалентных связях, которые достаточно однозначно (для логических построений данной статьи) определяют конфигурацию и геометрию циклических молекул. В каком-то смысле, рассматриваются вообще все циклические молекулы, которые в принципе не противоречат элементарным представлениям о ковалентных связях и удовлетворяют правдоподобным требованиям для осуществления функции алфавита репликатора (это и дает возможность не прибегать к знаниям о химических свойствах этих чрезвычайно разнообразных молекул).
Супрамолекулы
Правдоподобная репликация может быть организована только с помощью матричного копирования. Правдоподобный и, возможно, единственный способ матричного копирования при нормальных условиях – через водородные связи между молекулами (ионные связи, вероятно, слишком прочные для нормальных условий). В статье супрамолекулами названы молекулярные пары объединенные межмолекулярными водородными связями (поляризационными связями).
Межмолекулярные связи через водород создаются между атомами фтора, кислорода и азота. Водородные связи через фтор самые сильные, но фтора в природе мало. Водородные межмолекулярные связи имеющие существенное значение создаются только атомами кислорода и азота.
Чтобы образовалась водородная связь, водород должен быть на атоме кислорода или азота. Существует три водородные связи N–H-N, O–H-N, O–HH-N. Причем, связь N–H-N, в силу меньшей электроотрицательности азота, самая слабая.
Тройные связи Требование №1
Чем больше поляризационных связей, тем прочнее циклические молекулы связаны и тем устойчивее возникающая супрамолекула в водном растворителе.
5-ти угольные циклы геометрически могут создать супрамолекулы только с двумя связями, 6-ти угольные геометрически могут создавать супрамолекулы с тремя связями.
Введем Требование №1: для прочной связи (необходимой для неферментативной репликации, без которой не может стартовать эволюция) циклические молекулы должны быть связаны тремя поляризационными связями.
Супрамолекулы связанные двумя водородными связями рассмотрены в Обсуждении, где для молекул образующих такие супрамолекулы, кроме меньшей прочности соединения, обнаруживается дополнительная причина, почему они не подходят для алфавита первичной репликации: они не гарантируют соблюдения главного свойства алфавита – однозначности. Кроме этого, от обратного, правильность принятия Требования №1 подтверждается непредопределенным итоговым результатом – варианты протоалфавита сводятся к (A)UGC (с точностью до модификаций), т.е. к максимально близкому с единственно известным реальным.
Геометрическая совместимость сразу 3-х водородных связей налагает существенные ограничения на соотношение длин атомных групп, которыми они образуются. В статье рассматриваются только простейшие атомные группы, другие будут более сложными и длинными, геометрическое согласование дополнительно усложнится (вероятно, такие согласования вообще невозможны). Далее, в тексте статьи, простейшие конфигурации атомов создающие водородные связи будем называть водородными связями.
Тройные связи без короткой связи N–H-N в средней вершине геометрически невозможны.
Использовать связь O–HN в верхних и нижних вершинах без аминогруппы, так же не получается, не хватает длины
Существуют 3 геометрически возможные конфигурации с 3-мя водородными связями с атомом кислорода в одном из 6-ти угольных гетероциклов супрамолекул
Однако, такие супрамолекулы заведомо не удовлетворяют Требованию №4 (обоснование в соответствующем параграфе), поэтому далее они не рассматриваются.
Существуют только 2 геометрически возможные конфигурации с 3-мя водородными связями (удовлетворяющих базовому Требованию №1) и не нарушающими априори ни одного из пяти не базовых требований к молекулам, которые должны выполнять функцию алфавита первичного репликатора
Устойчивость к растворению
Требование №2
Для каждой возможной базовой конфигурации супрамолекулы с тройными связями прорисуем (в формате структурной формулы) ковалентные связи определяемые этими конфигурациями
Назовем сторону циклической молекулы, которая участвует в трех поляризационных связях, поляризационной стороной. Заметим, что в каждой супрамолекуле с тремя поляризационными связями один гетероцикл имеет между поляризационной и неполяризационной сторонами конфигурацию ковалентных связей 2/1, а второй 1/1.
В общем виде супрамолекулы с тройными связями выглядят так:
Требование №2: для противодействия растворению в водном растворе на неполяризационной стороне каждого гетероцикла в паре должно быть не более одной группы способной создавать водородную связь, причем самой слабой, а именно N-H.
Для конфигураций 2/1 и 1/1 возможны варианты
Устойчивость к УФ-облучению
Требование №3
В работе "Образование и фотостабильность N-гетероциклов в космосе" (Peeters et al., 2005) [2] проводилось сравнительное исследование УФ-устойчивости трех 6-угольных гетероциклов: с одним азотом (пиридин), с двумя азотами (пиримидин) и с тремя (1,3,5-триазин). Оказалось, что чем больше атомов азота в цикле, тем ниже устойчивость к УФ. Быстрее всего разрушается триазин, потом пиримидин, а устойчивее всех оказался пиридин.
Требование №3: 6-ти угольные циклы должны содержать не более 2-х атомов азота.
Остаются только гетероциклы содержащие не более 2-х атомов азота (в средней вершине поляризационной стороны уже есть один атом азота)
Однотипность 6-ти угольников всех молекул Требование №4
Логично предположить, что молекулы в супрамолекулах должны быть однотипны. Оставим на кандидаты в молекулы конфигурации 2/1 только такие, у которых 6-ти угольник такой же, как в молекулах конфигурации 1/1, в смысле, что содержит 2 атома азота расположенные через один атом углерода. Необходимые для конфигурации 1/1 такие циклы обязательно должны образоваться, значит в конкретной локации химический путь для них уже существует, а их способность к трансформации в молекулу конфигурации 2/1 делает систему более гибкой и простой, чем если бы 6-ти угольники имели бы разное количество или разное расположение атомов азота.
Требование №4: Расположение атомов азота в конфигурациях 2/1 и 1/1 должно быть одинаковым.
Для конфигурации 2/1 остаются только два варианта
Способность к полимеризации Требование №5
Супрамолекулам необходимо вступать в реакции присоединения с молекулами способными создавать полимеры.
Супрамолекулы могут ковалентно присоединять, например, сахара или аминокислоты, но для этого они должны на неполяризационной стороне в одной из вершин иметь N-H. Конфигурации 1/1 имеют такую вершину, а конфигурации 2/1 не имеют.
Самая стабильная молекула соответствующая циклической 6-ти угольной – соединенная из 5-ти и 6-ти угольника "пуриноподобная" молекула (в ней присоединенная часть так же высокостабильная циклическая).
Требование №5: Для "пуриноподобных" частей супрамолекул, имеющих в 5-ти угольном цикле N-H, так же, как для пиримидиновых частей, должно выполняться Требование №2 (отсутствие других групп способных создавать водородные связи).
Возможны следующие 8 вариантов "пуриноподобных" молекул удовлетворяющих Требованию №5
Покажем здесь полные наборы вариантов молекул конфигураций 2/1 и 1/1
Могут быть реализованы следующие 32 варианта
Перевернем молекулы в 2-х правых колонках и отметим одинаковые молекулы метками одного цвета
Уберем повторяющиеся, получим 24 уникальные пары удовлетворяющие требованиям от №1 до №5
Конгруэнтность пар присоединения супрамолекул одного алфавита
Требование №6
Требование №6: чтобы супрамолекулы могли полимеризоваться на регулярных остовах, конфигурации супрамолекул одного алфавита по геометрии расположения N-H должны быть одинаковыми.
24 супрамолекулы по конфигурациям расположения N-H распадаются на 4 группы, в каждой по 6 супрамолекул
Модификации по количеству атомов азота в 5-ти угольном цикле
В каждой группе есть модификации по количеству атомов азота в 5-ти угольном цикле
Можно предположить, что в алфавите могут встречаться обе модификации, тогда модификации с одним и с двумя атомами азота в 5-ти угольном цикле можно назвать различными "написаниями" одной и той же буквы.
Однако, есть фундаментальная причина невозможности сосуществования букв с разным "написанием" в одном протоалфавите жизни.
В алфавите, как носителе информации, пуриноподобные варианты с одним и с двумя атомами азота в 5-ти угольниках равнозначны. Но, в РНК (или полимере с азотистыми основаниями разных модификаций или построенном на другом остове) комплементарные друг к другу цепочки информационно одинаковые, но химически разные. Это дает возможность одной из цепочек после распада двойной цепи быть носителем информации (генотипа) и матрицей для размножения, а второй (кроме того, чтобы быть матрицей для размножении генотипа) – рибозимом или совокупностью рибозимов (или их аналогами, если основа не рибозная). Для рибозимной цепочки, в отличие от информационной (информационная цепь менее чувствительна к химической разнице, чем рибозимная), нужно иметь строго определенные химические свойства, поэтому не может быть использован алфавит с разными "написаниями" букв.
Можно обойти проблему различных "написаний" и по-другому (если считать, что и для рибозимов такая небольшая разница не замечается отбором): сначала может использоваться алфавит с вариантом "написания", но уже на биогенном уровне синтеза нуклеотидов возникает полная унификация.
Можно, конечно, посмотреть пути создания пуриноподобных молекул и, вероятно, будут химические причины по которым на первобытной Земле (или вообще в Солнечной системе) не возможны варианты с одним атомом азота в 5-ти угольнике пуриноподобной молекулы, но это не гарантирует от того, что в неизвестных условиях (на экзопланетах) могут найтись такие пути. Т.е. можно допустить, что возможна жизнь на модификациях пуриноподобных молекул с одним атомом азота в 5-ти угольнике (интересно отметить, что такой алфавит еще проще, уже предельно простой).
Протоалфавиты жизни возможны в 24-х вариантах
С учетом невозможности существования разных "написаний" (модификаций по количеству атомов азота в 5-ти угольном цикле) в одном алфавите, таблица из 4-х групп, распадается на 8 строк. Если в строке реализуются все варианты, то она соответствует 6-ти буквенному алфавиту, если один вариант не реализуется, то – 4-х буквенному.
Восемь вариантов 6-ти буквенных типа (A)UGCBS
Пиримидины – только изомеры U и C. Пуриноподобные молекулы в 4-х протоалфавитах являются изомерами (A) и G, а в 4-х – имеют один атом азота в пятиугольнике и так же являются изомерами соответствующего "написания" (A) и G.
В "земном" варианте обозначены буквы (A),U,C,G, а две дополнительные буквы обозначены B и S, как в статье "ДНК и РНК Хатимодзи: генетическая система из восьми строительных блоков" (Ш. Хошик и др. 2019) [1]. В статье, авторы приводят результаты успешных испытаний 8-ми буквенного алфавита, включающего B и S и еще 2 молекулы, которые не удовлетворяют двум из шести требованиям, которым должны удовлетворять молекулы первичного репликатора (подробнее об этом в Обсуждении).
В 6-ти буквенных протоалфавитах типа (A)UGCBS, разница между двумя из трех парами букв (между G-C и B-S) намного меньше разницы с третьей парой букв ((A)-U). Если предположить, что по химическим, статистическим или эволюционным причинам реализуется только одна из близких пар, то из каждого 6-ти буквенного алфавита получается два 4-х буквенных, всего шестнадцать, по восемь алфавитов типов (A)UBS и (A)UGC.
Все эти алфавиты, являются близкими изометрическими аналогами (A)UGC, а так же обладают свойством максимально возможной простоты для первичного алфавита жизни построенного на супрамолекулах с тремя водородными связями.
Обсуждение
Абиогенно сгенерированная однозначность (A)UGCBS
Кроме необходимой прочности связи (Требование №1), существует еще одна причина, почему в абиогенном протоалфавите жизни должны быть супрамолекулы с тремя связями.
Для супрамолекул с тремя водородными связями с применением еще 5 требований достигается однозначность (когда с каждой молекулой алфавита может создавать супрамолекулу только одна другая молекула алфавита).
В биогенном алфавите однозначность достигается за счет того, что не генерируются никакие молекулы нарушающие однозначность. Если в приложении к абиогенному миру рассматривать в дополнение к супрамолекулам с тройными связями супрамолекулы с двойными связями (здесь все возможные варианты)
т.е. если бы Требование №1 не выполнялось, то остальные 5 требований приводили бы к большему разнообразию молекул и получившееся множество молекул не могло бы обладать свойством однозначности, т.е. не обладало бы главным свойством алфавита. Могла бы возникать, например, такая ситуация
Даже при наличии (A), U, G, C, B и S, при эффективной конкуренции со стороны молекул способных создавать двойные водородные связи, информация при репликации не могла бы сохраняться (РНК, в отличие от ДНК, несет информацию, которая является информацией о химии самой РНК, поэтому тут нет аналога вырожденности, такого как в генетическом коде. Если возможна комплементарность одной молекулы с двумя хоть сколько-нибудь отличными молекулами, то это именно потеря информации).
Анализ супармолекул с двойными связями
Для каждой соответствующей Требованию №1 конфигурации супрамолекул с тройными и аналогичной конфигурации супрамолекул с двойными связями прорисуем (в формате структурной формулы) прилегающие ковалентные связи определяемые этими конфигурациями.
Буквы обозначают соответствие азотистым основаниям
Обе конфигурации с тройными связями при выполнении требований №№ 2-5, соответствуют пиримидин-пурин-подобным супрамолекулам. Конфигураций с двойными связями соответствующих требованиям №№ 2-5 – десять, причем две из них повторяют одну из конфигураций с тройными связями с редукцией одной аминогруппы. Из оставшихся восьми, две конфигурации (справа внизу) не соответствуют Требованию №4. Остальные варианты с двойными связями, при анализе соответствия требованиям №№ 2-5, приводят к трем пурин-пурин-подобным и к трем пиримидин-пиримидин-подобным супрамолекулам, т.е. не соответствуют Требованию №6 и несовместимы для репликации с любой из пар (A)-U, G-C, A-U, {A}-U, B-S.
Вывод: 6-аминопурин наряду с 2-аминопурином являются единственными возможными вариантами трансформации прототоалфавита построенного на супрамолекулах с 3-мя водородными связями в алфавит с одной (из трех или из двух) супрамолекулой на 2-х водородных связях.
Сравнение алфавитов, использующих и не использующих двойную связь
2,6-диаминопурин с его способностью связываться с урацилом в комплементарную пару прочнее, чем аденин, не ускользнул от внимания химиков, изучающих неферментативную репликацию и репликацию, катализируемую рибозимами. Использование в экспериментах 2,6-диаминопурина вместо аденина облегчает репликацию. Например, в обзорной статье "За пределами ДНК и РНК: расширяющийся инструментарий синтетической генетики" (A. I. Taylor et al., 2019) [4] говорится следующее: "2,6-диаминопурин, по-видимому, имеет некоторые преимущества перед аденином, поскольку обеспечивает более стабильное спаривание с уридином или тимидином, что может помочь синтезу РНК рибозимами – РНК-полимеразами (Attwater et al. 2013)".
Если предположить, что для эволюции уже на начальной стадии предпочтительнее вариант на одной 3-х и на одной 2-х водородных связях, чем на двух 3-х водородных связях, то уже протоалфавитом жизни должны быть (с точностью до 8 модификаций каждый) AUGC, {A}UGC, AUBS или {A}UBS.
Здесь некоторые вероятные причины (специально не рассматриваются причины связанные с легкостью синтеза и т.п., в статье с самого начала определено, что химические знания о циклических молекулах ограничены 4-мя общеизвестными), по которым протоалфавит использующий только тройные связи мог трансформироваться в алфавит использующий одну двойную связь:
1. Когда скорость сборки цепочек за счет действия первичных рибозимов повысилась настолько, что прочность водородных связей между комплементарными нуклеотидами могла несколько ослабнуть, 2,6-диаминопурин заменился на аденин (6-аминопурин) и в соответствующей одной из двух пар тройная водородная связь заменилась на двойную. Причиной этого события были необходимость большего химического разнообразия для рибозимов или (и) повышения количества мутаций ускоряющих дарвиновскую эволюцию.
2. Аденин и 2-аминопурин немного проще (легче и имеет на один атом азота меньше, чем 2,6-диаминопурин).
3. При полимеризации именно потеря аминогруппы у 2,6-диаминопурина делает для него невозможным неправильную "зеркальную" ориентацию, что должно быть полезно при неферментативной репликации. Если работает эта причина, то она же является причиной того, что G и C не могут сосуществовать с B и S при неферментативной репликации, и абиогенный протоалфавит не может быть 6-ти буквенным.
(A)UGC – алфавит вирусов
В той же статье "За пределами ДНК и РНК: расширяющийся инструментарий синтетической генетики" (A. I. Taylor et al., 2019) [3] отмечается: "2,6-диаминопурин встречается только у цианофагов (вирусов цианобактерий) (Weigele and Raleigh 2016). Эта и другие модификации (имеются в виду модификации канонических нуклеотидов) могут представлять собой рудименты широкого круга пребиотических систем спаривания оснований, которые не были впоследствии стабильно инкорпорированы в биологию".
Идея о природе 2,6-диаминопурин в алфавите вирусов цианобактерий, как о рудиментарном проявлении конкурирующих разнообразных систем комплементарно спаривающихся оснований противоречит логике о необходимости абиогенно генерируемой однозначности супрамолекул уже на начальных этапах возникновения неферментативной репликации.
Можно предположить, что у вирусов 2,6-диаминопурин не рудиментарный, а является более поздней обратной заменой аденина (уже после события замены 2,6-димаминапурина на аденин), что помогает им избежать деградации бактериальными ферментами рестрикции (Yan Zhoy and Xuexia, 2021) [6].
Азотистые гетероциклы в метеоритах
В статье "Содержание гетероциклов азота в метеоритах и их значение для зарождения жизни" (Martins, 2018) [4] приведен полный список азотистых гетероциклов, найденных в метеоритах. В пуриноподобных молекулах нет 5-ти угольников с одним атомом азота. Но, вероятно, в других условиях, чем в Солнечной системе они могут возникать.
Ксенонуклеиновые кислоты
Ниже продемонстрировано на примере РНК Хатимодзи, как могут быть подвергнуты сомнению не соответствующие модификациям (A)UGCBS протоалфавиты жизни.
"ДНК (РНК) Хатимодзи - синтетический аналог нуклеиновой кислоты, который использует четыре синтетических нуклеотида в дополнение к четырем, присутствующим в природных нуклеиновых кислотах, ДНК и РНК".
"НАСА: Обнаружение жизни становится все более важной целью миссий по планетологии, и эта новая работа поможет разработать эффективные инструменты и эксперименты,... она расширяет наше понимание о молекулах, которые могли бы хранить информацию о внеземной жизни". (Wikipedia) [5]
Две нижние пары на рисунке – основания Хатимодзи
Молекулы B и S входят в 6-ти буквенный протоалфавит, который в нашей статье выведен как теоретически единственно возможный (с точностью до 8 модификаций) в рамках соответствия требованиям №№1-6.
В отличие от абиогенно созданного протоалфавита, искусственные дополнительные буквы-молекулы могут не удовлетворять 3-м из 6-ти требований:
(3) устойчивость к УФ-облучению,
(4) однотипность конфигурации циклической части,
(5) способность к реакциям присоединения при нормальных условиях.
Именно это мы видим в молекулах P и Z алфавита Хатимодзи.
Молекула P не удовлетворяет требованию устойчивости к УФ-облучению (имеет 3 атома азота в цикле), а молекула Z не удовлетворяет требованию иметь возможность присоединения при нормальных условиях, т.е. через N-H. Вероятно, связь Z с рибозой происходит при специальных (ненормальных) условиях. Нитрогруппа "утяжеляет" соединение, дополнительно расходует один атом азота и два кислорода, и не способствует устойчивости.
Интересно, что в двух дополнительных парах алфавита Хатимодзи используются только супрамолекулы с тройными связями. Вероятно, это следствие того, что супрамолекулы с двойными связями (которых можно "изобрести" большее разнообразие) хуже (недостаточно точно или медленнее) супрамолекузируются даже под контролем полимеразы.
В качестве не удовлетворяющего требованию №4 и, вероятно, не удовлетворяющего требованию №3, можно привести варианты гипотетических молекул с 3-мя водородными связями с атомом кислорода в одном из 6-ти угольных гетероциклов супрамолекул
Генезис и математика алфавита жизни
В статье поиск возможных алфавитов жизни проведен в порядке, который кажется наиболее естественным. Порядок применения требований, вероятно, соответствует генезису AUGC и демонстрирует вероятный эволюционный путь происхождения алфавита. Однако, скорее всего, математики занимающиеся теорией множеств решили бы задачу на более общем уровне. Требования от №1 до №6, почти наверняка, обладают свойством перестановочности: применение требований от №1 до №6 в любом порядке даст одинаковый результат.
Почему алфавитом жизни является именно AUGC
Ответ
AUGC – одна из двух возможных трансформаций алфавита построенного на супрамолекулах с тремя водородными связями (A)UGC в алфавит допускающий одну супрамолекулу с двумя водородными связями (замена (A) на A или {A}).
(A)UGC – одна из 24-х простейших возможных совокупность простейших молекул способная генерировать репликацию на трех водородных связях (гипотетически возможные более сложные могут быть только намного более сложными, их радикалы создающие водородные связи должны содержать в разы больше атомов) и состоящая из более, чем одной пары (одна пара была бы очевидно недостаточной для появления рибозимных качеств). Для такого вывода не требуется анализ химических путей, т.е. этот вывод не зависит от возможных химических путей. Монотипность возможных 24 модификаций алфавита репликатора – контринтуитивна, априори кажется, что типов подходящих молекул должно быть больше. Однако, анализ соответствия правдоподобным требованиям для молекул репликатора приводит строго к (A)UGC и еще 23-м его близким структурным аналогам.
С учетом возможности трансформаций в алфавит построенный на супрамолекулах одна из которых может иметь двойную водородную связь, количество возможных алфавитов – 72, один из которых, единственно известный реальный AUGC.
Вероятно, специалисты в азотистых гетероциклах смогут предъявить химические причины невозможности существования некоторых модификаций, тогда детерминированность нашего алфавита жизни дополнительно повысится.
Литература
[1] Shuichi Hoshika et al. Hachimoji DNA and RNA: A genetic system with eight building blocks. Science Feb 2019
[2] Z. Peeters, O. Botta, S. B. Charnley et al. The effect of nitrogen on the photostability of small aromatic molecules. A&A 433, 583-590 (2005)
[3] Alexander I Taylor, Gillian Houlihan, Philipp Holliger. Beyond DNA and RNA: The Expanding Toolbox of Synthetic Genetics. National Center for Biotechnology Information. 2019 Jun
[4] Zita Martins. The nitrogen heterocycle content of meteorites and their significance for the origin of life. National Center for Biotechnology Information. 2018 Jul
[5] From Wikipedia. Hachimoji DNA
[6] Y. Zhou, X. Xua et al. Widespread pathway for substitution of adenine by diaminopurine in phage genomes. Science Apr 2021 |