Задача
«В руках мастера
Ножницы становятся
Искусства частью».
(Неизвестный поэт (ChatGPT))
В настоящее время активно развивается такое направление генной терапии, как геномное редактирование. Предлагаем вам ответить на ряд вопросов, связанных с данной тематикой.

A) Структура и схема применения TALEN (с изменениями из: Jin-Song Xiong, Jing Ding, Yi Li, Genome-editing technologies and their potential application in horticultural crop breeding, Horticulture Research, Volume 2, 2015, 15019). B) Целевой локус для разрезания посредством TALEN. C) Таблица однобуквенного генетического кода.
Задание 1. А) Подумайте, что объединяет подходы, используемые в данной области? Б) Методы геномного редактирования (ГР) могут иметь немало приложений, помимо исправления генетических дефектов. Приведите примеры таких приложений.
А) Методы геномного редактирования основаны на использовании направляемых (тем или иным способом) ферментов, обычно - эндонуклеаз, для прицельного внесения определенных изменений в предварительно выбранных локусах молекул ДНК. Тип изменений, но не всегда то, какое именно изменение будет осуществлено, также определяется при конструировании системы.
Б) Помимо использования в медицинской генетике, методы, на которых основаны подходы геномного редактирования, очевидно могут быть использованы в таких областях, как селекция и генная инженерия. Также возможно их применение в контексте борьбы с инфекционными агентами, что, в какой-то степени, является наиболее "естественным" приложением для, например, CRISPR-систем. Например проводятся исследования, связанные с возможностью полной очистки генома пациента от встроенных лентивирусов.
Задание 2. А) При использовании в медицинской генетике (с целью терапии наследственных заболеваний) в чем заключается принципиальное отличие подхода, характерного для методов геномного редактирования от большинства подходов лекарственной терапии? Б) Традиционно, до активного развития методов геномного редактирования, генная терапия в основном сводилась к так называемой генозаместительной терапии - попробуйте сформулировать, в чем различия этих подходов с точки зрения того, как они осуществляются, длительности эффекта воздействия.
А) Принципиальное отличие методов геномного редактирования, в контексте терапии наследственных заболеваний, - направленность на устранение самой причины заболевания, исправление патологического генетического варианта лежащего в основе патогенеза. Особенно - при моногенных заболеваниях. Лекарственные препараты в случае генетических заболеваний, обычно воздействуют на более поздние звенья патогенетических цепей, и в, любом случае, не могут привести к окончательному излечению
Б) Генозаместительная терапия подразумевает введение в клетки и ткани, где отсутствует или нарушена функция какого-либо гена, соответствующего экзогенного функционального гена, экспрессия которого позволяет уменьшить или устранить влияние имеющегося генетического дефекта. Однако, в отличие от геномного редактирования, методы генозаместительной терапии в большинстве случаев не могут привести к окончательному устранению дефекта даже в случае полностью отсутствующей функции внутреннего гена (т.к. экзогенная копия рано или поздно будет удалена из клетки), а в некоторых случаях, когда в основе заболевания лежит влияние "неправильного" белка, синтезирующегося с "неправильного" гена, введение дополнительной копии гена (хотя и "правильной") может не приводить к значительным улучшениям из-за сохраняющегося влияния внутреннего гена.
Задание 3. А) Из каких живых систем были позаимствованы механизм и основные молекулярные агенты, для CRISPR/Cas систем, используемых в геномном редактировании? В чем состояла их функция там? Б) Какие еще природные системы со сходными функциями, которые можно обнаружить "по соседству" с CRISPR/Cas, вам известны? В чем их отличие и сходство с системами, используемыми в методах геномного редактирования?
А) По одной из основных теорий, система CRISPR является одним из важнейших элементов защитной противофаговой системы бактерий. Короткие направляющие РНК в этой системе синтезируются с фрагментов (спейсеров) генома "интервентов" (чаще всего - фагов) встраиваемых с помощью белков системы CRISPR (минимум Cas1 и Cas2) в CRISPR-кассету. Эти направляющие РНК в комплексе с эффекторными белками (например, та самая Cas9) "обнаруживают" и разрезают геномные НК тех "патогенов" с которыми клетка уже, соответственно, сталкивалась
Б) К таким системам можно отнести систему эндонуклеаз рестрикции, которая также выполняет защитную функцию в клетках бактерий. Сходство с направляемыми эндонуклеазами очевидно - способность "прицельно" разрезать цепи ДНК в локусах с определенными последовательностями. Однако, в отличие от систем, используемых в геномном редактировании, "перепрограммирование" рестриктаз нетривиально. В качестве дополнительного сходства с TALEN и ZFN и отличия от CRISPR/Cas можно упомянуть то, что последовательность целевого локуса определяется аминокислотной последовательностью и трехмерной структурой молекулы фермента, а не дополнительными элементами, такими как направляющая РНК в CRISPR/Cas
Задание 4. A) Каковы компоненты систем на основе CRISPR/Cas, TALEN, ZFN (нуклеазы цинковых пальцев)? Б) Подумайте, какие важные отличия в подходах могут быть при разработке таких систем, связанные с механизмами их функционирование?
А) Для TALEN и ZFN минимальный набор компонентов системы представлен обычно парой нуклеазы, отличающихся специфичностью в отношении двух лежащих рядом локусов в целевой ДНК. В CRISPR/Cas системе, помимо универсального компонента - нуклеазы Cas, имеется также уникальный - направляющая РНК, которая и осуществляет таргетирование.
Б) Важным отличием является именно то, что для систем с использованием TALEN и ZFN приходится разрабатывать эффекторный фермент каждый раз заново для новых локусов, т.к. за узнавание целевой ДНК отвечают домены в составе молекулы эффектора. В системе же CRISPR/Cas за узнавание отвечают достаточно короткие РНК, которую можно синтезировать (либо транскрибировать "по месту действия", если доставка системы осуществляется в виде кодирующего ее вектора) тогда как сам фермент универсален. Разработка и синтез коротких РНК очевидно значительно менее трудоемкий процесс. Кроме того, это дает возможность использования в экспериментах одновременно множества направляющих РНК, специфичных различным целевым локусам.
Задание 5. А) В TALEN (transcription activator like effector nucleases) за узнавание целевой последовательности ДНК отвечает специфический домен в молекуле фермента, составленный из повторов консервативных (за исключением вариабельных 12й и 13й аминокислот) мономеров, длиной в 34 а.к. Вариабельные аминокислоты (RVD сайт) определяют специфичность мономера. Кроме этого, при ответе на вопросы задания нужно иметь в виду:
— Вариабельные аминокислоты и соответствующие нуклеотиды: NI - A, NG - T, NH - G, HD - C,
— Разрезающие ДНК домены FokI располагаются на C конце TALEN и функционируют в виде димера. FokI-домены разных TALEN димеризуются при "посадке" на целевую последовательность и вносят двухцепочечный разрыв в цепь ДНК.
— Мономеры "узнающих" доменов молекулы TALEN связывают нуклеотиды в направлении 5' - 3'. С учетом вышеперечисленного, подумайте, почему пару TALEN на целевом участке располагают так, как это изображено на рисунке?
Б) На схеме TALEN, на N конце присутствует некий участок "NLS" (nuclear localization signal) - зачем он там нужен, в чем его функция?
А) На рисунке молекулы TALEN расположены на разных цепях ДНК в противоположном направлении. Так сделано для того, чтобы обеспечить пространственную близость FokI доменов, разрезающих ДНК будучи в форме димера. Т.к. нуклеотиды связываются мономерами узнающих доменов TALEN в направлении 5' -> 3' - молекулы TALEN должны связывать разные цепи ДНК для того, чтобы совместить в пространстве FokI домены, расположенные на C конце TALEN. При "посадке" на одну цепь FokI были бы разделены всей протяженностью одной из TALEN. Размещение TALEN в одном локусе, но на разных цепях также неэффективно из-за того, что связывание нуклеотидов ограничено направлением 5'- 3', так что у TALEN, связывающих один и тот же участок ДНК, FokI домены оказались бы с разных сторон локуса.
Б) NLS - сигнал ядерной локализации. В молекуле TALEN NLS необходим для взаимодействия с белками импортинами обеспечивающими поступление фермента в ядро клетки, т.е. именно туда, где должен быть осуществлен акт редактирования
Задание 6. А) Определите аминокислотную последовательность уникальных сайтов (общие а.к. следует опустить) в составе "узнающих" доменов TALEN для внесения двухцепочечного разрыва в указанном участке представленной на изображении целевой последовательности - необходимо выбрать ближайший к началу гена локус, соответствующий следующим условиям:
— выбранная длина узнаваемых последовательностей - 17 нуклеотидов;
— длина участка, окруженного таргетируемыми последовательностями, в который и будет внесен разрыв (участок называют спейсером) - обычно составляет 14 - 20 нуклеотидов;
— на 5' конце таргетной последовательности должен предшествовать нуклеотид Т (данное условие связано с особенностями функционирования TALEN). Ответ дать в виде строки, содержащей пары аминокислот, разделенные запятыми.
Б) Какова длина нуклеотидной последовательности, кодирующей вариабельную часть каждой из использованных TALEN, приведите нуклеотидные последовательности, кодирующие вариабельные RVD сайты в виде: пар нуклеотидных триплетов, отделенных запятыми: "ATGGCT,ATGGCT". Поскольку генетический код является вырожденным - используйте первый из возможных кодонов, в предоставленной таблице при ее просмотре сверху вниз, слева направо:
А) Итак: последовательность ДНК, подходящая по условиям задания:
t ggcatcttctgcagagc tggacttcaacctgcagg ctcttctggagcagctc a
левый целевой сайт: ggcatcttctgcagagc - 17 оснований
спейсер: tggacttcaacctgcagg - 18 оснований
правый целевой сайт: gagctgctccagaagag (обратно комплементарен указанной исходной последовательности) - 17 оснований
Аминокислотная последовательность RVD участков соответствующего "узнающего" домена в составе TALEN для левого сайта: NH,NH,HD,NI,NG,HD,NG,NG,HD,NG,NH,HD,NI,NH,NI,NH,HD
для правого сайта: NH,NI,NH,HD,NG,NH,HD,NG,HD,HD,NI,NH,NI,NI,NH,NI,NH
Б) Длина нуклеотидной последовательности, кодирующей вариабельные участки TALEN для обеих составляет 17 \cdot 34 \cdot 3 = 1734. Кодирующая нуклеотидная последовательность:
Для TALEN специфичной левому локусу: AATCAT, AATCAT, CATGAT, AATATT, AATGGT, CATGAT, AATGGT, AATGGT, CATGAT, AATGGT, AATCAT, CATGAT, AATATT, AATCAT, AATATT, AATCAT, CATGAT
правому локусу: AATCAT, AATATT, AATCAT, CATGAT, AATGGT, AATCAT, CATGAT, AATGGT, CATGAT, CATGAT, AATATT, AATCAT, AATATT, AATATT, AATCAT, AATATT, AATCAT
Задание 7. А) В настоящее время в системе CRISPR/Cas "проводником" к месту приложения усилий фермента-эффектора является так называемая направляющая РНК (sgRNA). При этом уникальной, комплементарной целевому локусу (так называемый протоспейсер), является лишь ее часть - crRNA - длиной 20 - 22 нуклеотида. Опишите, как кодируются и транскрибируются такие РНК в природных системах? Б) В чем разница между двумя основными классами природных CRISPRсистем?
А) После вырезания из генетического материала вторгающихся инфекционных агентов коротких последовательностей ДНК, последние подвергаются встраиванию в геномную ДНК бактерии (или археи) в CRISPRкассету. Такая кассета представляет собой череду таких вырезанных спейсеров отделенных друг от друга палиндромными повторами, способными формировать стабильные шпилечные структуры. На 5' конце CRISPR-кассеты располагается регуляторная лидерная последовательность, также, как правило, содержащая промоторную последовательность. Вставка новых спейсеров осуществляется после лидерной последовательности, перед всеми остальными звеньями CRISPRкассеты. Транскрибируется обычно вся кассета целиком как прекурсорная РНК (pre-crRNA), которая, перед тем как связаться с эффекторными Cas белками, подвергается нарезанию на отдельные crRNA
Б) Разница между основными классами природных CRISPR-систем заключается, в первую очередь, в количестве эффекторных белков, участвующих в системе. Если в системах I класса эффекторные функции выполняет комплекс из нескольких белков, часть из которых может быть рекрутирована (вовлечена в процесс) уже после "посадки" на целевой локус, то в системах II класса, к которым в основном относятся те системы, которые используются для решения молекулярно-биологических, генно-инженерных и медицинских, задач, эти функции выполняет один крупный белок
Задание 8. А) При осуществлении редактирования с использованием CRISPR/Cas системы, роль эффекторного фермента заключается во внесении разрыва в целевом локусе в обеих, либо в одной из цепей ДНК, в зависимости от варианта системы (другие варианты CRISPR-систем, осуществляющих прямое внесение изменений в нуклеотидную последовательность цепей ДНК и пр., мы здесь не рассматриваем). Далее в действие должны вступать иные механизмы. Поясните, какие механизмы/события в клетках должны быть задействованы? Чем чревата для клетки недостаточность данных функций? Б) При использовании "классических" вариантов CRISPR/Cas9 системы, события в клетке, следующие за актом разрезания, обычно стараются направить по одному из двух основных путей. Что это за пути? Чем они характеризуются применительно к рассматриваемым процессам (у животных и человека)
А) После внедрения двухцепочечного (или иногда одноцепочечного) разрыва в цепи ДНК, дальнейшие действия должны быть выполнены системами репарации ДНК в клетке. При отсутствии возможности репарировать двухцепочечный разрыв (ДЦР) клетка обычно погибает. Такие разрывы являются триггерами ухода клетки в апоптоз.
Б) Два основных пути репарации, которые обычно полагаются возможными либо предпочтительными при проведении геномного редактирования - это так называемые негомологичное соединение концов (NHEJ) и гомологичная репарация (HDR). Если NHEJ у животных и человека является наиболее активным и частым вариантом репарации ДЦР, действующим на большинстве стадий клеточного цикла, то HDR - малоактивен, его можно наблюдать преимущественно в делящихся клетках. В то же время NHEJ характеризуется частым внедрением в месте разрыва коротких вставок и делеций (что можно использовать для индуцирования сдвига рамки считывания и нокаута генов), тогда как HDR, при котором для восстановления последовательности используется гомологичная матрица (отдельно введенная или, например, гомологичная хромосома), наоборот, практически прецизионно восстанавливает поврежденную молекулу ДНК
Задание 9. А) Для, того чтобы Cas нуклеаза, ведомая направляющей РНК, могла осуществить искомое воздействие на молекулу ДНК в целевом локусе, помимо очевидно необходимой максимальной комплементарности целевой последовательности и crRNA, необходимо выполнение определенного, вполне конкретного условия, связанного с последовательностью ДНК в области целевого локуса. Укажите, что это за условие? Б) Подумайте, какие иные факторы, связанные с ДНК хозяина, могут влиять на эффективность CRISPR/Cas системы в клетках животных и человека?
А) Таким условием является наличие прилегающей к протоспейсеру с 3' конца так называемой PAM последовательности (protospacer adjacent motif), различной для разных эффекторных эндонуклеаз CRISPR/Cas систем.
Б) К факторам, связанным с ДНК хозяина, и влияющим на эффективность "посадки" комплекса эффекторной эндонуклеазы с направляющей РНК на целевой локус в клетках животных и человека, можно отнести состояние, в котором пребывает целевой участок хромосомы. Эффективность редактирования выше на участках, подвергаемых активной экспрессии. Гетерохроматин представляет собой определенное препятствие для работы системы.
Задание 10. А) На последовательности гена PYDC2, представленной на рисунке 1B, подберите по 3 последовательности crRNA для эндонуклеаз SpCas9 (длина crRNA - 20 нуклеотидов) и SaCas9 (длина crRNA - 22 нуклеотида) пригодных для выполнения нокаута этого гена. При выполнении задания считаем, что введение разреза комплексом эндонуклеазы с crRNA равнозначно нокауту *. При выполнении задания необходимо иметь в виду:
— Необходимо учитывать фактор, упомянутый в вопросе 9А, в случае SpCas9 - NGG, SaCas9 - NNGRR, где N подставляется вместо любого нуклеотида, а R - вместо G или A
— разрез производится за 3 нуклеотида от 3' конца crRNA (т.е. нужно найти по 3 crRNA 3' конец которых ближе всего к началу гена). * Нокаут осуществляется созданием сдвига рамки считывания с образованием стоп-кодона далее в последовательности - это, однако, к решению задания не относится.
Б) При предварительном дизайне направляющих РНК (точнее, их уникальных частей - crRNA) обычно учитывают два важных фактора, которые можно оценить численно посредством биоинформатических методов. Укажите, что это за факторы и что они характеризуют.

Б) Важные факторы, которые следует учитывать при дизайне crRNA и которые при этом можно оценить расчетным путем - это индексы ожидаемых целевой (ontarget) и нецелевой (off target) активности этих crRNA. Первый индекс очевидно позволяет предварительно оценить эффективность таргетирования комплекса с этой crRNA на целевой локус, тогда как индекс нецелевой активность призван показывать вероятность посадки (и, соответственно, воздействия эффекторного белка на ДНК) в иных локусах, не предусматриваемых исследователем