Сайт СФУ
Сибирский форум. Интеллектуальный диалог
апрель / 2019 г.

Генетические баталии
в красноярской лаборатории

В лаборатории лесной геномики СФУ собрались четверо. Руководитель лаборатории Константин КРУТОВСКИЙ (ведущий научный сотрудник Института общей генетики им. Н.И. Вавилова, профессор Техасского университета А&М, США, и Гёттингенского университета, Германия), ведущий научный сотрудник Наталья ОРЕШКОВА, заведующий кафедрой высокопроизводительных вычислений Института космических и информационных технологий СФУ Дмитрий КУЗЬМИН и специалист-биоинформатик Юлия ПУТИНЦЕВА. Объединяет их открытие, уникальное по своему масштабу и влиянию на лесную науку — в 2018 году впервые в мире в Сибирском федеральном университете был прочитан полный геном лиственницы сибирской. Красноярские учёные — третьи, кому в принципе удалось расшифровать геном хвойного дерева.

— Расскажите об основных этапах исследования, проводившегося в рамках мегагранта «Геномные исследования основных бореальных лесообразующих хвойных видов и их наиболее опасных патогенов в Российской Федерации». Удалось ли достичь результатов, на которые вы рассчитывали?

К.К.: — В 2011 году наш коллектив одним из первых в мире взялся за амбициозный проект полногеномного прочтения хвойного дерева. Два раза мы подавали заявку на грант, и вот наконец, добившись поддержки Минобра, мы оказались перед грандиозной задачей, которую в то время ещё никто не решил. Генетикой бореальных лесов Сибири в стране успешно занимались несколько лабораторий, в том числе в Красноярске на базе нашего НОЦ «Центр геномных исследований» и в Институте леса СО РАН им. В.Н. Сукачёва. Но вот чтобы полногеномное исследование — такого никто в России не делал. Иногда я думаю, что мы бы точно шли вровень со шведскими коллегами, расшифровавшими геном ели, и с американскими, секвенировавшими геном ладанной сосны — главного источника промысловой древесины в США, если бы начали чуть раньше. Мы немного опоздали в исторической ретроспективе. Но это ничуть не обесценивает полученный результат.

Кстати, первоначально мы планировали взяться за геном кедровой сосны, которую в Сибири называют просто кедром. И этот «крепкий орешек» буквально ошеломил нас размерами своего генома — он более чем в два раза больше генома лиственницы и в 9 раз больше генома человека. 29 миллиардов нуклеотидных оснований! Если сравнивать число нуклеотидов с количеством букв в томах «Войны и мира» Л.Н. Толстого, то один геном лиственницы соответствует четырём тысячам семистам семидесяти таким «томам», а в кедре — все одиннадцать с половиной тысяч. Тем не менее мы планируем прочитать геномы сосны кедровой и ели сибирской. Полный же ядерный геном лиственницы и её митохондриальный и хлоропластный геномы уже расшифрованы нами, так что один из трёх крупных блоков по мегагранту нашёл своё логическое завершение.

— В чём суть применённой вами поэтапной сборки генома «по частям», какие технические сложности этот метод позволил преодолеть?

Д.К. — Сборка и анализ больших геномов требуют серьёзных вычислительных ресурсов: мощные серверы с большим объёмом оперативной памяти, большое дисковое пространство как для хранения исходных и промежуточных данных, так и для проведения вычислений. В среднем для обработки информации по одному геному хвойных требуется порядка 30-40 Тб дискового пространства, а у нас в разработке целых три генома.

В 2013 году, когда исследования по мегагранту только набирали обороты, суперкомпьютер СФУ не мог обеспечить вычислительные ресурсы с такими характеристиками. Однако уже в следующем году мы начали создавать на базе суперкомпьютерного комплекса СФУ специальный высокопроизводительный сегмент для поддержки геномных расчётов. Ядром его стал специальный многопроцессорный сервер IBM x3950 X6 с большим объёмом оперативной памяти в 3 Тб. На этом сервере как раз и производится сборка геномов. Для расчётов выделен крупный сегмент из 56 вычислительных серверов суперкомпьютера.

Сборка осуществляется на многопроцессорном сервере с большим объёмом памяти. Был реализован специальный пайплайн (последовательность программ), выполняющий набор операций — предобработку геномных данных, подготовку данных к сборке, непосредственно сборку генома, постобработку, улучшение сборки и т.п. Непосредственно для сборки генома мы использовали коммерческий геномный сборщик CLCbio. Суть метода поэтапной сборки генома заключается в том, что мы собираем геном в несколько этапов, а затем уже получаем общую финальную сборку. Метод хорош тем, что позволяет, с одной стороны, обойти ограничения современных ассемблеров по объёму входных данных, а с другой стороны — значительно уменьшить общее время сборки генома.

— Правда ли, что все процессы, связанные с секвенированием и сборкой генома, делаются «без черновиков», а значит, повышаются требования к профессионализму сотрудников, точности выполнения работ?

Д.К.
— Про «без черновиков» — это сильно сказано. Делаются, конечно, с «черновиками», просто эти «черновики» очень дороги во всех смыслах. Все операции по обработке больших геномов являются длительными по времени — их выполнение может занимать от нескольких дней до нескольких месяцев. Причём часть из них нельзя прервать без серьёзных потерь. А если вдруг качество сборки фрагмента генома вас не устроит (вот вам «черновик»), то придётся готовить новые данные, делать новую сборку, затем выполнять аннотацию генома, которая, кстати, тоже длится больше месяца.

И это как раз требует и профессионализма команды, и хорошего планирования. А также мощных вычислительных ресурсов, бесперебойного питания, нормального кондиционирования, поскольку сбой любой из этих подсистем приводит к потере ценного времени или не менее ценных данных.

— Зачем понадобилось расшифровывать хлоропластный геном лиственницы сибирской? Это была одна из целей исследования или ценный «побочный» продукт? Что показало его сравнение с хлоропластными геномами других хвойных?

К.К. — Хлоропластный геном у хвойных интересен тем, что он имеет исключительно отцовское наследование. Примерно, как Y-хромосома у мужчин. Это важный маркер для популяционно-генетических исследований, например для
изучения миграции пыльцы. Он помогает понять, как формируется популяционная структура, границы леса, как идёт обмен генами между удалёнными маргинальными популяциями деревьев. Хлоропластный геном гораздо меньше ядерного, собрать его проще. Мы с его помощью можем узнать, например, данные о «родителях» клоновой плантации (так называются клонально размноженные популяции деревьев, выращиваемые для получения генетически улучшенных семян — как правило, берутся 30-40 клонов от нескольких десятков «родителей», отличающихся выдающейся прочностью древесины, скоростью роста и т.д., всего же на плантации может произрастать до 600 «генетически улучшенных» деревьев для получения «элитных» семян и саженцев).

Подготовка образцов хвои лиственницы сибирской для выделения ДНК и дальнейшего исследования на секвенаторе  HiSeq 2000 Illumina

Подготовка образцов хвои лиственницы сибирской для выделения ДНК и дальнейшего исследования на секвенаторе HiSeq 2000 Illumina

Особенность некоторых деревьев в том, что они гермафродиты, содержат признаки и мужского, и женского пола, а значит, способны к самоопылению. Для «элитных» саженцев, производимых по заказу крупных лесопромышленных компаний, инбридинг (близкородственное скрещивание), а также занос чужеродной пыльцы от обычных деревьев вне плантации весьма нежелателен — он может снизить качество получаемой древесины. Следовательно, в интересах этих компаний продемонстрировать, что в создании клонального потомства участвовало как можно больше различных производителей — «отцов», и что не было заноса «случайной» пыльцы, способной передать «неудачный» генетический материал. Тот же принцип работает на плантациях, предназначенных для лесовосстановления — проанализировав хлоропластный, митохондриальный и ядерный геномы, можно с высокой долей уверенности судить о том, что саженцы отличаются высоким генетическим разнообразием, а значит, из них вырастут хорошие жизнестойкие деревья, способные «затянуть» нанесённые земле раны и в перспективе восстановить некогда нарушенную экологическую систему.

Геном

• человека — 3,2 млрд нуклеотидных оснований (но)

• кита — 2,9 млрд но

• лиственницы сибирской — 12,03 млрд но

• ели сибирской — 19,6 млрд но

• сосны кедровой — 28,9 млрд но

Наш коллектив первым прочёл хлоропластный «отцовский» геном лиственницы сибирской. До нас учёный мир знал только хлоропластный геном ели и сосны.

В некотором смысле расшифровка генома лиственницы напоминает открытие куклы-матрёшки. Есть ядерный геном — самая большая из «матрёшек», его тяжелее всего секвенировать и аннотировать (и в силу размера, применительно к хвойным, и потому, что он, скажем так, «главный» в этой системе), но «внутри» много чего интересного и неизведанного. Ещё есть хлоропластный геном — хлоропласты когда-то были цианобактерией, которая путём симбиогенеза «встроилась» в состав клеток. Ещё одна «матрёшка» — митохондриальный геном, состоящий у лиственницы из одиннадцати миллионов нуклеотидных оснований. Митохондрии также ведут свой род от древнейших симбиотических бактерий, близких к современным пелагибактериям (pelagibacter), являющимся свободноживущими морскими бактериями. Фактически это клеточный паразит-симбионт, ставший весьма полезным для растений и животных, своеобразная энергетическая фабрика. У животных митохондриальный геном невелик — всего шестнадцать тысяч нуклеотидов. А у нашего сибирского дерева, по каким-то неведомым для нас причинам, он превосходит в десятки или сотни раз по количеству нуклеотидных оснований все известные на сегодняшний день митохондриальные геномы в царстве растений и животных. Ещё есть небольшая «матрёшка» — транскриптом. Это РНК, представляющая те гены, которые преобразуются в функциональный продукт.

— Одна из самых животрепещущих проблем лесного хозяйства Красноярского края — незаконные вырубки. Сакраментальный вопрос: поможет ли расшифровка генома предотвратить утрату ценных видов деревьев, образующих «лёгкие планеты»?

К.К. — Генетики располагают некоторым количеством специфических ДНК-маркеров и могут проводить генетическую идентификацию растений, но для того, чтобы определить, из какой местности изъято дерево, требуется обширная база популяционно-генетических данных, чтобы соотнести индивидуальную информацию, полученную об одном образце в лаборатории, с неким «каталогом» и сделать вывод, что да — дерево срубили в ненадлежащем месте, и это браконьерство, или же, напротив, всё в порядке — в этих краях идёт законная добыча древесины. Создание такой базы означает, что по имеющимся маркерам нужно охарактеризовать все основные районы законной вырубки. И это задача Российского центра защиты леса. Но, к сожалению, пока не выработана единая методология сбора и анализа образцов. Мы предлагаем свой вариант методологии, для которого требуется простейшее оборудование, но пока наша разработка «лежит на полке» и ожидает единой программы и соответствующего финансирования, чтобы закупить реактивы и собрать штат сотрудников.

— Можно ли модифицировать лиственницу в обозримом будущем, приспособить её к меняющимся климатическим условиям? В Хакасии посадить более засухоустойчивую модификацию, например?

К.К. — Технически возможно. Но практически требуется изменение российского законодательства, разрешающего не только создание генно-модифицированных организмов (ГМО), но и их использование не только исключительно на специально отведённых землях и в рамках научно-исследовательской работы.

Есть ещё один запрет, посильнее законодательного — страх обывателя перед ГМО, во многом необоснованный. Мы ежедневно перевариваем миллионы бактерий, которые содержат свою ДНК, и при этом не становимся бактериями. Едим огурцы, однако не зеленеем. И от молока, что характерно, не мычим. Поэтому опасения, связанные с тем, что «чужеродная» ДНК, полученная через ГМ-продукты, может повлиять на ДНК человека или вызывать другие неблагоприятные явления, совершенно неоправданные.

В лаборатории лесной геномики СФУ ведётся загрузка реактивов перед запуском секвенатора

В лаборатории лесной геномики СФУ ведётся загрузка реактивов перед запуском секвенатора

На почвах, выведенных из сельскохозяйственных угодий, можно и нужно выращивать монокультуры ГМ-растений — быстрорастущих, устойчивых к основным патогенам и заболеваниям. Китай и США несколько десятилетий успешно выращивают генетически модифицированную сою. И никто от неё не пострадал. Зачем они её модифицировали? Элементарно. Любая монокультура — это «праздничный стол» для вредителей — насекомых, патогенных грибов и т.д. Не защитишь её — съедят, простите, и не поперхнутся. Внедрив в сою гены, убивающие вредителей-насекомых (но безопасные для человека) и обеспечивающие устойчивость к заболеваниям, учёные повысили урожайность без использования очень вредных и опасных инсектицидов и пестицидов.

У тополя есть особый вредитель, напоминающий колорадского жука. Внедрив в геном тополя ген бактерии Bacillus thuringiensis, продуцирующий смертельный для насекомых BT-токсин, учёные добились полного уничтожения личинок тополиного жука на ранних стадиях, зато для теплокровных (в том числе для человека) этот токсин безвреден. Эти тополя выращивают на специальных плантациях 5-7 лет, затем они идут на производство целлюлозы и технического спирта либо используются как альтернативный источник биоэнергии. Это выгодно. Гуманно по отношению к прочим насекомым и животным. Наконец, экологично, в отличие от привычного для нас распыления ядохимикатов, губящих не только сельскохозяйственных вредителей, но и нас с вами. А уж как это ослабляет давление на естественные леса, которые и вырубать-то не понадобится, поскольку есть специальные «технические» деревья, изначально посаженные для определённых целей… В США полным ходом переходят на плантационное лесное хозяйство. Они берегут свои естественные леса как среду обитания зверей, как рекреационные зоны и заповедники естественной жизни, в которую вмешиваться не стоит.

В России же пока допускается разведение ГМ микроорганизмов только для использования в медицинских целях.

Могу сказать, что ситуация будет пускай медленно, но меняться. Интерес к модифицированным растениям проявляют крупные промышленные (в частности, добывающие уголь) российские компании. Им требуются новые способы рекультивации промотвалов, нужны растения, которые могут расти на загрязнённой, бедной почве и восстанавливать её. А значит, ГМО из «пугала» превратится постепенно в полезную реальность, чему я лично был бы очень рад.

— Новые цели, стоящие перед вашей командой, на ближайшее будущее?

Д.К. — Главная прелесть происходящего в том, что мы собрали огромный пул информации, на основании которой можно проводить исследования, делать открытия мирового уровня. Сейчас мы разобрались только со структурной частью и переходим к функциональной — предстоит понять, какие гены в геноме лиственницы за что отвечают, чем они отличаются эволюционно от других генов (растений и животных) и т.д.

К.К. — Следует добавить, что 28 ноября 2018 г. был издан указ президента о развитии генетических технологий в Российской Федерации, в котором было предписано Правительству Российской Федерации разработать и утвердить Федеральную научно-техническую программу развития генетических технологий на 2019-2027 годы. В конце февраля 2019 г. программа была опубликована. Возможно, что наш университет (в частности, НОЦ геномных исследований и лаборатория лесной геномики) тоже будет вовлечён в её выполнение.

— Наталья Викторовна, задачу запуска секвенатора, «прочитывающего» полный текст генома по отдельным коротким фрагментам, приходилось решать именно вам. Были форс-мажорные ситуации?

Н.О. — Каждый запуск секвенатора HiSeq 2000 — это ювелирная работа. Прибор должен беспрерывно работать одиннадцать дней. Если в лаборатории будет слишком жарко — лазер выйдет из строя. Когда прибор работает, он сохраняет данные на флэш-карте с большим объёмом памяти. В самом начале работы по мегагранту нам пришлось столкнуться с проблемой — из-за аварии был обесточен весь Академгородок. А наша дизель-генераторная установка не сработала. Соответственно, мы потеряли порцию дорогостоящих реактивов. В те времена эта авария стоила нам как хорошая двухкомнатная квартира с чистовой отделкой… Вот и представьте, насколько важен каждый момент и как сложно всё проконтролировать, ведь до этой аварии проблем с бесперебойным питанием не возникало. Есть и региональная специфика в нашей работе — реагенты закупаются за рубежом, и если «химия» по какой-то причине окажется просроченной, нужно заполнять бумаги, проводить утилизацию. Всё сложно. Но интересно.

— Почему вы занялись именно геномикой растений — животные разве не интереснее?

К.К. — Был у нас опыт сборки и аннотирования генома кита (совместно с Алексеем МОСКАЛЁВЫМ и его коллегами). Ядерный геном мамонта нам пока не удалось секвенировать, но полностью отсеквенировали, собрали, проаннотировали и опубликовали митохондриальный геном (совместно с Игорем КОРНИЕНКО и его коллегами).

Н.О. — Недавно вышел фильм «Genesis 2.0», совершенно беспомощный с научной точки зрения. Там речь шла в том числе о возможности клонирования Малоляховского мамонта, останки которого были найдены в Якутии. Да, ткани этой самки, погибшей приблизительно 43 000 лет назад, неплохо сохранились. Найти экземпляр мамонтихи в такой сохранности — большая удача для палеозоолога. У неё и желудок сохранился с остатками пищи, и удалось учёным выяснить, сколько раз эта самка рожала. Всё это, несомненно, полезная информация для реконструкции условий, в которых жили последние мамонты. Только вот громкое заявление о возможности клонировать животное — это скорее миф.

К.К.
— Биологический организм имеет нечто вроде встроенной системы самоуничтожения. Есть в нас такие нуклеазы — ферменты, гидролизующие фосфодиэфирную связь между нуклеиновыми кислотами. Они начинают «резать» ДНК вскоре после смерти организма. А такую изрезанную ДНК уже невозможно клонировать. Так что мамонты уже принадлежат истории. Вернуть их пока технически невозможно, хотя вероятно станет возможным в будущем благодаря технологиям геномного редактирования.

Татьяна МОРДВИНОВА