Проблема переменной скорости эволюции.



Гипотеза молекулярных часов:

Молекулярные часы — метод датирования филогенетических событий (расхождений видов или других таксонов), основанный на гипотезе, согласно которой эволюционно значимые замены мономеров в нуклеиновых кислотах или аминокислот в белках происходят с практически постоянной скоростью.

Скорость мутаций может быть неравномерной и различается для разных видов, из-за чего метод дает лишь приблизительные результаты.

Гипотеза молекулярных часов была выдвинута в 1962 году при анализе аминокислотных последовательностей гемоглобина и цитохрома С Эмилем Цукеркандлем и Лайнусом Полингом. Они отметили, что количество аминокислотных различий в гемоглобине растет линейно со временем, которое оценивалось по фоссилиям. Они обобщили наблюдение и пришли к выводу, что скорость эволюционного изменения каждого белка приблизительно постоянна.

- Сопоставления числа различий в аминокислотных последовательностях гемоглобинов млекопитающих и срока дивергенции (Э. Цукеркандль, Л. Полинг, 1962).

- Сопоставления идентичности последовательностей цитохрома с у рыб, птиц и млекопитающих (Э. Марголиаш, 1963).

- Гипотеза широко распространена, хотя и имеется довольно много примеров, ей противоречащих.

Короче, идея такая: вероятность замены нуклеотида (или аминок-ты) один на другой меняется со временем и делает это неравномерно и не равновероятно. Поэтому деревья могут очень сильно съезжать.

Скрытые марковские модели (в презе не нашла, ну ладно).

Скрытая марковская модель (СММ) — статистическая модель, имитирующая работу процесса, похожего на марковский процесс с неизвестными параметрами, и задачей ставится разгадывание неизвестных параметров на основе наблюдаемых. Полученные параметры могут быть использованы в дальнейшем анализе, например, для распознавания образов. СММ может быть рассмотрена как простейшая байесовская сеть доверия.

Основное применение СММ получили в области распознавания речи, письма, движений и биоинформатике. Кроме того, СММ применяются в криптоанализе, машинном переводе. С середины 1980-х СММ применяются при анализе биологических последовательностей, в частности ДНК.

В обычной марковской модели состояние видимо наблюдателю, поэтому вероятности переходов — единственный параметр. В скрытой марковской модели мы можем следить лишь за переменными, на которые оказывает влияние данное состояние. Каждое состояние имеет вероятностное распределение среди всех возможных выходных значений. Поэтому последовательность символов, сгенерированная СММ, даёт информацию о последовательности состояний.

Понятия теории графов: гамильтонов обход, эйлеров обход графа.

Пути и циклы в графах.

Путем в графе G = <V, E> называют последовательность рёбер вида <e1, e2, …, e_n-1> = S = <(v1, v2), (v2, v3), …, (v_n-1, vn)>. Говорят, что этот путь идёт из v1 в vn и имеет длину (n-1).Если веса рёбер равны 1!

Путь называют простым, если все рёбра и вершины на нём различны, кроме быть может первой и последней.

Цикл – это простой путь длины не менее 1, который начинается и заканчивается в одной вершине. В простом неографе (неориентированном графе)  длина цикла не меньше 3.

Эйлеровы пути и циклы

Эйлеровым путем в графе G называется произвольный путь, проходящий через каждое ребро графа в точности один раз. Если начальная и конечная вершины совпадают, то путь называется эйлеровым циклом.

Теорема: Эйлеров путь в простом неографе существует тогда и только тогда, когда граф связный и содержит не более 2 вершин нечетной степени.

Теорема: Эйлеров цикл в простом неографе существует тогда и только тогда, когда граф связный и степени всех его вершин четные.

Гамильтоновы пути и циклы

В отличие от эйлеровых путей, неизвестно ни одного простого необходимого и достаточного условия для существования гамильтоновых путей и циклов. Неизвестен и алгоритм, проверяющий существование такого пути в произвольном графе за полиномиальное время от числа вершин n (NP полная задача).

Простой путь (цикл) называется гамильтоновым путем (циклом), если он проходит через каждую вершину графа ровно один раз.

Теорема: Если в графе G с n вершинами для любой пары вершин ai и aj имеет место соотношение ρ(ai) + ρ(aj) >= (n – 1), то граф G имеет гамильтонов путь. Если ρ(ai) + ρ(aj) >= n, то имеет гамильтонов цикл.

Условие Поша: Пусть граф G имеет p > 2 вершин. Если для всякого n, 0 < n < (p-1)/2, число вершин со степенями меньшими или равными n меньше, чем n, и для нечетного p число вершин со степенью (p-1)/2 не превосходит (p-1)/2, то G — гамильтонов граф. Это достаточное условие не является необходимым.

Методы секвенирования:

· "По Сэнгеру"

· Пиросеквенирование

· Illumina

· Полупроводниковое секвенирование

· Секвенирование через лигирование

· Нанопоровое секвенирование

· Одномолекулярное секвенирование в реальном времени

"По Сэгнеру" (метод обрыва цепи)

Исторический и самый первый метод секвенирования ДНК. Впервые он был предложен Фредериком Сэнгером в 1977 году. Данный метод был наиболее распространенным на протяжении 40 лет.

В классическом варианте метода Сэнгера одна из цепочек анализируемой ДНК выступает в качестве матрицы для синтеза комплементарной цепочки ферментом ДНК-полимеразой. Реакцию с одной и той же матрицей проводят в четырёх разных пробирках, каждая из которых содержит:

· праймер — небольшую одноцепочечную молекулу ДНК, комплементарную началу участка, который нужно отсеквенировать. Праймер необходим потому, что ДНК-полимеразы не могут начинать синтез цепи «с пустого места», они только присоединяют следующий нуклеотид к уже имеющейся 3'-гидроксильной (-OH) группе предыдущего. Праймер, таким образом, представляет собой «затравку» при синтезе ДНК;

· четыре стандартных дезоксинуклеотида (dATP, dGTP, dCTP и dTTP)

· небольшое количество (в концентрации 1 к 100) одного из радиоактивно меченных дезоксинуклеотидов (дидезоксинуклеотида) (например, [32P]-дАТФ), который включается в состав ДНК во время синтеза и позволяет впоследствии визуализировать продукты реакции;

У дидезоксирибонуклеотидов (ddATP, ddGTP, ddCTP, или ddTTP) отсутствует 3'-гидроксильная группа, поэтому после их включения в цепь дальнейший синтез обрывается. Таким образом, в каждой пробирке образуется набор фрагментов ДНК разной длины, которые заканчиваются одним и тем же нуклеотидом (в соответствии с добавленным дидезоксинуклеотидом). После завершения реакции содержимое пробирок разделяют электрофорезом в полиакриламидном геле в денатурирующих условиях и проводят авторадиографию гелей. Продукты четырёх реакций формируют «секвенирующую лестницу», которая позволяет «прочитать» нуклеотидную последовательность фрагмента ДНК.

Метод Сэнгера позволяет также определять нуклеотидную последовательность РНК, но она предварительно должна быть «переписана» в форме ДНК с помощью обратной транскрипции.

На сегодняшний день секвенирование ДНК по Сэнгеру полностью автоматизировано и проводится на специальных приборах, секвенаторах. Использование дидезоксинуклеотидов с флуоресцентными метками с разными длинами волн испускания позволяет проводить реакцию в одной пробирке. Реакционную смесь разделяют капиллярным электрофорезом в растворе, фрагменты ДНК, выходящие из капиллярной колонки, регистрируются детектором флуоресценции. Результаты анализируют с помощью компьютера и представляют в виде последовательности разноцветных пиков, соответствующих четырём нуклеотидам. Секвенаторы такого типа могут «прочитывать» за один раз последовательности длиной 500—1000 нуклеотидов. Автоматизация значительно ускорила процесс секвенирования и позволила осуществить секвенирования целых геномов.

Источники ошибок:
На этапе секвенирования образца
Обусловлены особенностями измерительной системы прибора и технологиями секвенирования.
Можно выявить или предсказать.
На механизме предсказания ошибки основано присвоение качества прочтения основания прибором.

На этапе пробоподготовки
Вызваны присутствием нецелевых молекул в образце, ошибками ферментов (полимеразы).
Нельзя выявить на этапе секвенирования.
Как правило, одни и те же причины вне зависимости от технологии секвенирования.

Пиросеквенирование (Roche-454):

Это метод секвенирования ДНК (определение последовательности нуклеотидов в молекуле ДНК, основанный на принципе «секвенирование путём синтеза». При включении нуклеотида происходит детекция высвобождающихся пирофосфатов.

Идея пиросеквенирования заключается в регистрации пирофосфата, который образуется при присоединении очередного нуклеотида ДНК-полимеразой. Детекция пирофосфата осуществляется за счёт каскада химических реакций, который заканчивается выделением кванта света.

 Амплификация ДНК (процесс образования дополнительных копий участков хромосомной ДНК, как правило, содержащих определённые гены либо сегменты структурного гетерохроматина) проходит в каплях воды в масляной эмульсии. В каждой капле воды находится одноцепочечная матрица ДНК, связанная с праймером на бусинке. Далее, каждая бусина помещается на чип, представляющий собой оптическое волокно. Туда же помещаются необходимые для секвенирования ферменты: ДНК-полимераза, люцифераза, АТФ-сульфурилаза. В последней сборке реакция секвенирования идет в ячейках объемом 3,4·106 пкл, на стенках которых есть специальное металлическое покрытие, нивелирующее шум.

Прежде всего создаётся иммобилизованная на твёрдой фазе клональная библиотека одноцепочечных фрагментов ДНК (например, при помощи мостиковой полимеразной цепной реакции, ПЦР). Ко всем фрагментам ДНК присоединяется адаптер, с которым будет комплементарно связываться праймер — затравка для синтеза комплементарной цепи ДНК-полимеразой. Далее производится серия последовательных циклов, в процессе которых к закреплённой на твёрдой фазе ДНК по очереди добавляют дезоксинуклеотидтрифосфаты всех четырёх типов: A, T, G, C. Если на секвенируемой цепи ДНК есть комплементарный к добавленному нуклеотид, то при образовании фосфодиэфирной связи побочным продуктом станет пирофосфат. Он активирует каскад химических реакций: пирофосфат вместе с аденозинсульфофосфатом (АСФ) при помощи фермента АТФ-сульфурилазы образуют АТФ, который является источником энергии для проведения реакции окисления люциферина в оксилюциферин с выделением кванта света. Интенсивность выделяемого света пропорциональна числу включённых в цепь нуклеотидов (чем больше подряд одинаковых нуклеотидов, тем сильнее световой сигнал). Детекция света осуществляется ПЗС-матрицей и анализируется с помощью программного обеспечения, которое строит по пирограмме последовательность нуклеотидов. Нуклеотиды, не вовлечённые в синтез новой цепи, а также АТФ разрушаются ферментом апиразой. После этого начинается следующий цикл, то есть добавляется нуклеотид другого типа.

Достоинства и недостатки:
По сравнению с секвенированием по Сэнгеру, пиросеквенирование выгодно отличается стоимостью, а также тем, что за один раз можно получить сотни тысяч прочтений. Однако пиросеквенирование имеет и ряд недостатков. Так, с помощью этого метода невозможно безошибочно секвенировать протяжённые участки, состоящие из одного и того же нуклеотида. Кроме того, оно позволяет получать лишь прочтения небольшой длины.

Illumina/Solexa

В основе метода лежит принцип секвенирования путём синтеза[1]:

· Одноцепочечные фрагменты ДНК закрепляются на твердой подложке.

· ДНК-зависимая ДНК полимераза синтезирует комплементарную цепь.

· Встраивание каждого нового нуклеотида регистрируется с помощью камеры.

В это методе используются 3'- модифицированные нуклеотиды с присоединенными флюоресцентными метками разных цветов. Модификация нуклеотидов не позволяет ДНК-полимеразе присоединить больше одного нуклеотида. Флюоресценция инициируется коротким импульсом лазера и тип присоединенного нуклеотида определяется по цвету флюоресцентной метки. Модификация нуклеотида блокируется (полимераза теперь может двигаться дальше) и цикл повторяется снова. В результате удается определить последовательность ДНК длиной до 250 нуклеотидов. Такую последовательность ДНК называют прочтением или ридом.

Подготовка ДНК

1. Исследуемая двуцепочечная ДНК фрагментируется.

2. К двуцепочечным фрагментам с помощью ДНК-лигазы пришивается небольшой ДНК-фрагмент — адаптер. Адаптер состоит из двух олигонуклеотидов, частично комплементарных друг другу. При смешении таких олигонуклеотидов образуется «вилка», «ножка» которой состоит из двуцепочечной ДНК (там где олигонуклеотиды комплементарны), две «ручки» состоят из одноцепочечной ДНК. Лигаза пришивает два адаптера за «ножку» к каждому концу исследуемого фрагмента ДНК.

3. Далее происходит амплификация полученных фрагментов ДНК с помощью ПЦР. В результате образуется множество фрагментов двуцепочечной ДНК, на одном конце — первый олигонуклеотид, составляющий адаптер, на другом конце — второй.

Подготовка ячейки (flowcell)

Ячейка содержит внутри 8 дорожек. В каждой дорожке может секвенироваться отдельный образец. На поверхность каждой дорожки пришиваются одноцепочечные олигонуклеотиды. Такие же, что использовались при создании адаптера. Эти олигонуклеотиды в будущем будут связывать исследуемую ДНК (так как они комплементарны адаптеру) и служить праймерами для мостиковой амплификации. В одном из олигонуклеотидов есть сайт для рестриктазы.

Мостиковая амплификация

1. Производится плавление исследуемой ДНК и уже одноцепочечные её фрагменты отжигаются на закрепленных на подложке праймерах.

2. В систему добавляется все необходимое для ПЦР, кроме праймеров. Праймеры уже есть — это иммобилизованные олигонуклеотиды.

3. Полимераза достраивает комплементарную цепь. Теперь каждый исследуемый фрагмент выглядит как двуцепочечная ДНК, конец одной из цепей пришит к поверхности ячейки.

4. Проводится плавление двуцепочечной ДНК, в результате которого комплементарные цепи ДНК расходятся. Цепь ДНК, которая не была закреплена на поверхности, удаляется. Каждый исследуемый фрагмент представляет собой одноцепочечную ДНК, пришитую к поверхности ячейки.

5. Своим незакрепленным концом цепь ДНК может образовать комплементарное взаимодействие со вторым иммобилизованным олигонуклеотидом. Теперь фрагмент расположен в виде «мостика» — один конец пришит к поверхности, другой держится за счет комплементарных взаимодействий.

6. Полимераза снова достраивает комплементарную цепь, используя в качестве праймера второй олигонуклеотид.

7. После плавления и удаления незакрепленных цепей ДНК фрагмент выглядит как две одноцепочечные ДНК, прикрепленные к поверхности. Одна цепь расположена «вверх ногами» относительно прикрепленной ДНК в пункте 1. Свободный конец каждой из цепей может образовать мостик с иммобилизованным олигонуклеотидом. Далее повторяются пункты 6 и 7.

8. После амплификации, вокруг каждого закрепленного фрагмента появляется большое количество его копий. Половина из копий расположена «вверх ногами». Добавляется рестриктаза, которая расщепляет один из прикрепленных олигонуклеотидов — ненужные копии вымываются. Теперь все копии ДНК, получившиеся в результате амплификации из начального фрагмента, расположены одинаково.

Секвенирование

ДНК-зависимая ДНК полимераза синтезирует комплементарную цепь. Встраивание каждого нового нуклеотида регистрируется с помощью камеры.

1. В систему добавляются праймеры и ДНК-полимераза.

2. В систему добавляются 3′-O-азидометил 2′-деоксинуклеозид трифосфаты (A, C, G и T), каждый с отделяемой флюоресцентной меткой своего цвета. Наличие 3′-O-азидометила не позволяет ДНК-полимеразе присоединить больше одного нуклеотида.

3. Полимераза присоединяет один модифицированный нуклеотид, оставшиеся нуклеотиды вымываются.

4. Ячейка освещается коротким импульсом лазера. Присоединенный флюорофор светится своим цветом. Так как после амплификации вокруг каждой молекулы ДНК есть множество её копий, свет множества одинаковых флюорофоров можно зарегистрировать.

5. В систему добавляется вещество (TCEP), из-за которого флюорофор и азидометил отделяются и вымываются. 3′-гидроксильная группа становится доступной для присоединения ещё одного нуклеотида.

6. Повторяются пункты 2-5.

Варианты секвенирования:

· Секвенирование одиночных прочтений;

· Секвенирование парных прочтений;

· Множественное (мультиплексное) секвенирование;

· Секвенирование спаренных концов;

· Секвенирование РНК.

Достоинства и недостатки:
По сравнению с другими методами секвенирования нового поколения, метод Illumina наиболее высокопроизводительный — 600 Gb за одно прочтение. Следовательно, стоимость секвенирования на 1 Gb информации будет небольшая. К положительным особенностям можно отнести и точность при небольшой длине прочтения.

Большинство возникающих ошибок секвенирования — неправильное определение присоединенного нуклеотида. Средняя частота ошибок составляет 0,5 % — одна ошибка на прочтение длиной 200 нуклеотидов. К недостаткам можно отнести высокую стоимость приборов и небольшую длину прочтений (до 250 нуклеотидов).

Полупроводниковое секвенирование:

Этот метод является методом определения последовательности ДНК, основанным на обнаружении ионов водорода, которые выделяются во время полимеризации ДНК. Это метод «секвенирования при синтезе», в ходе которого комплементарная цепь строится на основе последовательности матричной цепи.

Микролунки, содержащие предназначенную для секвенирования молекулу матричной ДНК, наполняют дезоксирибонуклеотидтрифосфатом (dNTP) одного вида. Если введенный dNTP является комплементарным к ведущему нуклеотиду шаблона, он включается в растущую комплементарную цепь. Это вызывает высвобождение ионов водорода, который вызывает срабатывание ионного датчика ISFET, который указывает, что реакция произошла. Если в последовательности матричной цепи присутствует повтор одного нуклеотида, несколько молекул dNTP будут присоединены в одном цикле. Это приводит к увеличению количества образовавшихся ионов водорода и пропорционально более высокому электрическому сигналу.

Эта технология отличается от других технологий секвенирования тем, что не использует модифицированные нуклеотиды и оптические датчики. Ion semiconductor sequencing может также упоминаться как Ion torrent sequencing, рН-опосредованное секвенирование, или полупроводниковое секвенирование.

 Достоинства и недостатки:
Основные преимущества ионного полупроводникового секвенирования — высокая скорость секвенирования при низких начальных вложениях и эксплуатационных расходах. Это стало возможным благодаря отсутствию модифицированных нуклеотидов и оптических измерений.

Если гомополимер, состоящий из повторов одного и того же нуклеотида (например GGGGG), присутствует на матричной цепи (подлежащей секвенированию), присоединяются сразу несколько нуклеотидов и в одном цикле образуется больше ионов водорода. Это приводит к большему изменению рН и пропорционально более высокому электронному сигналу. Ограничение данной системы в том, что трудно посчитать длину повтора.

Секвенирование через лигирование (SOLiD):

SOLiD позволяет секвенировать разом сотни миллионов и даже миллиарды коротких последовательностей. SOLiD использует метод лигирования в отличие от других платформ.

Принцип метода:

Подготовка библиотеки

Геномная ДНК разрезается на малые фрагменты. Затем к концам каждого фрагмента пришиваются две различные нуклеотидные последовательности — адаптеры A1 и A2. В итоге в библиотеке оказываются одноцепочечные нуклеотидные последовательности A1-(фрагмент ДНК)-A2.

ПЦР в эмульсии

ПЦР ДНК-фрагментов библиотеки проводят в водных каплях в масляно-водяной эмульсии. В каждой капле — 1μм бусина, к которой присоединены одноцепочечные нуклеотидные последовательности одного из двух праймеров (P1 или P2). Эти праймеры (P1 и P2) комплементарны адаптерам A1 и A2 соответственно. В такую каплю масла добавляют последовательность из библиотеки, и праймер на бусине будет образовывать дуплекс с одним из её адаптеров. Если на бусине — праймер P1, то с ним образует дуплекс адаптер A1. Это называется отжиг праймера. После отжига праймера добавляют ДНК-полимеразу, которая достраивает вторую цепь ДНК. После проведения ПЦР и диссоциации ДНК-дуплексов на бусинах остаются одноцепочечные последовательности ДНК.

Насыщение бусин с целевой ДНК

На практике, только 30 % бусин несут целевую ДНК (ДНК-фрагмент библиотеки). Для увеличения количества таких бусин добавляют в раствор другие большие полистироловые бусины, с присоединенными одноцепочечными последовательностями другого адаптера (A2), комплементарного ПЦР-праймеру (P2). Так, каждая бусина с целевой ДНК будет составлять пару с большой бусиной за счет образования дуплекса: адаптера A2 на большой бусине и участка, соответствующего P2, бусины с целевой ДНК. Такой комплекс в итоге отделяют от «пустых» бусин, а затем его плавят, чтобы прошла диссоциация бусин с целевой ДНК и полистироловой. Эта процедура позволяет увеличить количество бусин, несущих целевую ДНК до 80 %.

Затем 3’-концы, несущие последовательность P2, модифицируют для обеспечения ковалентного связывания, необходимого на следующей стадии.

Перенос бусин

Продукты, полученные на предыдущей стадии, переносят на стеклянные пластины. Бусины иммобилизуют на стекле в случайном порядке, присоединяя их ковалентно к стеклу через модификации 3’-концов на бусинах.

Секвенирование

Схема секвенирования SOLiD
(1) Начало 1 раунда: добавление праймера длины n и 8ми нуклеотидного зонда, лигирование их друг с другом, детекция флуоресценции.
(2) Разрезание зонда, освобождение от метки.
(3) 5 последовательных циклов 1 раунда (повтор стадий (1) и (2)).
(4) Начало 2 раунда: добавление праймера длины n-1 и 8ми нуклеотидного зонда, лигирование их друг с другом, детекция флуоресценции.

Секвенирование проходит с помощью лигирования восьми-нуклеотидных зондов, меченных на 5’-конце одним из четырех различных флуорофоров. Последовательность зондов несет сайт гидролиза, находящийся между пятым и шестым нуклеотидами. Первые два основания (считая с 3’-конца) комплементарны двум нуклеотидам секвенируемой последовательности. С третьего по пятый основания зонда могут гибридизоваться с любыми тремя нуклеотидами секвенируемой ДНК. 6-8 основания зонда также могут гибридизоваться с любой последовательностью, однако они вместе с флуоресцентным красителем отщепляются от зонда в ходе реакции. Отщепление флуоресцентной метки вместе с основаниями 6-8 происходит таким образом, что на 5'-конце зонда остается фосфатная группа, способствующая следующему циклу лигирования зонда. Так, два основания каждого зонда точно комплементарны основаниям секвенируемой последовательности в позициях n+1 и n+2, n+6 и n+7 и т. д.

Процесс секвенирования состоит из пяти раундов, каждый раунд состоит из 6-7 циклов. Каждый раунд начинается с добавления универсального праймера длины n, комплементарного P1. В каждом цикле 8-ми нуклеотидные зонды добавляются и лигируются к праймеру, их первые два нуклеотида комплементарны двум нуклеотидам секвенируемой последовательности. Затем отмывают от остающихся несвязанных зондов, измеряют флуоресценцию лигированного зонда и разрезают его между пятым и шестым основаниями. По окончании последнего цикла проводят диссоциацию синтезированной цепи ДНК от матрицы, прикрепленной к бусине. Это необходимо для того, чтобы в следующем раунде уже использовать новые праймер и зонды. Праймер теперь берут длины n-1. Итак, в ходе пяти раундов используются праймеры, комплементарные P1, длины n, n-1, n-2, n-3, n-4 относительно 3'-конца P1. Таким образом можно секвенировать примерно 25 нуклеотидов последовательности.

Расшифровка данных

На выходе мы получаем данные по флуоресценции. Пространство цветов и пространство нуклеотидов содержат по 4 элемента. Каждый цвет кодирует собой 4 из 16 возможных динуклеотидов. Например, «синий» цвет флуоресцентной метки соответствует паре одинаковых нуклеотидов (то есть AA,GG,TT или CC). Дизайн матрицы преобразований цвета способствует коррекции ошибок.

Одним цветом кодируется:

· пара нуклеотидов и она же в обратном порядке (например, CA и AC)

· пара нуклеотидов и комплементарная ей пара (например, CA и GT)

· пара нуклеотидов и обратно комплементарная ей пара (например, CA и TG)

Последовательность нуклеотидов может быть единственным образом преобразована в последовательность цветов. Но последовательность цветов может быть преобразована в последовательность нуклеотидов 4 разными способами. Это похоже на взаимосоответсвие между нуклеотидами и аминокислотами(цвета). Для расшифровки последовательности нуклеотидов по цветам необходимо знать один нуклеотид.

Достоинства:
В данном методе каждый нуклеотид прочитывается дважды, что повышает точность секвенирования. Соответственно чтобы допустить ошибку секвенирования необходимо оба раза неправильно определить цвет флуоресцентной метки при секвенировании соседних нуклеотидов.

Нанопоровое секвенирование:

Семейство высокоэффективных методов определения последовательности молекул ДНК или РНК с использованием белковых или твердотельных пор диаметром в несколько нанометров.

Принцип метода:

Нанопоровые системы представляют собой реакционную камеру, внутри которой находится раствор электролита. Камера разделена на две части липидной мембраной или иной тонкой непроводящей поверхностью, в которую внедрена единичная нанопора. К частям камеры прикладывают напряжение, из-за чего возникает ток ионов через пору. Когда исследуемые молекулы проходят через пору по направлению поля, они уменьшают сечение, доступное для ионов, и сила тока падает. Анализируя изменение силы тока, можно определить свойства молекулы, проходящей через пору.

В случае нуклеиновых кислот, диаметр используемых нанопор составляет несколько нанометров, из-за чего ДНК и РНК способны проходить сквозь пору только в одноцепочечной форме, но не в двухцепочечной. При прохождении молекулы нуклеиновой кислоты через пору отдельные нуклеотиды задерживаются в определенных сайтах внутри поры, в результате чего происходит измеримое падение силы тока.

Варианты секвенирования:

· Секвенирование целых цепочек

o  Транспорт под действием напряжения

o Транспорт под действием напряжения с расплетанием дуплексов

o Транспорт с использованием ферментов

· Экзонуклеазное секвенирование

Типы нанопор:

· Белковые нанопоры

o Альфа-гемолизин

o MspA

o Моторный белок упаковки ДНК бактериофага phi29

· Твердотельные нанопоры

Достоинства:
По сравнению с уже существующими методами секвенирования применение нанопор обладает следующими преимуществами:

  • Дешевизна и простота использования, достигается отсутствием необходимости приготовления образца и использования реактивов;
  • Высокая чувствительность, вплоть до секвенирования без амплификации ДНК из крови или слюны (не надо полимеразу);
  • Высокая длина прочтений, вплоть до десятков тысяч оснований.

Одномолекулярное секвенирование в реальном времени ( Pacific Biosciences) :

Идея метода состоит в определении последовательности ДНК за счёт наблюдения за работой единичной молекулы ДНК-полимеразы в реальном времени. При этом ДНК-полимераза достраивает вторую цепь исследуемой молекулы ДНК, используя нуклеотиды, меченные различными флуоресцентными метками; регистрируя данные метки, можно понять, какой нуклеотид ДНК-полимераза встраивает в настоящий момент.

Устройство секвенаторов данного типа позволяет наблюдать на уровне единичной молекулы за синтезом комплементарной цепи одной молекулы одноцепочечной ДНК с помощью одной молекулы ДНК-полимеразы. В этой технологии флуоресцентно меченные нуклеотиды и конфокальная микроскопия высокого разрешения позволяют секвенировать последовательность в реальном времени и одновременно для многих полимераз.

Достоинства и недостатки:
Метод одномолекулярного секвенирования в реальном времени даёт возможность получать очень длинные чтения (последовательности ДНК): в среднем порядка 20000 нуклеотидов, вплоть до 60000 нуклеотидов, что облегчает дальнейший анализ данных и позволяет избежать ряд проблем, возникающих при работе с короткими чтениями. Он работает без предварительной амплификации исследуемой ДНК посредством ПЦР. Этот метод обеспечивает высокую скорость секвенирования (в теории она ограничена только скоростью работы ДНК-полимеразы). Для метода характерны высокая чувствительность и специфичность: возможность детектирования в смешанных образцах минорных вариантов с частотой встречаемости меньше 0,1 %. Он также даёт возможность секвенирования с высокой точностью (83 % и > 99 % при 15 повторениях).

К недостаткам метода можно отнести высокую стоимость прибора — 600000 $. Для него характерен сравнительно высокий уровень ошибок, обусловленный пересечением спектров излучения флуорофоров. Кроме того, случайное присоединение полимераз ко дну ZMW-ячейки приводит к случайному распределению числа ферментов на одну ячейку.

Остальное не успела(((
но есть еще чуть-чуть из первого "варианта списка"

Анализ биологический последовательностей:

- Соизмерить сходство последовательностей и установить соответствие между
остатками

- Выявить консервативные и вариабельные области

- Предположить эволюционные взаимосвязи

А именно:

Ø Выравнивания: многомерное и парное;

Ø Анализ вторичной структуры РНК (и не только);

Ø Филогенетический анализ;

Ø Матрицы замен: что на кого и как часто заменяется

...И прочая вода (см. выше)

И дополнительно про секвенирование от Сони Симоменко:

Секвенирование

1. Секвенирование — определение первичной структуры биополимера.

2. Методы секвенирования

· Бисульфитное секвенирование — общее название группы методов, направленных на изучение паттерна метилирования ДНК. Предполагает обработку ДНК бисульфитом с последующим секвенированием. Обработка бисульфитом приводит к конвертированию всех цитозинов (С), не защищенных метильной группой, в урацил (U). Метилированные участки можно выявить с помощью сравнения последовательностей ДНК до и после обработки.

· Пиросеквенирование — метод секвенирования путем синтеза, основанный на обнаружении пирофосфатов, освобождающихся при присоединении к растущей цепи ДНК нуклеотидов при помощи хемолюминесценции (рисунок 4): (A) I — приготовление ДНК­библиотек (фрагментация геномной ДНК и пришивание адептеров); II — эмульсионная ПЦР, в результате которой получают сферы с прикрепленными к ним клонами одной молекулы ДНК; III — помещение сфер на специальную подложку с ячейками таким образом, чтобы в каждой ячейке оказалась одна сфера. (В) Процесс секвенирования: в каждом цикле в ячейку добавляется только один нуклеотид, если он прикрепляется ДНК­полимеразой к растущей цепи ДНК, происходит освобождение пирофосфата, вступающего в реакцию с ферментной системой, состоящей из АТФ­сульфурилазы и люциферазы, в результате которой высвобождается детектируемый видимый свет. Таким образом, свет образуется в тот момент, когда добавленный нуклеотид соответствует первому неспаренному основанию матричной молекулы ДНК. Основная сложность — прочтение гомополимерных последовательностей, т.к. с увеличением числа присоединяемых одновременно нуклеотидов интенсивность свечения возрастает неравномерно.

· Полупроводниковое секвенирование — метод секвенирования путем синтеза, работающий, как и пиросеквенирование, с помощью обнаружения присоединения каждого следующего нуклеотида. Основан на идее, что при присоединении нуклеотида ДНК­полимеразой к растущей цепочке ДНК высвобождается ион водорода, изменяющий рН раствора.

· Секвенирование РНК (RNA­seq) — определение первичной структуры молекулы РНК. Под этим может подразумеваться как секвенирование мРНК, так и определение последовательности некодирующих РНК. Современное полногеномное секвенирование РНК основано на прямом секвенировании фрагментов кДНК.

· Секвенирование по Сэнгеру — метод секвенирования первого поколения, известен как “метод терминаторов”, “дидезокси­метод” или “метод обрыва цепи”, был предложен Ф. Сэнгером в 1977 году (Нобелевская премия по химии 1980 г.). Основан на использовании дидезоксинуклеотидов для терминации цепи в ходе ПЦР. При этом в результате реакции получается набор копий одного фрагмента, отличающихся длиной на один нуклеотид, причем крайний нуклеотид на каждом из фрагментов оказывается флуоресцентно (первоначально — радиокативно) меченым. В современном варианте каждый сорт нуклеотидов метят своей флуоресцентной меткой, детекция флуоресеценции осуществляется в ходе капиллярного электрофореза (рисунок 6).

· Секвенирование следующего (нового) поколения (NGS, Next Generation Sequensing) — технология секвенирования (может быть основана на разных методах), позволяющая одновременно “прочитать” сразу большое число фрагментов ДНК. При этом за один рабочий цикл прибора происходит получение от сотен мегабаз до гигабаз нуклеотидных последовательностей.

· Экзомное секвенирование ­­ стратегия секвенирования всех белок­кодирующих генов в геноме (т. е. экзома), предполагающая выбор только тех участков ДНК, которые кодируют белки (экзонов) и их последующее секвенирование.

· ChIP­seq ­­ метод, используемый для анализа ДНК­белковых взаимодействий и поиска потенциальных сайтов связывания белка.

Основным вариантом использования ChIP-seq является изучение влияния транскрипционных факторов и других ДНК-связывающих белков на фенотип[5]. Определение того, как именно белки взаимодействуют с ДНК для регуляции экспрессии генов, необходимо для детального понимания многих биологических процессов. Эта эпигенетическая информация дополняет генотип и данные по экспрессии генов.

Участки ДНК, физически контактирующие с факторами транскрипции и другими белками, могут быть изолированы методом иммунопреципитации хроматина. В ходе эксперимента получается набор фрагментов ДНК, связанных с исследуемым белком in vivo. Дальнейший анализ включает использование массивного параллельного секвенирования и баз данных полных геномов для определения положения участков связывания в геноме[5].

ChIP-seq, в принципе, применим для любых белков, которые осаждаются в ходе иммунопреципитации хроматина. Типичным примером использования ChIP-seq является определение участков связывания факторов транскрипции, ДНК-полимеразы, структурных белков, а также модификаций гистонов и структуры хроматина[5]. В качестве альтернативы ChIP-seq был разработан ряд не использующих иммунопреципитацию методов (DNase-Seq и FAIRE-Seq) для определения свободных от нуклеосом участков ДНК.

 

Иммунопреципитация:

Иммунопреципитация хроматина — метод, используемый для специфического накопления коротких последовательностей ДНК, связанных с исследуемым белком в живых клетках[6]. Типичная методика включает в себя следующие стадии:

· образование обратимых сшивок между ДНК и взаимодействующими с ней белками

· выделение ДНК и расщепление на фрагменты ультразвуком или эндонуклеазами

· осаждение специфическими к исследуемому белку антителами, пришитыми к бусинам

· разрушение сшивок между белком и ДНК, очистка ДНК

В результате удается специфически выделить те фрагменты ДНК, с которыми был связан исследуемый белок.

У данной методики существует ряд ограничений. Так, обычно для ChIP необходимо значительное количество клеток (около 10 миллионов), что затрудняет применение данного метода на маленьких модельных организмах, а также ограничивает количество экспериментов, которые можно провести с ценным образцом. Ряд методов был разработан для преодоления данного ограничения, например Nano-ChIP-seq[7].

Также существуют вариации метода, направленные на повышение специфичности (ChIP-exo [8]). Так, длина типичного участка связывания белка составляет 6 − 20 нуклеотидов, а длина полученных фрагментов после ChIP — около 200, что делает определение места связывания не слишком точным.

Секвенирование:

Данная стадия включает в себя определение первичной последовательности полученных после иммунопреципитации фрагментов ДНК любым доступным способом. В отличие от ChIP-on-Chip, в ChIP-seq для определения последовательности ДНК используется секвенирование нового поколения[9]. В результате получается набор коротких перекрывающихся последовательностей (чтений, или ридов).

 

· Нанопоровое секвенирование – семейство высокоэффективных методов определения последовательности молекул ДНК или РНК с использованием белковых или твердотельных пор диаметром в несколько нанометров. Нанопоровые системы представляют собой реакционную камеру, внутри которой находится раствор электролита. Камера разделена на две части липидной мембраной или иной тонкой непроводящей поверхностью, в которую внедрена единичная нанопора. К частям камеры прикладывают напряжение, из-за чего возникает ток ионов через пору. Когда исследуемые молекулы проходят через пору по направлению поля, они уменьшают сечение, доступное для ионов, и сила тока падает. Анализируя изменение силы тока, можно определить свойства молекулы, проходящей через пору.

В случае нуклеиновых кислот, диаметр используемых нанопор составляет несколько нанометров, из-за чего ДНК и РНК способны проходить сквозь пору только в одноцепочечной форме, но не в двухцепочечной. При прохождении молекулы нуклеиновой кислоты через пору отдельные нуклеотиды задерживаются в определенных сайтах внутри поры, в результате чего происходит измеримое падение силы тока.

3. Покрытие нуклеотида— количество раз, которое был прочитан нуклеотид в процессе секвенирования. Отсюда можно посчитать, например, среднее покрытие генома.

4. Контиг (contig) — набор перекрывающихся последовательностей фрагментов ДНК (ридов), полученных из одного биологического источника (организма, ткани, клетки) в результате секвенирования.

5. Рид (read, прочтение) — отдельная последовательность нуклеотидов, полученная в результате секвенирования.

6. Скаффолд (scaffold, с англ. “строительные леса”) — серия контигов, расположенных в правильном порядке, но необязательно соединенных в одну непрерывную последовательность.

Да прибудет с нами сила на зачете!...

 


Дата добавления: 2019-02-22; просмотров: 573; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!