ТРАНСКРИПТОМИКА
природа
КОММУНИКАЦИИ
Полноразмерная характеристика транскрипта мутации SF3B1 при хроническом лимфоцитарном лейкозе выявила подавление сохраненных интронов
Полные стенограммы| Нанопоровое секвенирование| Альтернативный анализ изоформ
Фон
SШироко сообщалось, что оматические мутации фактора сплайсинга SF3B1 связаны с различными видами рака, включая хронический лимфоцитарный лейкоз (ХЛЛ), увеальную меланому, рак молочной железы и т. д. Кроме того, краткие транскриптомные исследования выявили аберрантные паттерны сплайсинга, индуцированные мутациями SF3B1. Однако исследования этих альтернативных паттернов сплайсинга долгое время ограничивались уровнем событий и отсутствием знаний об уровне изоформ из-за ограничения коротких считываемых собранных транскриптов. Здесь была представлена платформа секвенирования нанопор для генерации полноразмерных транскриптов, что позволило изучить изоформы AS.
Экспериментальный дизайн
Эксперименты
Группировка:1. CLL-SF3B1(WT) 2. CLL-SF3B1 (мутация K700E); 3. Нормальные B-клетки
Стратегия секвенирования:Секвенирование библиотеки MinION 2D, секвенирование библиотеки PromethION 1D; данные короткого чтения из одних и тех же образцов
Платформа секвенирования:ОНТ МинИОН; ОНТ ПрометИОН;
Биоинформатический анализ

Результаты
АВсего было получено 257 миллионов прочтений из 6 образцов ХЛЛ и 3 В-клеток. В среднем 30,5% этих прочтений были идентифицированы как полноразмерные транскрипты.
FПолноразмерный альтернативный анализ изоформ РНК (FLAIR) был разработан для получения набора изоформ с высокой достоверностью. FLAIR можно резюмировать следующим образом:
Nвыравнивание считываний anopore: определение общей структуры транскрипта на основе эталонного генома;
Sкоррекция сплайс-соединения: исправление ошибок последовательности (красный) с сайтом сплайсинга либо из аннотированных интронов, либо из интронов из данных короткого считывания, либо из того и другого;
Cсвернуть: суммировать репрезентативные изоформы на основе цепей сплайсинга (набор первого прохождения). Выберите ISO с высокой степенью достоверности на основе количества поддерживающих операций чтения (порог: 3).

Рисунок 1. Анализ FLAIR для выявления полноразмерных изоформ, связанных с мутацией SF3B1 при ХЛЛ.
FLAIR идентифицировал 326 699 сплайсированных изоформ с высокой степенью достоверности, 90% из которых являются новыми изоформами. Было обнаружено, что большинство из этих неаннотированных изоформ представляют собой новые комбинации известных сплайсинговых соединений (142 971), в то время как остальные новые изоформы содержат либо сохраненный интрон (21 700), либо новый экзон (3594).
LПоследовательности ong-read позволяют идентифицировать мутантные SF3B1-K700E-измененные сайты сплайсинга на уровне изоформы. Было обнаружено, что 35 альтернативных 3'SS и 10 альтернативных 5'SS подвергаются значительно дифференциальному сплайсингу между SF3B1-K700E и SF3B1-WT. 33 из 35 изменений были недавно обнаружены при длительном чтении последовательностей. В данных Nanopore распределение расстояний между SF3B1-K700E-измененными 3'SS до пиков канонических сайтов составляет около -20 п.о., что значительно отличается от контрольного распределения, аналогично тому, что сообщалось в последовательностях короткого считывания CLL. Были проанализированы изоформы гена ERGIC3, где новая изоформа, содержащая проксимальный сайт сплайсинга, была обнаружена в большем количестве в SF3B1-K700E. Как проксимальные, так и дистальные 3'SS были связаны с различными паттернами AS, генерирующими множество изоформ.


Рисунок 2. Альтернативные паттерны 3'-сплайсинга, выявленные с помощью данных секвенирования нанопор.
Анализ использования событий IR долгое время был ограничен анализом на основе краткого чтения из-за уверенности в идентификации и количественной оценке IR. Экспрессию изоформ IR в SF3B1-K700E и SF3B1-WT определяли количественно на основе последовательностей нанопор, что выявило глобальное подавление изоформ IR в SF3B1-K700E.
Рисунок 4. Интенсивность сельского хозяйства и сетевая связь между тремя сельскохозяйственными системами (A и B); Случайный анализ леса (C) и связь между интенсивностью сельского хозяйства и колонизацией AMF (D)

Рисунок 3. События удержания интронов более сильно подавляются у CLL SF3B1-K700E.
Технология
Нанопоровое секвенирование длинного считывания
NСеквенирование анопоров — это технология секвенирования электрического сигнала одной молекулы в реальном времени.
Dдвухцепочечная ДНК или РНК будет связываться с нанопористым белком, встроенным в биопленку и раскручивающимся под руководством моторного белка.
DНити NA/РНК проходят через белок канала нанопор с определенной скоростью под действием разности потенциалов.
Mолекулы генерируют различные электрические сигналы в зависимости от химической структуры.
RОбнаружение последовательностей в режиме реального времени достигается путем вызова оснований.

Выполнение полноразмерного секвенирования транскриптома
√ Насыщение данными

Для достижения сопоставимой насыщенности данными требуется в 7 раз меньше операций чтения.
√ Идентификация структуры транскрипта

Идентификация разнообразных структурных вариантов с согласованным полноразмерным считыванием каждого транскрипта.
√ Дифференциальный анализ на уровне стенограммы. Выявляйте изменения, скрытые в коротких чтениях.

Ссылка
Тан А.Д., Сулетт К.М., Барен М.Дж.В. и др. Полноразмерная характеристика транскрипта мутации SF3B1 при хроническом лимфоцитарном лейкозе выявила снижение регуляции сохраненных интронов [J]. Природные коммуникации.
Технологии и основные моменты целью которого является обмен последними успешными применениями различных технологий высокопроизводительного секвенирования в различных областях исследований, а также блестящими идеями в области экспериментального проектирования и интеллектуального анализа данных.
Время публикации: 08 января 2022 г.