TRANSKRIPTOMIKY
příroda
KOMUNIKACE
Charakterizace transkriptu plné délky mutace SF3B1 u chronické lymfocytární leukémie odhaluje downregulaci zadržených intronů
Celovečerní přepisy| Sekvenování nanopórů| Alternativní izoformní analýza
Pozadí
SOmatické mutace ve sestřihovém faktoru SF3B1 se široce uvádí, že se spojují s různými rakovinami, včetně chronické lymfocytární leukémie (CLL), uveálního melanomu, rakoviny prsu atd. Kromě toho krátké transkriptomické studie odhalily aberantní sestřihové vzory vyvolané mutacemi SF3B1. Studie těchto alternativních sestřihových vzorů se však dlouho omezovaly na úroveň událostí a nedostatek znalostí na úrovni izoforem kvůli omezení krátkých čtení sestavených přepisů. Zde byla představena platforma pro sekvenování nanopórů pro generování transkriptů v plné délce, což umožnilo invertigaci na izoformách AS.
Experimentální design
Experimenty
Seskupení:1. CLL-SF3B1(WT) 2. CLL-SF3B1(mutace K700E); 3. Normální B-buňky
Strategie sekvenování:sekvenování 2D knihovny MinION, sekvenování 1D knihovny PromethION; krátká data ze stejných vzorků
Sekvenční platforma:ONT MinION; ONT PromethION;
Bioinformatická analýza

Výsledky
Acelkem 257 milionů čtení bylo generováno ze 6 vzorků CLL a 3 B-buněk. V průměru 30,5 % těchto čtení bylo identifikováno jako přepisy v plné délce.
FAlternativní analýza izoforem RNA (FLAIR) plné délky byla vyvinuta za účelem vytvoření sady vysoce spolehlivých izoforem. FLAIR lze shrnout takto:
Nanopore reads alignment: identifikovat obecnou strukturu transkriptu na základě referenčního genomu;
Skorekce plice junction: opravte chyby sekvence (červená) se sestřihovým místem buď z anotovaných intronů, intronů z krátkých dat nebo obou;
Collapse: shrnutí reprezentativních izoforem na základě spojovacích řetězců (sada prvního průchodu). Vyberte vysoce spolehlivý isofrom na základě počtu podpůrných čtení (Threshold: 3).

Obrázek 1. Analýza FLAIR k identifikaci celodélkových izoforem spojených s mutací SF3B1 u CLL
FLAIR Identifikováno 326 699 vysoce spolehlivých sestřihových izoforem, z nichž 90 % jsou nové izoformy. Bylo zjištěno, že většina z těchto nekomentovaných izoforem jsou novými kombinacemi známých sestřihových spojení (142 971), zatímco zbytek nových izoforem obsahoval buď zachovaný intron (21 700) nebo nový exon (3594).
Long-read sekvence umožňuje identifikaci mutantních SF3B1-K700E-změněných sestřihových míst na úrovni izoforem. Bylo zjištěno, že 35 alternativních 3'SS a 10 alternativních 5'SS jsou významně rozdílně sestřižené mezi SF3B1-K700E a SF3B1-WT. 33 z 35 změn bylo nově objeveno pomocí dlouhých sekvencí. V datech Nanopore je distribuce vzdálenosti mezi 3'SS změněnými SF3B1-K700E k vrcholům kanonických míst kolem -20 bp, což se významně liší od kontrolní distribuce, podobné tomu, co bylo hlášeno u krátkých sekvencí CLL. Byly analyzovány izoformy genu ERGIC3, kde nová izoforma obsahující proximální místo sestřihu byla nalezena hojněji v SF3B1-K700E. Jak proximální, tak distální 3'SS byly spojeny s odlišnými AS vzory generujícími více izoforem.


Obrázek 2. Alternativní 3′ sestřihové vzory identifikované s daty sekvenování nanopórů
Analýza použití IR události byla dlouho omezena v analýze založené na krátkém čtení kvůli důvěře v identifikaci a kvantifikaci IR. Exprese IR izoforem v SF3B1-K700E a SF3B1-WT byla kvantifikována na základě nanopórových sekvencí, což odhalilo globální down-regulaci IR izoforem v SF3B1-K700E.
Obrázek 4. Intenzita zemědělství a síťová konektivita ve třech zemědělských systémech (A a B); Náhodná analýza lesa (C) a vztah mezi intenzitou zemědělství a kolonizací AMF (D)

Obrázek 3. Události zadržování intronů jsou silněji downregulovány u CLL SF3B1-K700E
Technologie
Nanopore Long-read Sequencing
Nanopore sekvenování je technologie sekvenování elektrických signálů v reálném čase s jednou molekulou.
Ddvouvláknová DNA nebo RNA se bude vázat na nanoporézní protein uložený v biofilmu a odvíjející se pod vedením motorického proteinu.
DŘetězce NA/RNA procházejí proteinem nanopórového kanálu určitou rychlostí při působení rozdílu napětí.
Molekuly generují různé elektrické signály podle chemické struktury.
Rdetekce sekvencí v reálném čase je dosaženo voláním báze.

Provedení sekvenování transkriptomu v plné délce
√ Sytost dat

K dosažení srovnatelné saturace dat je potřeba 7krát méně čtení.
√ Identifikace struktury přepisu

Identifikace různých strukturních variant s konsensuálním čtením plné délky každého transkriptu
√ Diferenciální analýza na úrovni přepisu - Odhalte změny skryté krátkým čtením

Odkaz
Tang AD, Soulette CM, Baren MJV a kol. Charakterizace transkriptu plné délky mutace SF3B1 u chronické lymfocytární leukémie odhaluje downregulaci zadržených intronů[J]. Příroda komunikace.
Tech and Highlights si klade za cíl sdílet nejnovější úspěšnou aplikaci různých vysoce výkonných sekvenačních technologií v různých oblastech výzkumu a také skvělé nápady v experimentálním designu a dolování dat.
Čas odeslání: leden-08-2022