Сглобяване на транскриптом на De Novo и откриване на ген на Cistanche Deserticola Fleshy Stem-Ⅱ

Sep 18, 2024

Функционална класификация на всички експресирани транскрипти, базирани на генна онтология и KEGG бази данни

Анотацията на Gene Ontology (GO) е получена от файл за асоцииране на анотация и идентичности на UniProt. Общо 20 907 транскрипта, представляващи 32, 69% от общите експресирани последователности, бяха присвоени на 1 745 функционални термина. От общите функционални термини на GO, присвояването на биологичния процес съставлява мнозинството (1116, 63,95%), последвано от клетъчен компонент (329, 18,85%) и молекулярна функция (300, 17,20%). Присвоените функции на експресирани транскрипти покриваха широк спектър от GO категории, а първите 10 GO термина с най-анотираните транскрипти бяха изброени в таблица 3. Предоставяме всички експресирани транскрипти разпределение в три генни онтологични категории (молекулярна функция, клетъчен компонент и биологичен процес) в допълнителния файл (набор от данни S3). GO термините, свързани със свързващите функции и трансферазната активност, бяха представени предимно в категорията на молекулярната функция. По отношение на функциите на свързване, катионното свързване (4394 транскрипта) представлява най-разпространеното, следвано от нуклеотидно/нуклеозидно свързване (средно 3404 транскрипта) и протеиново свързване (2422 транскрипта). Докато в групата на трансферазната активност най-много са тези с трансферни фосфорсъдържащи групи (2256 транскрипта, 65,77%). Сред категорията на клетъчните компоненти транскриптите са по-разположени вътреклетъчно (средно 10 581 транскрипта), докато сред категорията на биологичния процес транскриптите са по-ангажирани в биополимерния метаболитен процес (средно 6 683 транскрипта), последвани от регулиране на клетъчния процес (4 841 транскрипта ), генна експресия (4678 транскрипта) и транспорт (3512 транскрипта).

Natural cistanche tubulosa

НАТУРАЛНА CISTANCHE TUBULOSA ЗА ПРЕДОТВРАЩАВАНЕ НА БОЛЕСТТА НА АЛЦХАЙМЕР PHGS75% ECH 30% ACT 12%

За извличане на гени, участващи в биосинтезата на лигнин и PhG, 21 358 нередундантни потенциални протеинови последователности бяха търсени срещу генни последователности на 13 растителни организма в базата данни KEGG и те бяха присвоени на 275 KEGG пътя с най-малко 5 попадения. Първите 10 пътя с най-подравнени последователности са изброени в таблица 4. Повечето пътища са включени в първични метаболитни процеси, като аминокиселинен или протеинов метаболизъм (ko01230, ko04141 и ko04120), въглехидратен метаболизъм (ko01200 и ko00500) и нуклеотидни или нуклеозиден метаболизъм (ko03018, ko00230 и ko00240). Освен това има 27 вторични пътища, свързани с метаболизма (Фигура 2), като биосинтеза на терпеноидния скелет, биосинтеза на фенилпропаноид, биосинтеза на каротеноиди, биосинтеза на изохинолин алкалоид и биосинтеза на тропан, пиперидин и пиридинов алкалоид. Тези резултати предоставят допълнителна индикация, че активните метаболитни процеси са в ход вC. deserticolaстволова тъкан. Всички експресирани транскрипти, свързани с KEGG пътища, бяха изброени в допълнителния файл (S4 Dataset). Въпреки че има някои значително променени пътища между C. deserticola и други растения, като ориз (S5 Dataset), нашата основна цел в това изследване е да разкрием целия профил на транскриптома на стъблото на C. deserticola и да си представим свързаните пътища на биосинтеза на PhGs което може да бъде полезно за насочване на култивирането.

image

Кандидат гени, кодиращи ензими, участващи в биосинтезата на лигнин

Лигнинът е вторият най-разпространен естествен земен полимер в растителното царство, съставляващ до една трета от материала, открит в клетъчните стени на растенията. Като важен компонент на клетъчните стени, лигнините помагат за транспортирането на вода, осигуряват механична опора и структурна цялост и защитават срещу патогени и тревопасни животни. Тези роли на лигнина са много ценни за подпомагане на подземния ерективен растеж на C. deserticola в пустинята. В това изследване ние представихме пълната картина на пътищата на биосинтеза на лигнин в C. deserticola (Фигура 3), в която лигниновите мономери се биосинтезират от фенилаланин чрез серия от ензимни реакции, включително хидроксилиране, метилиране, редукция и процес на окислителна полимеризация. Бяха открити ензими, свързани с биосинтезата на лигнин, за три основно синтезирани форми във васкуларната тъкан (р-хидроксил-фенил (Н), гваяцил (G) и сирингил (S) лигнин) и 5-хидроксил-гуаяцил лигнин, който беше идентифициран само в COMT (кофеинова киселина 3-O-метилтрансфераза, EC 2.1.1.68) дефицитни (като нокдаун) растения.

image

Фенилаланин амонячна лиаза (PAL, EC 4.3.1.24) е първият ключов ензим в пътя на биосинтеза на лигнин (Фигура 3), който трансформира фенилаланин в канелена киселина чрез неокислително дезаминиране. Общо 6 297 PAL прочитания бяха секвенирани и 7 PAL транскрипта бяха събрани в C. deserticola (Таблица 5). Чрез сравнение на приликите на последователностите открихме, че 4 от тях (comp28550_c1_seq1/2/3/5) имат повече от 95% сходство с известната иРНК последователност на C. deserticola (gi| 289595227|gb|ADD12041.1|), докато comp28550_c1_seq4 и comp25940_c0_seq1 имаха съответно 77% и 82% прилики. ORF прогнозата разкрива, че 5 транскрипта имат потенциал за кодиране на протеини и се носят с лиазен домен на ароматна аминокиселина (PF00221.14). Сред тях само транскриптът comp28550_c1_seq4 може да кодира пълна протеинова последователност от 718 аминокиселинни остатъка. Съобщава се, че PAL е кодиран от малко мултигенно семейство в повечето растителни видове, като 4 в Arabidopsis thaliana, 5 в Populus trichocarpa, 3 в Scutellaria baicalensis и 7 Cucumis sativus и т.н. Нашият филогенетичен анализ предполага, че има 4 PAL-кодиращи гени в C.

image

image

deserticola и ги нарекохме съответно CdPAL1, CdPAL2, CdPAL3 и CdPAL4 (S2 фиг.). 4-кумарат-CoA лигаза (4CL, EC 6.2.1.12) и транс-цинамат 4-монооксигеназа (CYP73A, EC 1.14.13.11) са два ензима, отговорни за трансформирането на канелената киселина в дикумарол-CoA в две обратни поръчки. Те също са в гръбнаците и стойностите на FPKM на тяхното изразяване са съответно 39,57 и 51,93.

image

Четирите типа лигнини се биосинтезират по различни пътища, които се контролират от три ключови ензима, цинамоил-КоА редуктаза (CCR, EC 1.2.1.44), шикимат о-хидроксицинамоилтрансфераза (HCT, EC 2.3.1.133) и ферулат{{1{ {56}}}}хидроксилаза (F5H, EC 1.14.-.-). CCR се съобщава като контролна точка на пътя на лигнини [50, 51], който катализира X-CoA (X включително дикумарол, кафеоил, ферулоил, 5-хидроксил-ферулоил и синапоил) в Y-алдехид (Y включително p -кугар, кафеоил, кониферил, 5-хидроксил-кониферил и снап), докато HCT катализира р-кумароил-КоА до р-кумароил шикимова киселина/р-кумароил хининова киселина. Двата ензима, подобно на превключвател, регулират биосинтезата на P-хидроксил-фенил лигнини или другите три вида лигнини. F5H е друг превключвател на разклонения, който регулира сирингил лигнин и 5-хидроксил-гваяцил лигнин. Други важни ензими, включително 3-O-метилтрансфераза на кафеената киселина (COMT, EC 2.1.1.68), кафеоил-CoA O-метилтрансфераза (CCoAOMT, EC 2.1.1.104) и цинамил-алкохол дехидрогеназа (CAD, EC 1.1.1.195 ) също бяха открити експресирани. Подробна информация за експресията е посочена в таблица 6. Тези ензимни гени, идентифицирани в това изследване, ще осигурят ценен ресурс за функционални геномни изследвания в това важно лечебно растение. 10 гена, свързани с пътя на биосинтеза на лигнини в Таблица 6, бяха избрани за RT-qPCR проверка, за да потвърдят нашите резултати от RNAseq (Фигура 4), и техните високи корелации (коефициент на корелация на Pearson: 0,90343) показват висока точност и възпроизводимост на нашия анализ на транскриптоми. S1 Dataset изброява праймерните последователности, използвани в този анализ.

Cistanche tubulosa extract

ЕСТЕСТВЕН CISTANCHE TUBULOSA ЗА ПОДОБРЯВАНЕ НА СЕКСУАЛНАТА ФУНКЦИЯ PHGS75% ECH 30% ACT 12%

Кандидат гени, кодиращи ензими, участващи в биосинтезата на PhG

Известно е, че фенилетаноидните гликозиди (PhGs) са основните активни съставки в C. deserticola с дейности за подобряване на сексуалната потентност, отстраняване на свободните радикали и против стареене. Три химични компонента на PhGs са органична киселина, захарид и фенилетанол агликон (Фигура 3). Органичните киселини, включително кафеената киселина, феруловата киселина и кумаловата киселина, са продукти от пътя на биосинтезата на фенилпропаноид. Компонентите на захарида, включително глюкоза и рамноза, са продукти на пътищата на метаболизма на въглехидратите, като метаболизма на нишестето и захарозата, метаболизма на аминозахарта и нуклеотидната захар, метаболизма на фруктозата и манозата и т.н. Пътят на биосинтезата на фенилетанолната част обаче все още не е ясен. Тук предложихме два възможни пътя на биосинтеза на фенилетанол въз основа на нашите данни за последователност. Единият е докладваният път на кафеената киселина или феруловата киселина, известен също като път на канелената киселина, който е подобен на основния път на биосинтеза на лигнин. Друг се основава на пътя на метаболизма на фенилаланина (Фигура 3), при който фенилаланинът до фенилетанол е постигнат чрез известен „път на Enrlich“, открит за първи път в дрожди преди един век и потвърден в цветя на петуния, домати и рози. Четири ензимни гена, кодиращи аспартат/тирозин аминотрансфераза, хистидин-фосфат аминотрансфераза и първична аминооксидаза, които са отговорни за превръщането на фенилаланин във фенилетанол, бяха открити експресирани в стъблото на C. deserticola. Продуктът от фенилетанол може да бъде допълнително окислен от монооксигеназа или метилиран от метилтрансфераза в неговите производни (фенилетанол агликон), които участват в биосинтезата на PhG. В обобщение, два предполагаеми пътя на биосинтеза на фенилетанол агликон бяха предложени заC. deserticolaно все още се нуждаят от допълнително проучване.

дискусии

През последните години геномиката на растенията се развива бързо с прилагането на технология за секвениране от следващо поколение, докато малко изследвания са фокусирани върху геномиката на пустинни лечебни растения. Спешно е необходимо да се извършат геномни или транскриптомични изследвания, за да се разбере неговата адаптация към среда със суша и соленост и пътя на биосинтеза на основните биоактивни компоненти. Откриването на de novo транскриптом за някои медицински растения,

image

image

като Panax ginseng, Ginkgo biloba и Glycyrrhiza uralensis са били използвани за първи път с помощта на платформата Roche 454 заради дългата й дължина на четене. Поради ефективната способност за сглобяване с кратки четения, особено облагодетелстваните четения в сдвоен край, базираното на Illumina транскриптомно секвениране и сглобяване също са широко използвани за моделни и немоделни организми. В настоящото проучване ние генерирахме около 8G от 101 bp четения от сдвоен край и произведохме по-дълги унигенни последователности със средна дължина 725 bp. Широкомащабни данни за транскриптоми, специфични за стъблото, биха могли да предоставят полезни референтни данни и да бъдат използвани за извличане на вторичния метаболизъм на биоактивните компоненти на C. deserticola. Има 81,62% от общите необработени четения, преминали строги филтри за качество (включително изрязване на адаптера и изхвърляне на четения с ниско качество) преди сглобяването, което предполага високото качество на нашите данни за последователност, а 82,08% от висококачествените четения са били полезни за сглобяване. Други четения, които не са успели да бъдат използвани за асемблиране, може да идват от грешки в последователността, параметри на асемблиране и др. Тези неизползвани висококачествени четения остават полезни за подобряване на сглобяването de novo, съчетано с по-дълги четения от друга платформа (като Roche 454) в бъдеще.

Cistanche tubulosa extract

ЕСТЕСТВЕН CISTANCHE TUBULOSA ЗА ПОДОБРЯВАНЕ НА СЕКСУАЛНАТА ФУНКЦИЯ PHGS75% ECH 30% ACT 12%

Голям брой сглобени транскрипти (30 098) показаха големи прилики на последователности с известни гени в публични бази данни, което предполага, че нашите базирани на Illumina данни от сдвоен край покриват значителна част от транскриптите на C. deserticola. Транскрипти без BLAST попадения може да се дължат на 3' или 5' нетранслирани области, некодираща РНК или нови генни последователности на C. deserticola. Експресираните транскрипти бяха анотирани към широк спектър от GO категории и KEGG пътища (Таблици 3 и 4), в които много транскрипти бяха приписани на вторични пътища, свързани с метаболизма. Както знаем, фенилпропаноидът може да функционира като индуцируемо антимикробно съединение с голяма полза за подземен начин на живот [1] и също така да действа като сигнална молекула при взаимодействията растение-микроб, освен неговата медицинска полезност [68, 69]. Терпеноидът се използва за биосинтеза на биоактивни компоненти (като 6- деоксикаталпол) [70]. Установихме, че гените, участващи в пътя на биосинтезата на фенилпропаноидния и терпеноидния скелет, са изобилни в C. deserticola. По-важното е, че откриването на добре представени пътища на биосинтеза на лигнин (Фигура 3) показва активния метаболитен процес на лигнин в стъблото на C. deserticola. Всички известни ензимни гени, участващи в биосинтезата на лигнин (Фигура 3), бяха открити експресирани и четири ключови ензима, включително PAL, CCR, HCT и F5H, имаха по-ниско изобилие на експресия (FPKM 26.47, 3.89, 3.4 и 3.83, съответно) в сравнение с други ензимни гени (Таблица 6). Дали промяната на експресията на тези три гена може да повлияе на производството на лигнин в C. deserticola заслужава допълнително проучване. PAL е ключов ензим в биосинтезата на лигнин и също така участва в биосинтезата на фенилпропаноид, ресвератрол, флавоноид и кумарин [71–74]. Ние открихме четири отделни PAL гена в генома на C. deserticola (S2 Фигура), което съвпада с това, че PAL е кодиран от малко мултигенно семейство [39, 43, 45–49] и допълнително доказа, че може да играе важна роля в метаболитния въглероден поток .

PhG е основната активна съставка в C. deserticola. Гените, участващи в биосинтезата на фенилетанол, са важни за качеството на C. deserticola. Изведехме два различни пътя на биосинтеза на фенил етанол и 17 ензимни гени, участващи в биосинтезата на PhG в стъблото на C. deserticola. Възможните процеси след кафеената/феруловата киселина (Фигура 3) също бяха изведени за първи път въз основа на структурна формула на междинни продукти и каталитични свойства на съответните ензими, при които кафеената/феруловата киселина първо ще се окисли във фенилпируватно производно; след това, карбоксилната група е лишена от декарбоксилази; накрая, алдехидната група се превръща обратно в алкохолна група чрез дехидрогеназа. Това е първото приложение на Illumina технология за секвениране в сдвоен край за изследване на целия транскриптом на C. deserticola и за сглобяване на RNA-seq четения без референтен геном. Това проучване ще предостави полезни ресурси и генни последователности за функционални изследвания на геномиката и протеомиката на C. deserticola в бъдеще.

Изводи

В това проучване профилирахме транскриптома на стъблото на C. deserticola въз основа на данни за високопроизводително секвениране, идентифицирахме гени, участващи в пътищата на биосинтеза на лигнин, и също направихме заключение за потенциалния път на биосинтеза на PhGs за първи път, което със сигурност ще ускори разбирането на двусмислените физиологични процеси и голямата медицинска стойност на молекулярно ниво. Досега това е първият опит за ново сглобяване на целия транскриптом на стъблото на C. deserticola и за откриване на пътя на биосинтеза на лекарствени компоненти с помощта на набори от данни за секвениране на базата на Illumina. Нашето проучване може да насърчи разработването на естествени лекарства и селекцията на сортове с лечебни свойства.

Cistanche tubulosa

ЕСТЕСТВЕН CISTANCHE TUBULOSA ЗА ПОДОБРЯВАНЕ НА СЕКСУАЛНАТА ФУНКЦИЯ PHGS75% ECH 30% ACT 12%

drk-green-rounded-corner-button-buy-now-web


Може да харесаш също