Məlumat

Fərqli toxumalar üçün gen şəbəkələri?

Fərqli toxumalar üçün gen şəbəkələri?


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Hal-hazırda gen şəbəkələri üzərində işləyirəm və xüsusən də cinsi davranışını anlamaq üçün bir həşəratın beyin gen tənzimləyici şəbəkəsini təhlil edirəm. Son təqdimat əsnasında, həqiqətən yaxşı bir şəkildə həll edə bilmədiyim bir sual verildi. Sual ondan ibarət idi ki, mən cinsi orqanın gen şəbəkəsini, məsələn, yumurtalıqları öyrənməli olduğum halda, cinsi fəaliyyəti başa düşmək üçün niyə beynin gen şəbəkəsini öyrənirəm. Beyin davranışa qərar verdiyindən beynin GRN -ni öyrənməyin daha yaxşı olacağını söylədim. Ancaq qarışdım və bilmək istərdim ki, eyni orqanizmdəki fərqli toxuma və ya orqanların fərqli gen şəbəkələri varmı? Nəzəriyyə ilə bağlı hər hansı bir fikir alqışlanır.


Eyni Siqnal, Fərqli Dokular: Morfogen Şərh

Düzgün toxuma funksiyası, hər biri spesifik məkan tənzimləmələrində təşkil edilmiş spesifik funksiyaları olan fərqli hüceyrə növləri arasında əməkdaşlıq və qarşılıqlı əlaqəyə əsaslanır. Embrionlarda bu fərqli hüceyrə növlərini necə inkişaf etdirdikləri və funksional toxumalara necə uyğunlaşdıqları inkişaf biologiyasının əsas suallarından biridir. Əksər hallarda, proses, inkişaf etməkdə olan toxuma yayılaraq qradiyentlər əmələ gətirən və gradient boyunca xarakterik mövqelərdə hədəf gen ifadəsini əmələ gətirən gizli molekullar tərəfindən idarə olunur. Təəccüblüdür ki, morfogenlər müəyyən toxumalar üçün spesifik deyil. Bunun əvəzinə, nisbətən kiçik bir siqnal dəsti dəfələrlə müxtəlif inkişaf kontekstlərində istifadə olunur. Bu, pilləli siqnalın toxuma daxilində diferensial hədəf gen reaksiyalarını necə idarə etdiyi və eyni siqnalın müxtəlif hüceyrə növlərini yaratmaq üçün müxtəlif toxumalar tərəfindən necə şərh oluna biləcəyi sualını doğurur.

Morfogen siqnalının toxuma spesifikliyi ilk dəfə morfogen istehsal edən toxumanın transplantasiyasına cavabın alıcı hüceyrələrdən asılı olduğu göstərildiyi klassik embrioloji təcrübələrdə tanındı. Bu xassə səriştəlilik adlanır və hədəf genlərin tənzimləyici elementlərinin əlçatanlığını təyin edən qəbuledici hüceyrələrin epigenetik vəziyyətindən və kofaktorlar və ya töhfə verən transkripsiya effektorları kimi çıxış edən qəbuledici hüceyrələrdə mövcud olan transkripsiya faktorlarından asılıdır. Həm transkripsiya faktorunun ifadəsi, həm də tənzimləyici elementin əlçatanlığı əvvəlki inkişaf hadisələri ilə idarə olunduğundan, bu mexanizm morfogen reaksiyanı hüceyrənin tarixi ilə əlaqələndirir.

Embrion inkişafı zamanı toxuma nümunəsi morfogen qradiyenti ilə hədəf genlərin diferensial induksiyasına əsaslanır. Hedef genlərin induksiyası yalnız morfogen səviyyəsindən deyil, həm də qəbul edən hüceyrələrin spesifik səriştəsindən, hüceyrələrin morfogen siqnalının dinamikasını açmaq qabiliyyətindən və aşağı transkripsiya şəbəkələrinin tənzimləmə məntiqindən asılıdır.

Bir toxuma daxilində morfogen konsentrasiyası diferensial hədəf gen cavablarının əsas determinantı hesab edilmişdir. Bununla birlikdə, bir çox hallarda bu çox sadələşdirilir və siqnalın dinamikası - müddəti və müvəqqəti davranışı da vacibdir. Bir neçə morfogen üçün yolun aktivatorları və ya inhibitorlarının siqnal ilə induksiya edilmiş ifadəsi ilə yaranan siqnal yolu daxilində həm müsbət, həm də mənfi rəy müşahidə edilmişdir. Bu cür rəylər hüceyrələrə morfogen siqnalın dəyişmə müddəti və ya sürəti kimi dinamik xüsusiyyətlərini ölçməyə imkan verə bilər. Bundan əlavə, bir çox morfogen tərəfindən idarə olunan hədəf genlərə transkripsiya faktorları daxildir. Bunlar, faktorlar arasında müsbət və mənfi tənzimləyici qarşılıqlı təsirlərdən ibarət transkripsiya şəbəkələri yarada bilər. Bu şəbəkələrin məntiqi hüceyrələrə diferensial hədəf gen induksiyası üçün siqnal səviyyəsini və dinamikasını birləşdirmək üçün bir vasitə verir. Bu şəbəkələr davamlı bir qradiyenti gen ifadəsindəki diskret açarlara çevirə bilər, hədəf genlərin səs -küylü bir siqnalla induksiyasını artıra bilər və inkişafın erkən mərhələlərində, toxuma kiçik olduqda, daha sonra morfogen bir qradiyent tərəfindən verilən məlumatları ötürə bilər. mərhələlər, toxuma etibarlı bir gradient ilə naxışlanmayacaq qədər böyük olduqda.

Bu yaxınlarda WIREs Developmental Biology-də nəşr olunan “Morfogen şərhi: konsentrasiya, vaxt, səriştə və siqnal dinamikası”” adlı təkmil icmal məqaləsində James Briscoe hüceyrələrin morfogenlərə reaksiyalarını şərh edərək şaxələndirmək qabiliyyətinin əsasını təşkil edən molekulyar mexanizmləri müzakirə edir. kontekstdən asılı və dinamik şəkildə.


Giriş

Yaranan "şəbəkə təbabəti" paradiqmasının, əsas zülalları [1-4] proqnozlaşdırmaq, protein komplekslərini [5-8] müəyyən etmək və fərqli xəstəliklərlə əlaqəli namizəd genləri aşkar etmək üçün fərqli şəbəkəyə əsaslanan yanaşmalardan istifadə etməsi təklif edilmişdir [9]. tərəqqi, şəbəkə tibb insan xəstəliyinin molekulyar mürəkkəbliyini tutmaq potensialına malikdir, eyni zamanda belə mürəkkəbliyin xəstəliyin təzahürlərini, proqnozlarını və terapiyasını necə idarə etdiyini müəyyən etmək üçün hesablama üsulları təklif edir. İndiyə qədər xəstəliklə əlaqəli genləri və kompleksləri öyrənmək üçün müxtəlif növ bioloji məlumatlar istifadə edilmişdir [10-12]. Məsələn, Goh K., et al., [13] eyni xəstəliklə əlaqəli genlərdən ibarət şəbəkə qurdu, Tian W., et al., [14] protein və genetik qarşılıqlı əlaqəni gen ifadəsi korrelyasiyası ilə birləşdirdi. Ulitsky I və Shamir R [15] dərnəkləri müəyyən etmək üçün nəşr olunmuş şəbəkələrdən qarşılıqlı təsirləri və maya iki hibrid təcrübələrini birləşdirdi. CIPHER [16], GeneWalker [17], PRINCE [18] və RWRH [19] 'a görə son tədqiqat işlərinin təhlili, müxtəlif yollarla daha çox uzaq əlaqələrə zülal qarşılıqlı təsirlərindən qaynaqlanan birlikləri vurğuladı. Bənzər xəstəliklərə səbəb olan genlər şəbəkədə bir -birinə yaxın yerləşsələr də, bu alqoritmlər genetik xəstəliklərin əksəriyyətinin yalnız bir və ya bir neçə toxumada təzahür etmə meylini nəzərə almamışdır [13, 20]. Doku spesifikliyi, zülalların və fərqli hüceyrələrdəki yolların potensial olaraq fərqli rollarını əks etdirən bir çox genetik xəstəliyin əhəmiyyətli bir tərəfidir. Genetik pozğunluqlar kontekstində, əsas zərərli mutasiya insan bədənindəki bütün hüceyrələrdə mövcud ola bilsə də, əksər hallarda yalnız bir neçə toxumada xarabalıqlara səbəb olur. Bu toxuma selektivliyi bu toxumalardakı mutasiyaya uğramış zülalın funksionallığında, onun toxumaya xas qarşılıqlı təsir göstərən zülallarında, bolluğunda və bir-biri ilə qarşılıqlı əlaqədə olan zülalların çoxluğunda fərqliliklər səbəbindən meydana çıxacaq. Bu səbəbdən, bu araşdırmanın məqsədi, xəstəlik-gen birləşmələrinin daha dəqiq prioritetlərinə səbəb olan bir toxuma xüsusi şəbəkənin faktiki xəstəliklə əlaqəli toxuma üçün daha yaxşı bir təmsil olub olmadığını araşdırmaqdır.

Bayes quruluşu öyrənmə alqoritmləri vasitəsilə xəstəlikləri aşkar etmək üçün toxuma xüsusi şəbəkələr qurularaq bəzi tədqiqatlar aparılmışdır [21]. Ancaq Bayes quruluşu öyrənmə alqoritmlərinin üç əsas çatışmazlığı var idi, yəni yüksək hesablama xərcləri, keyfiyyətli bilikləri araşdırmaqda səmərəsizlik və fenotipə xas gen şəbəkəsini yenidən qura bilməmək. Digərləri [22] insan PPİ-lərini toxuma-spesifik kontekstdə təhlil edərək, bir çox məişət zülallarının yüksək toxuma spesifik zülallarla qarşılıqlı əlaqədə olduğunu göstərdi, bu da öz növbəsində ev təsərrüfatı zülallarının toxuma spesifik rollarının ola biləcəyini nəzərdə tutur. Bu analiz toxumalar arasında funksional fərqləri müəyyən edən Emig və Albrecht [23] tərəfindən bir addım da irəli çəkilərək, toxumalara xas zülal qarşılıqlı təsirlərinin çox vaxt transmembran nəqlində və reseptorların aktivləşdirilməsində iştirak etdiyini göstərdi.

Buna görə də bu tədqiqat müəyyən bir sorğu xəstəliyi üçün toxuma-spesifik gen-gen şəbəkələrini qurmağa və yeni xəstəlik-gen assosiasiyalarını proqnozlaşdırmaq üçün bu şəbəkələri oxşar fenotip detalları ilə uyğunlaşdırmağa çalışır. Toxuma-spesifik genlər (TSG) metodu adlanan yeni toxuma spesifik gen-gen şəbəkəsinin qurulması metodu ilkin olaraq sorğu xəstəliyinə təsir edən toxumaları müəyyən etmək üçün istifadə ediləcək və ikincisi, toxumaların gen ifadə detalları toxuma yaratmaq üçün istifadə ediləcəkdir. xüsusi gen-gen şəbəkələri. Yaradılmış toxuma spesifik şəbəkələri, gen xəstəlikləri assosiasiyalarını proqnozlaşdırmaq üçün sorğu xəstəliyinin ən yaxın fenotip təfərrüatları ilə istifadə ediləcəkdir. Orijinal Katz metodu dəyişdirildi və toxuma xas gen gen şəbəkələrini istifadə edərək xəstəlik genlərinə üstünlük verməyin əsas üsulu olaraq istifadə edildi. Dokuya xas olan yeni gen-gen şəbəkəsi qurma metodu metodologiya bölməsində ətraflı təsvir edilmişdir.


Giriş

Hüceyrələrin eyni DNT-yə malik olmasına baxmayaraq müxtəlif funksiyaları yerinə yetirdiyi toxuma spesifikliyi, epigenetik modifikasiya və transkripsiya və post-transkripsiya tənzimləməsi daxil olmaqla, toxumadan asılı gen tənzimləmə mexanizmləri vasitəsilə qismən əldə edilir [1-3]. Bu kompleks nəzarət proqramları, toxumaların hər birində fərqli gen ifadə proqramları istehsal edir, əksər genlər statistik olaraq əhəmiyyətli diferensial ifadəni göstərir [4, 5]. Bu fərqlərin əhəmiyyətli nəticələri ola bilər: toxuma xas genlər xüsusilə dərman hədəfləri [6] və toxuma xas transkripsiya faktorlarının xüsusilə kompleks xəstəliklərdə [2, 7, 8] olması ehtimal olunur. Bu fərqləri anlamaq, pleiotropik genləri anlamaq və genomik məlumatların yalnız əlçatan və ya vəkil bir toxuma (məsələn, psixi xəstəliklərin öyrənilməsində qan istifadəsi [9-11]) üçün toplana biləcəyi araşdırmaları şərh etmək üçün də vacibdir.

Toxumalara xas nəzarət mexanizmləri, ifadə səviyyələri bir sıra fərdlər arasında korrelyasiya olunarsa, iki genin birləşdirildiyi birgə ifadə şəbəkələri tərəfindən tutula bilər. Belə bir şəraitdə fərdlər arasında genetik və ya ekoloji fərqlər əsas tənzimləmə şəbəkəsinə kiçik təhriklər kimi xidmət edir və tənzimləmə əlaqələri ilə uyğun gələn genlərin ifadə səviyyələri arasında korrelyasiya ilə nəticələnir. Birgə ifadə şəbəkələri hüceyrə fəaliyyəti haqqında fikir verir, çünki birgə ifadə olunan genlər çox vaxt ümumi funksiyaları bölüşür [12] və belə şəbəkələr xəstəlikləri öyrənmək üçün geniş istifadə olunur [13-15].

Genotip-Doku İfadəsi (GTEx) konsorsiumu məlumat bazası [16], eyni vaxtda görünməmiş sayda insan toxuması üçün bu cür ifadə şəbəkələrini öyrənmək imkanı verir. Bununla belə, profilli toxumaların bir çoxunda ondan daha az nümunə var, birgə ifadə və ya tənzimləyici şəbəkəni təyin edən on milyonlarla parametrləri dəqiq nəticə çıxarmaq üçün çox azdır. Bir həll, bütün mövcud nümunələri birləşdirmək və bütün toxumalar üçün vahid bir konsensus şəbəkəsi öyrənmək olardı, lakin bu toxuma spesifikliyi haqqında heç bir fikir verməzdi. Digər tərəfdən, hər bir şəbəkəni müstəqil şəkildə çıxarmaq toxumaların ümumi cəhətlərinə məhəl qoymur: toxuma şəbəkələri təsadüfən gözləniləndən çox daha çox əlaqə paylaşır və birdən çox toxuma arasında əlaqəni öyrənmək, hətta eyni sayda toxumadan istifadə edərkən belə, bir toxumadan istifadə edərək öyrənmə bağlantılarından daha az səs-küylüdür. ümumi nümunələr [12].

Burada, eyni zamanda 35 fərqli insan toxuması üçün ortaq ifadə şəbəkələri qurmaq üçün yeni bir alqoritm olan GNAT (Gene Network Analysis Tool) istifadə edirik. Doku oxşarlığını kodlayan bir iyerarxiyadan istifadə edərək, yanaşmamız hər bir toxuma üçün bir şəbəkə öyrənir və iyerarxiyada yaxın olan toxumaları oxşar şəbəkələrə sahib olmağa təşviq edir. Hiyerarşik köçürmə öyrənməsinin əvvəlki işlərdə gücü və dəqiqliyi artırdığı göstərilmişdir [5, 6, 17, 18]. Böyük miqyaslı məlumatlar üçün hazırlanmış bir parametr optimallaşdırma metodu ilə birlikdə yeni bir hiyerarşik model təklif edirik və GTEx məlumatlarına tətbiq edirik. Göstəririk ki, metodumuz hər bir toxumada müstəqil olaraq öyrənilən şəbəkələrdən və ya bütün toxumalarda öyrənilən tək bir şəbəkədən daha yüksək çaplı təsdiqlənmə ehtimalı olan şəbəkələri əhatə edir. Metodumuz, nümunə əlaqələrinin bir iyerarxiya ilə təsvir edilə biləcəyi hər hansı bir məlumat bazasına tətbiq olunur - məsələn, filogenetik ağacdakı çoxsaylı xərçəng hüceyrələri və ya növləri. Metodumuz üçün tam kod S1 Data olaraq mövcuddur.

Doku spesifikliyi prinsipləri ilə bağlı bir neçə yeni müşahidələr aparmaq üçün ortaya çıxan şəbəkələri təhlil edirik. Doku kimliyini təyin etməkdə vacib olan genləri müəyyən etmək üçün bir çox ölçü təklif edirik və bu genlərin qeyri -mütənasib olaraq vacib genlər olduğunu nümayiş etdiririk. Şəbəkələrimizdə mərkəzi qovşaq olan toxuma xas transkripsiya faktorlarının toxumaya xas funksiyaları olan genlərlə əlaqələndirdiyini və bu da öz növbəsində daha yüksək ifadə səviyyələrini göstərdiyini göstəririk. Gen Ontologiyası funksiyaları üçün zənginləşdirilmiş 1789 gen modulunu müəyyən edirik və bir toxuma içərisində tənzimlənmiş zənginləşdirilmiş modulların tez -tez toxuma funksiyasına təsirli olduğunu göstəririk. Dokularda meydana gələn modulların, xüsusən də Gen Ontologiyası funksiyaları üçün zənginləşdirildiyini və bu funksiyaların bütün toxumalar üçün vacib olanlara sahib olduğunu göstəririk. Bütün şəbəkələr və gen modulları daxil olmaqla burada təqdim olunan nəticələr veb vasitəmizlə [19] interaktiv olaraq sorğu -sual edilə bilər.


Nəticələr

Siçanlarda Ortaq Sirkadiyalı Genlərin Təyin edilməsi

Fərqli fazalı kosinus funksiyalarına uyğunlaşdıraraq siçandakı 14 toxumanı (Cədvəl S1) əhatə edən 21 sirkadiyalı zaman seriyası mikroarray məlumatlarında sirkadiyalı salınan genləri axtardıq və sirkadiyalı salınan genlər üçün sirkadiyalı faz məlumatlarını çıxardıq. Ən azı bir toxumada sirkadiyalı salınımları göstərən 9995 məlum gen müəyyən etdik (Cədvəl S2). Çoxlu toxumalarda sirkadiyalı salınımı göstərən genlərin sayı toxumaların sayı artdıqca sürətlə azalır, halbuki onların sirkadiyalı fazalarının toxumalar arasında ardıcıllığı səh-dairəvi diapazon testlərinin dəyərləri sürətlə yaxşılaşır (Şəkil 1). Siçandakı 14 toxumadan ən azı 8 -də sirkadiyalı salınım göstərən genlər olaraq təyin olunan 41 ümumi sirkadiya genini təyin etdik (Cədvəl 1). Əvvəllər məlum olan 19 əsas sirkadiya genindən 13 -ü bu araşdırmada təsbit etdiyimiz ümumi sirkadiya genlərindən idi. Digər məlum sirkadiya genləri: Rorb, Ağlamaq 2, Rora, Npas2Hlf müvafiq olaraq bir, üç, üç, dörd və beş toxumada sirkadiyalı salınan olduğu aşkar edilmişdir. Bhlhb3 heç bir toxumada sirkadiyalı salınımlı olduğu aşkar edilməmişdir. Bu ümumi sirkadiyalı genlərdən 39-u əhəmiyyətli uyğunluq göstərdi (p<1/3 dairəvi diapazon testində) bütün toxumalarda sirkadiyalı fazalarının.

(A) Müxtəlif sayda siçan toxumalarında müəyyən edilmiş sirkadiyalı salınan genlərin sayının paylanması. (B) paylanması səhMüxtəlif sayda siçan toxumalarında təyin olunan sirkadiyalı salınan genlərin sirkadiyalı fazaları üçün dairəvi diapazon testlərində dəyərlər.

Dokuların müqayisəsi

Fərqli toxumalarda sirkadiyalı salınan genlər üçün siçan toxuması gen ifadəsi atlasındakı [7] toxumaya xas gen ifadəsi profillərini araşdırdıq. Sirkadiya fazası məlumatlarını toxuma gen ifadəsi məlumatları ilə çarpaz doğrulamaq üçün, sirkadiya fazası məlumatlarında 14 toxumada sirkadiyalı salınımların varlığını və ya olmamasını ifadə etmək üçün 1 və ya 0 ikili matris yaratdıq və 61-də gen ifadəsi matrisi ilə müqayisə etdik. toxuma geninin ifadə atlasından toxumalar. İki matrisdən hər bir cüt toxuma üçün korrelyasiya əmsalı hesabladıq. Qaraciyər, böyrək, skelet əzələsi, adrenal bez və ağ yağ toxumasındakı sirkadiyalı məlumatlar toxuma geninin ifadə atlasındakı müvafiq toxumaları ilə ən yaxşı şəkildə korrelyasiya etdi, halbuki SCN preoptik və hipotalamus ilə eyni dərəcədə yaxşı əlaqələndirildi və qəhvəyi yağ toxuması ilə eyni dərəcədə yaxşı əlaqələndirildi. yağ toxuması və qəhvəyi yağ. Bu nəticələr, kifayət qədər yüksək gen ifadə səviyyələrinin mikroarray məlumat dəstləri kolleksiyamızda sirkadiyalı salınım kimi aşkar edilməsi üçün ilkin şərt olduğunu əks etdirir.

Dokularda sirkadiyalı salınan genlərin sirkadiya mərhələlərindəki fərqlərin, onların gen ifadəsi səviyyəsindəki fərqlərdən qaynaqlandığını araşdırmaq üçün, sirkadiyalı fazaların və gen ifadəsinin varyanslarını, yeddi toxuma aid olan səkkiz toxuma görə hesabladıq. sirkadiyalı məlumatlar və toxuma gen ifadəsi atlası. Ciddi bir əlaqə yoxdur (r = 0.01, səh = 0,71) bu iki variasiya arasında. Məsələn, genin ifadə səviyyəsi Per2 Böyrəküstü vəzilərdə skelet əzələsinə nisbətən 27 dəfə yüksəkdir, lakin bunun sirkadiyalı fazaların ardıcıllığına heç bir təsiri yoxdur. Per2 iki toxuma arasında. Əslində, ümumi sirkadiya genləri, eyni sayda təsadüfi seçilmiş genlərdən 61 toxuma nisbətən daha çox gen ifadəsi var. korrelyasiya əmsallarının olduğunu müşahidə etdik rij ümumi sirkadiyalı gen cütlüklərinin toxuma gen ifadəsi məlumatları arasında (i,j) sirkadiyen faza fərqləri ilə mənfi əlaqəlidir (r = −0.22, p<10 −8 ). Toxuma gen ifadə modellərində müsbət korrelyasiya edilən gen cütləri təsadüfi gözləniləndən əhəmiyyətli dərəcədə aşağı sirkadiyalı faza fərqinə malik idi, halbuki onların toxuma gen ifadə modellərində mənfi korrelyasiya olunmuş gen cütləri təsadüfi olaraq gözləniləndən əhəmiyyətli dərəcədə daha böyük sirkadiyalı faza fərqinə malik idi (Şəkil S1) . Buna görə də, toxumalar arasında oxşar gen ifadə nümunələri olan ümumi sirkadiyalı genlər də oxşar sirkadiyalı fazalara malikdirlər. Sirkadiyalı gen tənzimlənməsi toxumaya xas gen ifadəsinə səbəb olan oxşar mexanizmi paylaşa bilər.

Biz iyerarxik qruplaşmadan istifadə edərək 21 sirkadiyalı faza məlumat dəstini qruplaşdırdıq. Eyni toxumadan və ya bioloji cəhətdən yaxından əlaqəli toxumalardan əldə edilən məlumat dəstləri birlikdə toplanmışdır ki, bu da toxumalar arasında sirkadiyalı fazalardakı fərqlərin onların bioloji fərqlərindən qaynaqlandığını göstərir (Şəkil 2). Dokular arasındakı bu fərqlərin təcrübələr arasında da təkrarlanmasını təmin etmək üçün iki toxuma arasında paylaşılan, lakin bu toxumalar arasında əhəmiyyətli dərəcədə fərqli sirkadiyalı fazlarla əlaqəli sirkadiyalı salınan genləri müəyyən etmək üçün dairəvi ANOVA istifadə etdik. İki SCN məlumat dəsti ilə ən az iki qaraciyər məlumat dəsti arasında paylaşılan 12 sirkadiyalı salınan gen var idi. Onların arasında, Per1, Per2, Nr1d2Avpr1a əhəmiyyətli göstərdi (p<0.01) qaraciyər məlumat dəstləri ilə müqayisədə SCN məlumat setlərində sirkadiyalı fazalarında təxminən 6 saat əvvəl Dnajb1, Hmgb3, Hsp110Pdcd4 SCN və qaraciyər arasında sirkadiyalı fazalarında heç bir əhəmiyyətli fərq göstərmədi (Şəkil 3). SCN ilə bütün beyin toxumaları arasında belə fərqlərin olub olmadığını yoxlamaq üçün SCN -ni 3 tam beyin məlumat dəsti ilə müqayisə etdik. İki SCN məlumat dəsti ilə ən azı iki tam beyin məlumat dəsti arasında paylaşılan 12 sirkadiyalı salınan gen var idi. Per2, Nr1d2Tuba8 bütün beyin məlumat dəstləri ilə müqayisədə SCN məlumat kümelerinde sirkadiyen fazalarında yenə təxminən 6 saat əhəmiyyətli bir irəliləyiş göstərdi. Hmgb3, Hsp110, SgkFabp7 SCN və bütün beyin arasında sirkadiyalı fazalarında əhəmiyyətli fərqlər göstərmədilər. Əlavə müayinələr, o cümlədən tanınmış sirkadiyalı genlərin olduğunu təsdiqlədi Per1, Per2, Ağla1, Arntl, Nr1d1Nr1d2 hamısı SCN və ümumiyyətlə qeyri-SCN toxumaları arasında sirkadiyen fazalarda təxminən 6 saat irəliləyiş göstərdi, halbuki istilik şoku zülalları bütün toxumalarda ardıcıl sirkadiyalı fazalar göstərdi. Bütün ürək, qulaqcıqlar və mədəciklər və ən azı 3 qaraciyər məlumat dəsti daxil olmaqla 3 ürək məlumat dəsti arasında paylaşılan 15 sirkadiyalı salınan gen var idi. Ürək məlumat dəstlərini qaraciyər məlumat dəstləri ilə müqayisə edərək, Bhlhb2 (p<0.001) və Tspan4 (səh = 0.006) ürəkdə qaraciyərdən 5-6 saat əvvəl sirkadiyalı faza sahib idi Dscr1 (səh = 0.002) ürəkdə qaraciyərdən 8 saat gec sirkadiyalı faza sahib idi. Kimi digər tanınmış sirkadiyalı genlər Per1/Per2, ArntlNr1d1/Nr1d2 ürək və qaraciyər arasında ardıcıl sirkadiya fazaları göstərdi. Bütün beyin məlumat dəstlərini qaraciyər məlumat dəstləri ilə müqayisə edərək, Tfrc, St3gal5Tspan4 bütün beyində qaraciyərdən 4 saat əvvəl sirkadiyalı faza sahib idi Tarix 1h1c, Tsc22d1, Myo1b, LitafBC004004 Bütün beyində qaraciyərdən 4 saatdan çox sonra sirkadiyalı fazalar var idi.

Məlumat dəstləri ilk müəllif adları və toxuma növləri ilə ifadə olunur.

səh-dairəvi ANOVA testindən alınan qiymətlər mötərizədə göstərilir. Qatı xətt təmsil edir y = x. Kəsilmiş xətlər simvollaşdırır y = xmüvafiq olaraq ±6.

Məməlilər növləri arasında müqayisə

Siçovulların qaraciyərində sirkadiyalı salınan genlər kimi müəyyən edilən 1269 siçovul geni arasında, onlardan 1137-nin siçanda homoloqu var idi. Onlardan 232 -si, ən azı 2 siçan qaraciyəri məlumat toplusunda 944 siçan qaraciyərinin sirkadiyalı salınan genləri ilə üst -üstə düşür. Həm siçan, həm də siçovul qaraciyərində paylaşılan, lakin əhəmiyyətli dərəcədə fərqli sirkadiyalı fazaları olan sirkadiyalı salınan genləri müəyyən etmək üçün dairəvi ANOVA testindən istifadə etdik. 10 gen əhəmiyyətli dərəcədəsəh& lt0.01) siçan və siçovul qaraciyərləri arasında fərqli sirkadiyalı fazalar. Sirkadiya mərhələləri BC006779, Cdkn1a, Svil, Uox, Ak2, Nr1d1, Mtss1, Nudt16l1Gss siçovul qaraciyərində siçan qaraciyərindən 4-6 saat gec idi Hsd17b2 siçan və siçovul qaraciyərləri arasında anti-fazada idi (Şəkil S2).

803 siçovul iskelet əzələsinin (SKM) sirkadiyalı salınan genləri arasında, 703 -də siçanda homologlar, 64 -də isə 440 siçan SKM sirkadiyalı salınan genlə üst -üstə düşmüşdür. Üst-üstə düşən genlər arasında onlardan 34-ü siçan və siçovul SKM arasında 4 saatdan çox sirkadiyalı faza fərqləri göstərməmişdir. Onlardan 22-si siçan SKM-dən 4 saatdan çox sonra sirkadiyalı fazalara sahib idi. Cpt1a, Pdk4Ucp3, lipid metabolizması ilə məşğul olan, siçan SKM ilə müqayisədə siçovul SKM -də sirkadiyalı fazalarında 5-8 saat gecikmə göstərdi. 8 gen siçan SKM-də siçan SKM ilə müqayisədə 4 saatdan çox əvvəl sirkadiyalı fazalara sahib idi. Onların arasında, Fkbp5SgkQlükokortikoid reseptor elementi (GRE) tərəfindən idarə olunan siçan SKM ilə müqayisədə sirkadiyalı fazalarında təxminən 6 saat irəliləmişdir. Siçan qaraciyəri və SKM, siçovul qaraciyəri və SKM üçün ümumi 11 sirkadiyalı salınan gen var idi. Siçan ilə müqayisədə sirkadiyalı fazalarda 4-5 saat gecikmə həm qaraciyərdə, həm də SKM-də 11 sirkadiyalı gen istisna olmaqla Dynll1.

603 rhesus macaque adrenal bezi sirkadiyalı salınan genlər arasında, 560 -da siçanda homoloqlar və 170 -də 4162 siçan adrenal bezinin sirkadiyalı salınan genləri ilə üst -üstə düşmüşdür. Bu iki növ arasında sirkadiyalı fazalarda da əhəmiyyətli fərqlər gördük. Üst-üstə düşən genlər arasında 47-si siçan və makaka arasında 4 saatdan çox sirkadiyalı faza fərqi göstərməmişdir, halbuki 66-da makaka adrenalında siçan adrenalına nisbətən 4 saatdan çox sonra sirkadiyalı fazalar olmuşdur. Məlum sirkadiyalı əsas genlər, Arntl, Dbp, Nr1d1Bhlhb2, siçan adrenal ilə müqayisədə makaka adrenalında sirkadiyalı fazalarında təxminən 8 saat gecikmə göstərdi. Baxmayaraq ki Per2 meyarlarımıza cavab vermədi (səh<0.01) makaka adrenalında sirkadiyalı salınan gen olması üçün bu gen CT21-də sirkadiyalı fazaya malikdir (səh = 0,03), bu da siçandakından təxminən 8 saat gecdir. Eynilə, istilik şoku zülalları, Hsp110, Hspa8, Dnaja1Dnajb6, siçan adrenalında CT16 ətrafında, lakin makaka adrenalında CT0 ətrafında sirkadiyalı fazalara malik idi. Soyuq səbəb olan protein (Cirbp) siçan adrenalında CT7 ətrafında, lakin makaka adrenalında CT16 ətrafında, həm siçanda, həm də makakada istilik şoku zülalları ilə anti-fazada sirkadiyalı fazaya malik idi. Digər tərəfdən, makak adrenalında siçan adrenalından 4 saat əvvəl sirkadiyalı fazları göstərən 57 gen də var idi.

İnsan sirkadian SKM mikroarray tədqiqatında yalnız iki sirkadian vaxt nöqtəsi ölçmələri var idi: CT1 və CT13. Beləliklə, sirkadiyalı fazaların insan SKM -də CT1 və ya CT13 olduğunu təxminən təxmin edə bilərik. Ümumi sirkadiya genləri arasında Per1, Per2, Nr1d2Dbp CT1 ətrafında sirkadiyalı fazalar var idi, halbuki ArntlAğla1 insan SKM -də CT13 ətrafında sirkadiyalı fazalar var idi. Sirkadiyen fazalarla bağlı təxminlərimiz Per1Per2 insan SKM'sində, 72 saat ərzində 2 saatlıq bir nümunə götürmə vaxtının istifadə edildiyi insan periferik qan mononükleer hüceyrələrində aparılan araşdırma ilə yaxşı razılaşdı [8]. İstilik şoku zülalları, Dnaja1, Dnajb4Hspa4, insanda CT10-da ümumi bədən istiliyinin zirvəsinə uyğun olaraq CT13 ətrafında sirkadiyalı fazalara malik idi [8].

Sonra siçan, siçovul və insanın SKM-lərində sirkadiyalı fazaların üç növ müqayisəsini etdik. Hər üç növdə SKM üçün ümumi olan 12 sirkadiyalı salınan gen tapdıq (Cədvəl 2). Siçan və siçovullarda sirkadiyalı fazaları ən yaxın vaxt nöqtələrinə, CT1 və ya CT13-ə yuvarlaqlaşdırdıqdan sonra müşahidə etdik ki, Per2, Arntl, Dbp, Ppp1r3cAblim 1 siçan və siçovul arasında sirkadiyalı fazaları qoruyub saxlamışdı, lakin insanlardan 12 saat uzaq idi. Epm2aip1, G0S2Maf siçan və insan arasında sirkadiyan fazaları qorudu, ancaq siçovullardan 12 saat uzaqda. Nəhayət, D19Wsu162e, Myod1, Pfn2Ucp3 hər üç növ arasında sirkadiyalı fazaları qorudu.

Sirkadiya ritminin bioloji funksiyaları

Biz GOminer proqramından [9] istifadə edərək hər siçan toxumasında sirkadiyalı salınan genlərdə əhəmiyyətli dərəcədə çox təmsil olunan Gen Ontologiyası (GO) kateqoriyalarını axtardıq. GO kateqoriyalarının assosiasiyalarını fırlanan pəncərə metodu ilə Fisher testindən istifadə edərək hər hansı bir xüsusi sirkadiyalı faz intervalları ilə sınaqdan keçirdik. Müxtəlif toxumalarda sirkadiyalı fazalarla əlaqəli əhəmiyyətli bioloji proseslərin siyahısı Cədvəl S3 -də göstərilmişdir. Bu bioloji proseslərdən ən çox yayılanı steroid biosintezi, istilik şoku reaksiyası və zülal qatlanması idi. Steroid biosintezi qaraciyər, böyrək, adrenal, qəhvəyi yağ toxuması (BAT) və ağ yağ toxumasında (WAT) CT22 ilə əlaqələndirilir. İstilik şoku reaksiyası və ya zülal qatlanması SCN, qaraciyər, böyrək, adrenal, aorta, BAT, WAT, kalvarial sümük və bütün beyində CT16 ilə əlaqələndirildi, çünki əksər toxumalarda ardıcıl olaraq CT16 yaxınlığında sirkadiyalı fazaları göstərən çoxlu istilik şoku zülalları səbəbindən. . Qaraciyərdə karbohidrat və amin turşusu mübadiləsi müvafiq olaraq CT17 və CT15 ilə əlaqələndirilmişdir ki, bu da siçanda işıq söndükdən sonra aktivliyin artmasına uyğundur. BAT, WAT və adrenalda lipid mübadiləsi CT22 ilə əlaqəli idi. Protein kinaz fəaliyyətinin mənfi tənzimlənməsi prefrontal korteksdə CT17 və bütün beyində CT21 ilə əlaqəli idi. Dokular arasındakı bəzi bioloji proseslərin sirkadiyalı mərhələlərində də nəzərəçarpacaq fərqlər var idi. Məsələn, protein tərcüməsi SCN -də CT20 ilə, WAT -da CT9 ilə əlaqəli idi. Orqan inkişafı ürək və BAT-da CT22, adrenal bezlərdə isə CT10 ilə əlaqələndirildi.

Təşviqçi təhlili

Transkripsiya faktorunun (TF) tənzimlənməsinin gen ifadəsinin sirkadiyalı salınması ilə əlaqəsini yoxlamaq üçün, hər bir toxumada sirkadiyalı salınımlı genlərin siçan təbliğatçılarında TF bağlanma yerlərini mövqe çəkisi matrisi (PWM) əsaslı metodlardan istifadə edərək proqnozlaşdırdıq. Əvvəlcə Fisherin dəqiq testindən istifadə edərək sirkadiyalı salınan genlərin təşviqçilərində TF PWM bağlayıcı saytlarının əhəmiyyətli dərəcədə çox təmsil olunmasının olub olmadığını sınadıq. Əhəmiyyətli TF PWM-ləri arasında biz fırlanan pəncərə metodu ilə Fisher testindən istifadə edərək onların hər hansı xüsusi faza intervalları ilə əlaqəsini yenidən sınaqdan keçirdik. TF PWM-lərində artıqlığı aradan qaldırmaq üçün biz TF PWM-lərini TF ailələrinə qruplaşdırdıq və eyni TF ailələri daxilində əhəmiyyətli TF PWM-lərin əlaqəli sirkadiyalı fazalarını ortaladıq. Nəticələr Cədvəl S4 -də göstərilmişdir. EBOX, AP-2, CRE, SP1 və EGR əksər toxumalarda sirkadiyen faza ilə əlaqəli ilk 5 TF ailəsi idi. Bununla belə, toxumalar arasında ümumi sirkadiyalı genlərin ardıcıl sirkadiyalı fazalarından fərqli olaraq, əhəmiyyətli TF ailələrinin əlaqəli sirkadiyalı fazaları müxtəlif toxumalar arasında əhəmiyyətli dərəcədə fərqlənirdi. EBOX SCN, qaraciyər, aorta, adrenal, WAT, beyin, atria, mədəcik və prefrontal korteks daxil olmaqla, əksər toxumalarda CT12 ilə əlaqələndirildi, lakin skelet əzələsi, BAT və kalvarial sümükdə CT0 ilə əlaqələndirildi. CRE, SCN, qaraciyər, aorta, ürək, adrenal, kalvarial sümük, prefrontal korteks və mədəciklərdə CT11 ilə ardıcıl olaraq əlaqəli idi, lakin atriyada CT20 ilə əlaqəli idi. Sirkadiyalı ritmlə əlaqəli digər iki tanınmış TF ailəsinin, RRE və DBOX, yalnız iki toxumada sirkadiyen faza ilə əlaqəli olduğu aşkar edilmişdir. RRE qaraciyərdə və WAT -da CT0 ilə əlaqəli idi. DBOX aorta və adrenal bezlərdə CT16 ilə əlaqəli idi.

Gen tənzimləyici qarşılıqlı təsirlərin müəyyən edilməsi

TF nokautundan və ya mutantlarından mikroarray məlumatları əldə etdik Saat, Arntl, Npas2, Nr1d1, Rora/Rorc, Egr1/Egr3, Dbp/Hlf/TefPpara ilə birlikdə müxtəlif siçan toxumalarında Cebpa/Cebpb/Cebpd/Cebpe NIH3T3 hüceyrələrində mikroarray məlumatlarının köçürülməsi. Qlükokortikoidlərin, cAMP və temperaturun sirkadiyalı ritmə sistematik təsirini öyrənmək üçün mikroarray məlumatlarını daxil etdik. Nr3c1 (qlükokortikoid reseptoru), PkaHsf1 vəhşi tipli siçan ilə müqayisədə müvafiq olaraq DEX (qlükokortikoid agonisti), cAMP və istilik stimulyasiyasına cavab olaraq nokautlar və ya mutantlar. Siçan SCN-də işığa həssas genləri müəyyən etmək üçün işığa cavab verən siçan modelindən mikroarray məlumatları da daxil etdik [10]. Bu tədqiqatda istifadə edilən nokaut və ya mutant mikroarray təcrübələrinin tam siyahısı Cədvəl S5-də göstərilmişdir. Güman etdik ki, TF-lərin hədəf genləri aktivatorlar vəziyyətində vəhşi tipli siçan ilə müqayisədə nokaut və ya mutantda əhəmiyyətli dərəcədə aşağı tənzimlənəcək və repressorlar vəziyyətində yuxarı tənzimlənəcək. Nr1d1. Nokaut və ya mutant eksperimentlərində TF-lərin birbaşa hədəflərini müəyyən etmək üçün biz tələb etdik ki, nokautda və ya mutantda əhəmiyyətli dərəcədə təsirlənmiş genlərin promotor bölgələrində müvafiq TF-lərinin ən azı bir ehtimal bağlanma yeri olmalıdır. Bu meyarlara əsasən, sırasıyla 320 EBOX, 295 RRE, 43 DBOX, 492 EGRE, 455 CRE, 326 GRE, 122 HSE, 607 CEBP və 516 PPRE nəzarətli genləri təyin etdik (Cədvəl S6). Bu genlər üçün, birdən çox toxumada ardıcıl sirkadiya fazaları varsa, orta sirkadiyalı fazalarını çıxardıq (səh<1/3, dairəvi diapazon testi). EBOX -un CT12 ilə əhəmiyyətli dərəcədə əlaqəli olduğunu müşahidə etdik.səh& lt10 -6, Fisherin dəqiq testi), CT1 ilə RRE (səh& lt10 −6), CT15 ilə DBOX (səh<10 −5 ), CT17 ilə SƏTƏM (səh<10 −6 ) (Şəkil S3).

Circadian Gen Tənzimləyici Şəbəkə

Bu tənzimləyici qarşılıqlı təsirlərə əsaslanaraq siçanda sirkadiyalı salınan genlər üçün gen tənzimləyici şəbəkə qurduq. Şəkil 4-də ən azı 7 siçan toxumasında müəyyən edilmiş sirkadiyalı salınan genlərdən ibarət şəbəkəni göstəririk. Ən azı 7 toxumada təyin olunan 81 sirkadiyalı salınan genlər arasında, onlardan 53 -ü 9 ilə 88 tənzimləyici qarşılıqlı əlaqə vasitəsilə daxil edilə bilər. cis-şəbəkəmizdəki tənzimləyici elementlər. Onların sirkadiyalı fazaları rəng çarxında fərqli rənglərlə təmsil olunurdu. EBOX → Per1, EBOX → Nr1d1, EBOX → Ppara, RRE → Nr1d1 və RRE → Cry1 istisna olmaqla, ədəbiyyatda ümumi sirkadiyalı genlər üçün demək olar ki, bütün məlum transkripsiyalı tənzimləyici qarşılıqlı əlaqələri müəyyən edə bildik. Şəbəkəmizi daha da tamamlamaq üçün ədəbiyyatdan bilinməyən protein qarşılıqlı məlumatları (Per/Cry Arntl/Clock və Fkbp: Hsp90 Nr3c1) və protein fosforiləşmə məlumatları (Csnk1d → Per/Cry və Gsk3b → Nr1d1) ilə bu çatışmayan gen tənzimləyici qarşılıqlı əlaqələri tamamladıq. Bu əlaqələr Şəkil 4 -də qırmızı rəngdə göstərilmişdir.

(A) Ən azı 7 siçan toxumasında müəyyən edilən sirkadiyalı salınan genlərdən ibarət olan gen tənzimləmə şəbəkəsi. (B) The subset of network highlighting NR3C1 and FKBP/HSP90's role of integrating the regulatory inputs from diverse environmental signals into circadian genes. Blue arrows represent the gene regulatory interactions obtained in this study. Red arrows represent the known gene regulatory or protein interactions extracted from the literature. P stands for phosphorylation. White boxes represent cis-regulatory elements. Colored circles represent the genes with circadian phase information, where circadian phases are represented by the different colors in the color wheel. White circles represent protein complexes or genes without circadian phase information.

Two well-known negative feedback loops can be reconstructed from this analysis: Arntl/Clock → EBOX → Per1/Per2 Arntl/Clock and Nr1d1/Nr1d2 RRE → Arntl/Clock → EBOX → Nr1d1/Nr1d2. Two feedforward loops are attached to the negative feedback loops through Arntl/Clock → EBOX → Dbp → DBOX → Per1/Per2 acting as an alternative route of Arntl/Clock → EBOX → Per1/Per2 and Nr1d1/Nr1d2 RRE → Nfil3 DBOX → Per1/Per2 Arntl/Clock acting as an alternative route of Nr1d1/Nr1d2 RRE → Arntl/Clock. Bhlhb2 inhibiting EBOX is also regulated by EBOX and Nr1d1 inhibiting RRE is also regulated by RRE, therefore forming two auto-regulatory loops.

The effects of food and light act on common circadian genes directly through GRE and CRE respectively. GRE controls Per1 and Per2, while CRE controls Per1, Rora, Nr1d2, and Nfil3. As shown in Figure 4B, the effect of temperature acts on common circadian genes rather indirectly through the route HSE → Hsp90aa1 → Fkbp/Hsp90 Nr3c1 → GRE → Per1/Per2. Nr3c1 and the Fkbp/Hsp90 complex are also components of another negative feedback loop, Nr3c1 → GRE → Fkbp5 → Fkbp/Hsp90 Nr3c1, which may play an important role in glucocorticoid stimulation. Nr3c1 is also under the control of CRE and therefore may be responsive to light stimulation. Nr3c1 and the Fkbp/Hsp90 complex feed into EBOX by regulating Per1/Per2 through GRE. In turn, EBOX controls both components of the Fkbp/Hsp90 complex, i.e., Fkbp5 directly and Hsp90aa1 indirectly through EBOX → Ppara → PPRE → Hsp90aa1. Therefore, Nr3c1 and Fkbp/Hsp90 play central role of integrating the regulatory inputs from diverse environmental signals into circadian genes in our network (Figure 4B).


Təşəkkürlər

We thank Colleen Russell, Ph.D. for her careful reading of this manuscript and suggestions.

The authors are supported by NIH (R24DK087669, P30DK46200, P30DK072476, DK082574 and 1RC2ES01871), the Society for Women’s Health Research ISIS Network on Metabolism, United States Department of Agriculture's Agricultural Research Service (58-1950-7-707), and the Evans Center for Interdisciplinary Biomedical Research, Department of Medicine, Boston University School of Medicine.


GRNs in Metazoan Development and Evolution

Here, we have focused on examples of the ways in which GRN subcircuits mandate developmental logic. The design features we have considered are devices used to drive the development of all animal embryos, and as the parallelism illustrated in Fig. 1 shows, disparate organisms, in different tissues, using different genes, nonetheless execute similar developmental decisions with the same circuit designs. We believe that in the near future a repertoire of such GRN subcircuits will be revealed, a repertoire that has been assembled in countless combinations throughout the evolution of diverse body plans among the Metazoa.

This PNAS Special Feature contains 10 articles covering a variety of contemporary topics relevant to the role of gene regulatory networks in animal development and evolution. The first 2 articles, by Hobert (19) and Hong və s. (20), respectively, provide Perspectives on two long-standing problems in metazoan development. Hobert discusses recent advances in our understanding of the gene regulatory networks responsible for the specification of individual neuronal cell types in C. elegans (19). Hong və s. (20) summarize the use of postgenome technologies in determining how different concentrations of the Dorsal transcription factor produce a variety of gene expression patterns in the early Drosophila embrion.

The next 4 articles are original research papers that present new insights into our understanding of how gene regulatory networks control different aspects of embryonic and postembryonic development, as well as changes in body patterning during animal evolution. The articles from Tumpel və s. (21), Nikitina və s. (22), Ochoa-Espinosa və s. (23), and Smith and Davidson ( , 18) describe advances in basic embryonic patterning processes, including the specification of the posterior hindbrain in vertebrates, the specification of neural crest progenitors in lampreys, the combinatorial control of A/P patterning of the Drosophila embryo, and the specification of the endomesoderm territory in the sea urchin embryo.

Two more articles are devoted to one of the major challenges in developmental biology, namely, unraveling the complex regulatory networks underlying the formation of postembryonic tissues and organs. The article by Ririe və s. (24) examines vulva development in C. elegans, with an emphasis on how gene networks coordinate individual cells to produce a complex organ. Georgescu və s. (25) examine the fascinating problem of T cell specification and diversification in the mammalian immune system. Evidence is presented for dynamic networks that are generally more plastic and reversible than those seen in hard-wired developmental processes such as endomesoderm specification in the sea urchin.

The final 2 research articles address problems in the evolutionary diversity of animal morphology. Gross və s. (26) explore the genome organization of the Mexican cavefish, Astyanax mexicanus, in an effort to understand the basis for its peculiar mode of adaptation, including the loss of eyes. Finally, Usui və s. (27) investigate the large sensory bristles (macrochaetae) of the adult fruitfly as a paradigm for understanding the evolution of morphological diversity.


Mücərrəd

The co-occurrence of diseases can inform the underlying network biology of shared and multifunctional genes and pathways. In addition, comorbidities help to elucidate the effects of external exposures, such as diet, lifestyle and patient care. With worldwide health transaction data now often being collected electronically, disease co-occurrences are starting to be quantitatively characterized. Linking network dynamics to the real-life, non-ideal patient in whom diseases co-occur and interact provides a valuable basis for generating hypotheses on molecular disease mechanisms, and provides knowledge that can facilitate drug repurposing and the development of targeted therapeutic strategies.


Məzmun

At one level, biological cells can be thought of as "partially mixed bags" of biological chemicals – in the discussion of gene regulatory networks, these chemicals are mostly the messenger RNAs (mRNAs) and proteins that arise from gene expression. These mRNA and proteins interact with each other with various degrees of specificity. Some diffuse around the cell. Others are bound to cell membranes, interacting with molecules in the environment. Still others pass through cell membranes and mediate long range signals to other cells in a multi-cellular organism. These molecules and their interactions comprise a gene regulatory network. A typical gene regulatory network looks something like this:

The nodes of this network can represent genes, proteins, mRNAs, protein/protein complexes or cellular processes. Nodes that are depicted as lying along vertical lines are associated with the cell/environment interfaces, while the others are free-floating and can diffuse. Edges between nodes represent interactions between the nodes, that can correspond to individual molecular reactions between DNA, mRNA, miRNA, proteins or molecular processes through which the products of one gene affect those of another, though the lack of experimentally obtained information often implies that some reactions are not modeled at such a fine level of detail. These interactions can be inductive (usually represented by arrowheads or the + sign), with an increase in the concentration of one leading to an increase in the other, inhibitory (represented with filled circles, blunt arrows or the minus sign), with an increase in one leading to a decrease in the other, or dual, when depending on the circumstances the regulator can activate or inhibit the target node. The nodes can regulate themselves directly or indirectly, creating feedback loops, which form cyclic chains of dependencies in the topological network. The network structure is an abstraction of the system's molecular or chemical dynamics, describing the manifold ways in which one substance affects all the others to which it is connected. In practice, such GRNs are inferred from the biological literature on a given system and represent a distillation of the collective knowledge about a set of related biochemical reactions. To speed up the manual curation of GRNs, some recent efforts try to use text mining, curated databases, network inference from massive data, model checking and other information extraction technologies for this purpose. [4]

Genes can be viewed as nodes in the network, with input being proteins such as transcription factors, and outputs being the level of gene expression. The value of the node depends on a function which depends on the value of its regulators in previous time steps (in the Boolean network described below these are Boolean functions, typically AND, OR, and NOT). These functions have been interpreted as performing a kind of information processing within the cell, which determines cellular behavior. The basic drivers within cells are concentrations of some proteins, which determine both spatial (location within the cell or tissue) and temporal (cell cycle or developmental stage) coordinates of the cell, as a kind of "cellular memory". The gene networks are only beginning to be understood, and it is a next step for biology to attempt to deduce the functions for each gene "node", to help understand the behavior of the system in increasing levels of complexity, from gene to signaling pathway, cell or tissue level. [5]

Mathematical models of GRNs have been developed to capture the behavior of the system being modeled, and in some cases generate predictions corresponding with experimental observations. In some other cases, models have proven to make accurate novel predictions, which can be tested experimentally, thus suggesting new approaches to explore in an experiment that sometimes wouldn't be considered in the design of the protocol of an experimental laboratory. Modeling techniques include differential equations (ODEs), Boolean networks, Petri nets, Bayesian networks, graphical Gaussian network models, Stochastic, and Process Calculi. [6] Conversely, techniques have been proposed for generating models of GRNs that best explain a set of time series observations. Recently it has been shown that ChIP-seq signal of histone modification are more correlated with transcription factor motifs at promoters in comparison to RNA level. [7] Hence it is proposed that time-series histone modification ChIP-seq could provide more reliable inference of gene-regulatory networks in comparison to methods based on expression levels.

Global feature Edit

Gene regulatory networks are generally thought to be made up of a few highly connected nodes (hubs) and many poorly connected nodes nested within a hierarchical regulatory regime. Thus gene regulatory networks approximate a hierarchical scale free network topology. [8] This is consistent with the view that most genes have limited pleiotropy and operate within regulatory modules. [9] This structure is thought to evolve due to the preferential attachment of duplicated genes to more highly connected genes. [8] Recent work has also shown that natural selection tends to favor networks with sparse connectivity. [10]

There are primarily two ways that networks can evolve, both of which can occur simultaneously. The first is that network topology can be changed by the addition or subtraction of nodes (genes) or parts of the network (modules) may be expressed in different contexts. The Drosophila Hippo signaling pathway provides a good example. The Hippo signaling pathway controls both mitotic growth and post-mitotic cellular differentiation. [11] Recently it was found that the network the Hippo signaling pathway operates in differs between these two functions which in turn changes the behavior of the Hippo signaling pathway. This suggests that the Hippo signaling pathway operates as a conserved regulatory module that can be used for multiple functions depending on context. [11] Thus, changing network topology can allow a conserved module to serve multiple functions and alter the final output of the network. The second way networks can evolve is by changing the strength of interactions between nodes, such as how strongly a transcription factor may bind to a cis-regulatory element. Such variation in strength of network edges has been shown to underlie between species variation in vulva cell fate patterning of Caenorhabditis qurdlar. [12]

Local feature Edit

Another widely cited characteristic of gene regulatory network is their abundance of certain repetitive sub-networks known as network motifs. Network motifs can be regarded as repetitive topological patterns when dividing a big network into small blocks. Previous analysis found several types of motifs that appeared more often in gene regulatory networks than in randomly generated networks. [13] [14] [15] As an example, one such motif is called feed-forward loops, which consist three nodes. This motif is the most abundant among all possible motifs made up of three nodes, as is shown in the gene regulatory networks of fly, nematode, and human. [15]

The enriched motifs have been proposed to follow convergent evolution, suggesting they are "optimal designs" for certain regulatory purposes. [16] For example, modeling shows that feed-forward loops are able to coordinate the change in node A (in terms of concentration and activity) and the expression dynamics of node C, creating different input-output behaviors. [17] [18] The galactose utilization system of E. coli contains a feed-forward loop which accelerates the activation of galactose utilization operon galETK, potentially facilitating the metabolic transition to galactose when glucose is depleted. [19] The feed-forward loop in the arabinose utilization systems of E. coli delays the activation of arabinose catabolism operon and transporters, potentially avoiding unnecessary metabolic transition due to temporary fluctuations in upstream signaling pathways. [20] Similarly in the Wnt signaling pathway of Xenopus, the feed-forward loop acts as a fold-change detector that responses to the fold change, rather than the absolute change, in the level of β-catenin, potentially increasing the resistance to fluctuations in β-catenin levels. [21] Following the convergent evolution hypothesis, the enrichment of feed-forward loops would be an adaptation for fast response and noise resistance. A recent research found that yeast grown in an environment of constant glucose developed mutations in glucose signaling pathways and growth regulation pathway, suggesting regulatory components responding to environmental changes are dispensable under constant environment. [22]

On the other hand, some researchers hypothesize that the enrichment of network motifs is non-adaptive. [23] In other words, gene regulatory networks can evolve to a similar structure without the specific selection on the proposed input-output behavior. Support for this hypothesis often comes from computational simulations. For example, fluctuations in the abundance of feed-forward loops in a model that simulates the evolution of gene regulatory networks by randomly rewiring nodes may suggest that the enrichment of feed-forward loops is a side-effect of evolution. [24] In another model of gene regulator networks evolution, the ratio of the frequencies of gene duplication and gene deletion show great influence on network topology: certain ratios lead to the enrichment of feed-forward loops and create networks that show features of hierarchical scale free networks. De novo evolution of coherent type 1 feed-forward loops has been demonstrated computationally in response to selection for their hypothesized function of filtering out a short spurious signal, supporting adaptive evolution, but for non-idealized noise, a dynamics-based system of feed-forward regulation with different topology was instead favored. [25]

Regulatory networks allow bacteria to adapt to almost every environmental niche on earth. [26] [27] A network of interactions among diverse types of molecules including DNA, RNA, proteins and metabolites, is utilised by the bacteria to achieve regulation of gene expression. In bacteria, the principal function of regulatory networks is to control the response to environmental changes, for example nutritional status and environmental stress. [28] A complex organization of networks permits the microorganism to coordinate and integrate multiple environmental signals. [26]

Coupled ordinary differential equations Edit

where the functions f j > express the dependence of S j > on the concentrations of other substances present in the cell. The functions f j > are ultimately derived from basic principles of chemical kinetics or simple expressions derived from these e.g. Michaelis–Menten enzymatic kinetics. Hence, the functional forms of the f j > are usually chosen as low-order polynomials or Hill functions that serve as an ansatz for the real molecular dynamics. Such models are then studied using the mathematics of nonlinear dynamics. System-specific information, like reaction rate constants and sensitivities, are encoded as constant parameters. [29]

By solving for the fixed point of the system:

for all j , one obtains (possibly several) concentration profiles of proteins and mRNAs that are theoretically sustainable (though not necessarily stable). Steady states of kinetic equations thus correspond to potential cell types, and oscillatory solutions to the above equation to naturally cyclic cell types. Mathematical stability of these attractors can usually be characterized by the sign of higher derivatives at critical points, and then correspond to biochemical stability of the concentration profile. Critical points and bifurcations in the equations correspond to critical cell states in which small state or parameter perturbations could switch the system between one of several stable differentiation fates. Trajectories correspond to the unfolding of biological pathways and transients of the equations to short-term biological events. For a more mathematical discussion, see the articles on nonlinearity, dynamical systems, bifurcation theory, and chaos theory.

Boolean network Edit

The following example illustrates how a Boolean network can model a GRN together with its gene products (the outputs) and the substances from the environment that affect it (the inputs). Stuart Kauffman was amongst the first biologists to use the metaphor of Boolean networks to model genetic regulatory networks. [30] [31]

  1. Each gene, each input, and each output is represented by a node in a directed graph in which there is an arrow from one node to another if and only if there is a causal link between the two nodes.
  2. Each node in the graph can be in one of two states: on or off.
  3. For a gene, "on" corresponds to the gene being expressed for inputs and outputs, "off" corresponds to the substance being present.
  4. Time is viewed as proceeding in discrete steps. At each step, the new state of a node is a Boolean function of the prior states of the nodes with arrows pointing towards it.

The validity of the model can be tested by comparing simulation results with time series observations. A partial validation of a Boolean network model can also come from testing the predicted existence of a yet unknown regulatory connection between two particular transcription factors that each are nodes of the model. [32]

Continuous networks Edit

Continuous network models of GRNs are an extension of the boolean networks described above. Nodes still represent genes and connections between them regulatory influences on gene expression. Genes in biological systems display a continuous range of activity levels and it has been argued that using a continuous representation captures several properties of gene regulatory networks not present in the Boolean model. [33] Formally most of these approaches are similar to an artificial neural network, as inputs to a node are summed up and the result serves as input to a sigmoid function, e.g., [34] but proteins do often control gene expression in a synergistic, i.e. non-linear, way. [35] However, there is now a continuous network model [36] that allows grouping of inputs to a node thus realizing another level of regulation. This model is formally closer to a higher order recurrent neural network. The same model has also been used to mimic the evolution of cellular differentiation [37] and even multicellular morphogenesis. [38]

Stochastic gene networks Edit

Recent experimental results [39] [40] have demonstrated that gene expression is a stochastic process. Thus, many authors are now using the stochastic formalism, after the work by Arkin et al. [41] Works on single gene expression [42] and small synthetic genetic networks, [43] [44] such as the genetic toggle switch of Tim Gardner and Jim Collins, provided additional experimental data on the phenotypic variability and the stochastic nature of gene expression. The first versions of stochastic models of gene expression involved only instantaneous reactions and were driven by the Gillespie algorithm. [45]

Since some processes, such as gene transcription, involve many reactions and could not be correctly modeled as an instantaneous reaction in a single step, it was proposed to model these reactions as single step multiple delayed reactions in order to account for the time it takes for the entire process to be complete. [46]

From here, a set of reactions were proposed [47] that allow generating GRNs. These are then simulated using a modified version of the Gillespie algorithm, that can simulate multiple time delayed reactions (chemical reactions where each of the products is provided a time delay that determines when will it be released in the system as a "finished product").

For example, basic transcription of a gene can be represented by the following single-step reaction (RNAP is the RNA polymerase, RBS is the RNA ribosome binding site, and Pro i is the promoter region of gene i):

Furthermore, there seems to be a trade-off between the noise in gene expression, the speed with which genes can switch, and the metabolic cost associated their functioning. More specifically, for any given level of metabolic cost, there is an optimal trade-off between noise and processing speed and increasing the metabolic cost leads to better speed-noise trade-offs. [48] [49] [50]

A recent work proposed a simulator (SGNSim, Stochastic Gene Networks Simulator), [51] that can model GRNs where transcription and translation are modeled as multiple time delayed events and its dynamics is driven by a stochastic simulation algorithm (SSA) able to deal with multiple time delayed events. The time delays can be drawn from several distributions and the reaction rates from complex functions or from physical parameters. SGNSim can generate ensembles of GRNs within a set of user-defined parameters, such as topology. It can also be used to model specific GRNs and systems of chemical reactions. Genetic perturbations such as gene deletions, gene over-expression, insertions, frame shift mutations can also be modeled as well.

The GRN is created from a graph with the desired topology, imposing in-degree and out-degree distributions. Gene promoter activities are affected by other genes expression products that act as inputs, in the form of monomers or combined into multimers and set as direct or indirect. Next, each direct input is assigned to an operator site and different transcription factors can be allowed, or not, to compete for the same operator site, while indirect inputs are given a target. Finally, a function is assigned to each gene, defining the gene's response to a combination of transcription factors (promoter state). The transfer functions (that is, how genes respond to a combination of inputs) can be assigned to each combination of promoter states as desired.

In other recent work, multiscale models of gene regulatory networks have been developed that focus on synthetic biology applications. Simulations have been used that model all biomolecular interactions in transcription, translation, regulation, and induction of gene regulatory networks, guiding the design of synthetic systems. [52]

Other work has focused on predicting the gene expression levels in a gene regulatory network. The approaches used to model gene regulatory networks have been constrained to be interpretable and, as a result, are generally simplified versions of the network. For example, Boolean networks have been used due to their simplicity and ability to handle noisy data but lose data information by having a binary representation of the genes. Also, artificial neural networks omit using a hidden layer so that they can be interpreted, losing the ability to model higher order correlations in the data. Using a model that is not constrained to be interpretable, a more accurate model can be produced. Being able to predict gene expressions more accurately provides a way to explore how drugs affect a system of genes as well as for finding which genes are interrelated in a process. This has been encouraged by the DREAM competition [53] which promotes a competition for the best prediction algorithms. [54] Some other recent work has used artificial neural networks with a hidden layer. [55]

Çox skleroz Düzəliş edin

There are three classes of multiple sclerosis: relapsing-remitting (RRMS), primary progressive (PPMS) and secondary progressive (SPMS). Gene regulatory network (GRN) plays a vital role to understand the disease mechanism across these three different multiple sclerosis classes. [56]


Metodlar

Microarray data used in this study were obtained from the Gene Expression Omnibus (GEO) database at NCBI by Nov. 2 nd of 2009. GEO series with accession numbers GSE2361[4], GSE1133[6](2004 version of the Gene Atlas) and GSE7307[31] (the "human body index") were used to find molecular features in normal tissues and to derive the 56-gene template profiles. (Additional file 1: Table S1) Datasets GSE14334, GSE3204, GSE5364 and GSE6932 were used as testing data to further explore the biological implications of GETs. Datasets GSE1133, GSE2361, GSE5364 and GSE6932 were hybridized on the Affymetrix GeneChip HG-U133A and GSE7307 on the HG-U133plus2.0. The Affymetrix GeneChip HG-U133plus2.0 contained 54,675 probe sets (representing around 38,572 unique UniGene clusters) which cover all the 22283 probe sets (representing 14,593 unique UniGene clusters) synthesized on the HG-U133A. The additional 62 datasets used for large-scale tissue prediction had all been hybridized on either HG-U133A or HG-U133plus2.0. The accession identification as well as the associated information are summarized in Additional file 1: Tables S1 and S3.

Molecular annotation for selected genes

The gene sets were annotated by searching the databases at the DAVID server (http://david.abcc.ncifcrf.gov/home.jsp) with Entrez Gene [32] identifier as input. Cellular location and biological processes were searched against Gene Ontology (GO) [33]. The molecular functions were searched against PANTHER[34], since PANTHER gave a more complete set of biologically-relevant results for our gene set than GO. Pathways were searched against KEGG [35].

Mikroarray analizi

For those datasets whose CEL files are available at GEO, the data were first subjected to quality assessment by AffyQualityReport to remove the poor quality arrays and then to RMA[36] processing for data normalization.

For identification of the 56 signature genes, this preprocessing procedure resulted in 143, 35 and 473 arrays for GSE1133, GSE2361, and GSE7307, respectively. Gene filtration was carried out by firstly selecting from each of the three training datasets the genes whose coefficients of variation ranked at top 2.5% of the entire transcriptome across different tissue types. The resulted highly variably expressed genes were then intersected to generate a set of candidate tissue-classifier genes which were later subjected to data redundancy elimination through hierarchical clustering against the 24 tissues commonly present in the three sets of training data. Following the hierarchical cluster analysis, one representative gene for each cluster was selected and additional genes with highly similar expression profiles got removed. This procedure resulted in 56 genes.

For tissue classification, the probe set intensities of the 56 genes or an equivalent number of random probe sets of the 24 selected tissues were extracted from each of the three GEO datasets using the programs Microsoft Access and Excel. The extracted probe intensities from the three datasets were then combined into a 56 × 72 matrix which was then subjected to hierarchical clustering with the GenePattern package [37] using Pearson correlation for similarity computing and average for clustering. Ten sets of 56 random probe sets were produced by a random number generation program written in C. Each set was used for a separate hierarchical clustering analysis.

Both AffyQualityReport and RMA were obtained from the Bioconductor package [38] in the R package (http://www.r-project.org/). Descriptive statistical analyses were computed using Excel while hierarchical clustering with the GenePattern package.

Tissue prediction using the 56 genes

Tissue prediction was performed following the KNN method (k-nearest neighbor) with k = 1. It compares the c.f. of the 56-gene profiles between a test tissue and each of our 24 tissue-specific GET profiles, one for each tissue type. The tissue type with highest correlation was nominated as our prediction. A computer program in R language was implemented to accomplish this task.

Dataset retrieval from GEO for large-scale tissue-prediction

Text The entire GEO database (2009-11-2 freeze) was searched with the following criteria: platform as GPL96 (Affymetrix HG-U133A) or GPL570 (HG-U133plus2.0), sample source containing one of the 24 distinguishable human organ/tissues and key word in the sample-related fields containing "normal". Two bioinformatics strategies were used to carry out the search: one was to apply SQL commands to the local MySQL database housing the data from the soft files of GPL96 and GPL570 which were imported from GEO website. The other strategy was to directly query the GEO database with Entrez keywords through the NCBI web interface. The union of both searching results was taken, followed by manual filtration to exclude irrelevant datasets that, for example, came from cell lines or specific cell types. Those datasets which had been contributed by the same research group as the three source datasets, GSE3526 for instance, were also removed from our test set. Expression profiles of the 56 genes were then extracted from the 61 resulting datasets.

Datasets of 56 gene expression values were organized into RMA-like or MAS-like according to the data preprocessing methods. For those datasets that had been normalized with MAS5 or equivalent method, logarithmic transformation was carried out prior to tissue-prediction analysis. For three datasets (GSE13355, GSE14951, GSE17539) it was hard to judge whether logarithm transformation was necessary and their CEL files were therefore preprocessed with AffyQualityReport followed by RMA normalization before tissue-prediction analysis.

Gene network construction

Gene networks were constructed with the MetaCore package using the algorithms "network analysis" and "receptor targets modeling". The algorithms are variants of the shortest paths algorithm where the main parameters are: 1) relative enrichment with the uploaded data (the 56 genes in this study), and 2) relative saturation of networks with canonical pathways. As a control for this network analysis, a set of 56 genes randomly selected from the Affymetrix microarray HG-U133A was entered as a query and no network was produced by either of the algorithms. The control experiments were repeated twice.