Məlumat

Şəbəkə parametrlərinin bioloji əhəmiyyəti

Şəbəkə parametrlərinin bioloji əhəmiyyəti


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Mən hazırda şəbəkələr üzərində işləyirəm və şəbəkə üçün diametr, orta yol uzunluğu, orta ekssentriklik, radiallıq və s. bioloji şəbəkə (gen tənzimləyici şəbəkə). Məsələn, kiçik diametr, radiallıq və s. şəbəkənin bioloji xüsusiyyəti ilə bağlı nə deyir. Tədqiqat zamanı mənə kömək edə biləcək yalnız bir məqalə tapa bildim. təşəkkürlər

Redaktə: Mən başa düşürəm ki, bu sual çox geniş olduğu müəyyən edilib, lakin mənə lazım olan tək şey, bəlkə də məni müvafiq həll yolu göstərə biləcək məqalələrə keçidlərdir. Yəqin ki, cavab böyük bir şəbəkənin radiallıq dəyərinə bioloji şəbəkəyə necə təsir etməsi ilə məhdudlaşa bilər?

Edit2: Bu, daha böyük bir şəbəkədən olan çoxluqdur, ikitərəfli xarakter daşıyır, Transkripsiya faktorları və 361 qovşaq ölçüsü olan genlərdən ibarətdir. Məqsədim çoxluqların bir-birindən fərqli olub olmadığını yoxlamaq və hər bir klaster arasında əhəmiyyətli fərqlərin olub olmadığını müəyyən etməkdir. Sual, diametr, radiallıq və s. kimi şəbəkə parametrlərindən hansı bioloji nəticələr çıxara biləcəyi ilə bağlı idi. Məsələn, aşağı diametrli şəbəkə o deməkdir ki, şəbəkə məlumatı hətta ən uzaq qovşaqlar arasında daha sürətli ötürülür, yəni bu şəbəkədəki yollarda funksiyaları olan genlər ola bilər. sürətli hərəkətlər tələb edən, refleks hərəkətlər kimi duyğu qavrayışlarını idarə edən genlər deyirlər.


20.2: Şəbəkənin Mərkəzlik Tədbirləri

  • Manolis Kellis et al.
  • Massaçusets Texnologiya İnstitutunun professoru (Kompüter Elmləri).
  • MIT OpenCourseWare-dən qaynaqlanır

Biz əvvəlki fəsildə bioloji şəbəkəni necə götürə biləcəyimizi və onu riyazi şəkildə modelləşdirə biləcəyimizi müzakirə etdik. İndi biz bu qrafikləri vizuallaşdırarkən və onları anlamağa çalışarkən, sistemin struktur xüsusiyyətləri üçün qovşaq/kənarın əhəmiyyəti üçün müəyyən ölçülərə ehtiyacımız var. Bir qovşağın əhəmiyyətini (mərkəzilik adlandırdığımız) ölçməyin bir çox yolu var. Bu fəsildə biz bu fikirləri araşdıracağıq və onların əhəmiyyətini araşdıracağıq.


Bioloji şəbəkələr: fiziki prinsiplərdən bioloji anlayışlara qədər

“Bioloji Şəbəkələr: Genomikadan Epidemiologiyaya” Bioinformatika üzrə Dördüncü Georgia Tech və UGA Beynəlxalq Konfransı haqqında hesabat, Atlanta, ABŞ, 13-16 noyabr 2003-cü il.

Bioinformatika üzrə Dördüncü Georgia Tech Beynəlxalq Konfransı “Bioloji Şəbəkələr: Genomikadan Epidemiologiyaya” adlanırdı və o, bioloji şəbəkələri anlamaq üzərində işləyən fiziklər, riyaziyyatçılar, kompüter alimləri və bioloqlardan ibarət fənlərarası qrup topladı. Konfrans Mark Borodovski (Georgia Texnologiya İnstitutu, Atlanta, ABŞ) və Eugene Koonin (Milli Biotexnologiya İnformasiya Mərkəzi, Bethesda, ABŞ) tərəfindən təşkil edilmiş və ilk növbədə üç fəal tədqiqat sahəsini əhatə etmişdir: hesablama rekonstruksiyası, analiz və bioloji şəbəkələrin simulyasiyası. Müxtəlif genomika və "interaktomika" layihələrindən əldə edilən eksperimental məlumatların uçqunu o deməkdir ki, üç əsas sahə hazırda nəticələr və nəşrlərdə eksponensial artım yaşayır. Konfransın hesablama ləzzətinə baxmayaraq, nəzəriyyə və eksperiment arasında məhsuldar qarşılıqlı əlaqə aydın şəkildə özünü göstərirdi, çünki iştirakçıların əksəriyyəti eksperimental laboratoriyalarla əməkdaşlıq edir və ya onlardan birbaşa istifadə edir.

Təqdimatlar bioloji şəbəkənin bir neçə növünü əhatə edirdi: zülal-zülal-qarşılıqlı, genetik, tənzimləyici və metabolik. Bu tip şəbəkələr müxtəlif mobil prosesləri təmsil etsə də, onların hamısı ümumi təşkilati və funksional prinsipləri bölüşür. İclasda molekulyar şəbəkələr müxtəlif fəza miqyasında, bütün şəbəkə səviyyəsindən, bioloji yollar və modullar vasitəsilə elementar topoloji motivlər səviyyəsinə qədər öyrənilmişdir. Bir neçə maraqlı danışıqlar bu sahədə sürətli irəliləyişləri vurğuladı.

Adam Arkin (Kaliforniya Universiteti, Berkli, ABŞ) stoxastik mühitlərdə bakteriyaların böyüməsi üçün optimal təkamül strategiyalarını müəyyən etmək üçün qeyri-xətti dinamika və oyun nəzəriyyəsi üsullarından necə istifadə oluna biləcəyini təsvir etdi. O, bioloji proseslərin xas stoxastikliyinin bakteriyaların qeyri-müəyyən mühitlərdə sağ qalmasına necə kömək edə biləcəyini nümayiş etdirdi. Arkin həmçinin müxtəlif bakteriyalardan olan kemotaksis modullarının hərtərəfli müqayisəli təhlilini təqdim etdi. Bakteriyalar arasında kemotaksis modulunun strukturunda dəyişikliklər kemotaksis reaksiyasını təyin edən kinetik parametrlərə həssaslıqda fərqlərə səbəb olur. Məlum olub ki, modullar adətən yalnız bir neçə “vacib” parametrlərə həssasdırlar ki, bu da modulların “təkamül qabiliyyətini” artıra bilər, digər parametrlərə qarşı həssaslıq isə möhkəmliyi və zərərli mutasiyaların təsirlərinə qarşı müqaviməti təmin edir. Çox güman ki, yalnız hissələrin siyahısının müqayisəsini deyil, həm də ətraflı dinamik təhlili ehtiva edən oxşar tədqiqatlar müqayisəli genomikada mühüm növbəti addımı təmsil edir.

Bioloji şəbəkələrin statistik təhlilinə öncülük edən Albert-Laszlo Barabasi (Notre Dame Universiteti, ABŞ), miqyassız davranışın geniş şəbəkələr tərəfindən necə paylaşıldığını təsvir etdi. Ölçəksiz şəbəkələr adətən yüksək səviyyədə qorunmuş və vacib zülalları təmsil edən yüksək əlaqəli mərkəzləri ehtiva edir. Barabasi göstərdi ki, statik şəbəkələrlə yanaşı, bir neçə dinamik bioloji şəbəkələr - məsələn, ko-ifadə şəbəkələri və metabolik axınların yaratdığı şəbəkələr - miqyassız xüsusiyyətlər nümayiş etdirir. O, həmçinin bioloji şəbəkələrin yüksək dərəcədə modulluq nümayiş etdirdiyini və bir-biri ilə yüksək dərəcədə əlaqəli modulların iyerarxik olaraq daha böyük strukturlarda təşkil edildiyini nümayiş etdirdi. Müvafiq təhlildə Rikard Sol (Universitet Pompeu Fabra, Barselona, ​​İspaniya) göstərdi ki, bioloji şəbəkələrin mühüm xüsusiyyətləri, məsələn, miqyassız paylanma və modulluq, şəbəkənin təkamül qaydalarının əlavə məhsulu kimi ortaya çıxa bilər. funksional seçim nəticəsində. Martijn Huynen (Nijmegen Universiteti, Hollandiya) həmçinin bioloji şəbəkələrin müşahidə edilən arxitekturasını seçimsiz sadə mexaniki modelin necə izah edə biləcəyini nümayiş etdirdi.

Andreas Vaqner (Nyu Meksiko Universiteti, Albukerke, ABŞ) öz çıxışını bioloji şəbəkələrin təkamülü və möhkəmliyi ilə bağlı maraqlı suala həsr etdi. O, zülal şəbəkələrinin partnyorların qarşılıqlı əlaqəsi, hüceyrə lokalizasiyası və tənzimlənməsindəki dəyişikliklər baxımından necə inkişaf etdiyini göstərdi. Sergey Maslov (Brookhaven Milli Laboratoriyası, Upton, ABŞ) da zülal-zülal qarşılıqlı əlaqəsi və tənzimləyici şəbəkələr arasında təkamül sürətlərində maraqlı bir fərq göstərdi. Bioloji şəbəkələrin mühüm xüsusiyyəti genetik mutasiyalara qarşı dayanıqlıdır. Zərərli mutasiyalara qarşı möhkəmliyə genlərin təkrarlanması səbəb ola bilər - bir nüsxədə funksiyanın itirilməsi digər nüsxə ilə kompensasiya edilə bilər - və ya alternativ metabolik yolların istifadəsi kimi daha mürəkkəb şəbəkə effektləri ilə. Vaqner bunu sübut edən bir sıra sübutlar təqdim etdi Saccharomyces cerevisiae Gen silinmələrinin 25-50%-i dublikat genlərlə kompensasiya olunur. Həm Vaqner, həm də Maslov əsasında nəticələr göstərdi Caenorhabditis elegans Bu yaxınlarda RNT müdaxiləsindən (RNAi) istifadə etməklə əldə edilmiş "delesiyalar" böyük miqyaslı eksperimental layihələrin məlumatlarının hazırda bioloji şəbəkənin təşkili prinsiplərini araşdırmaq üçün nə qədər tez istifadə edildiyini nümayiş etdirir.

Joel Bader (Cons Hopkins Universiteti, Baltimor, ABŞ) iki hibrid zülal-zülal qarşılıqlı əlaqə xəritəsi üzərində bu yaxınlarda nəşr olunmuş işi təqdim etdi. Drosophila melanogaster. Bu milçək xəritəsi 20.000-dən çox qarşılıqlı əlaqəni ehtiva edir və çoxhüceyrəli orqanizm üçün ilk interaktom xəritəsidir. Əhəmiyyətli odur ki, iki hibrid metodların əhəmiyyətli sayda yalan müsbət və mənfi cəhətləri olduğu bilindiyi üçün Bader yüksək etibarlı qarşılıqlı əlaqəni aşkar etmək üçün hesablama metodunu təqdim etdi. Nəticədə ortaya çıxan yüksək inamlı xəritədə 4679 zülal və 4780 qarşılıqlı əlaqə var. The D. melanoqaster interactome xəritəsi zəngin məlumat mənbəyidir və əlbəttə ki, gələcək illər üçün təhlil ediləcəkdir. Bu şəbəkənin ilkin təhlili bioloji şəbəkələrdə adətən müşahidə olunan güc qanunlarının paylanmasından kənara çıxdığını göstərdi. Bundan əlavə, statistik təhlil iki səviyyəli şəbəkə təşkilatını göstərir: zülal komplekslərini təmsil edən qısa mənzilli strukturlar və ehtimal ki, komplekslərarası əlaqələri təmsil edən daha böyük komponentlər.

Leonid Mirny (Massaçusets Texnologiya İnstitutu, Kembric, ABŞ) maya zülal-zülal qarşılıqlı şəbəkəsində oxşar təşkilatın olduğunu göstərmiş və belə strukturları müəyyən etmək üçün bir neçə alqoritm təqdim etmişdir. Əhəmiyyətli olan odur ki, ikili zülal-zülal qarşılıqlı əlaqəsi kimi statik məlumatlardan əldə edilən strukturlar ya bütün zülalların eyni vaxtda birləşdiyi zülal komplekslərinə (məsələn, ribosom və ya spliceosom) və ya müxtəlif qarşılıqlı təsirlərin həyata keçirildiyi dinamik funksional modullara uyğun ola bilər. müxtəlif vaxtlarda, məsələn, siqnal yolları və ya hüceyrə dövrü idarəetmə modulları. Mirni həmçinin hüceyrə siqnal yolunun stoxastik simulyasiyalarını təqdim edərək belə sadə modulun belə siqnalın qeyri-trivial filtrasiyasına nail ola biləcəyini vurğuladı.

Müasir orqanizmlərdə geniş yayılmış tənzimləyici şəbəkələri araşdırdıqca qədim tənzimləyici qarşılıqlı təsirləri öyrənmək də maraqlıdır. Riboswitchlər kiçik molekulları bağlaya bilən və mRNT konformasiyasını dəyişə bilən mRNT-nin məkan strukturlarıdır və onlar gen ifadəsinin tənzimlənməsinin ən qədim sistemini təmsil edə bilər. Riboswitches üzərində maraqlı iş Mixail Gelfand tərəfindən təqdim edilmişdir (Mərkəz GosNIIGenetika, Moskva, Rusiya), qrupun işi göstərir ki, riboswitches həm transkripsiyanı, həm də tərcüməni tənzimləməklə zülal konsentrasiyalarına nəzarət edir. Riboswitchlərin, məsələn, vitaminlərin, amin turşularının və purinlərin metabolizmasını tənzimlədiyi aşkar edildi və çox böyük filogenetik məsafələrdə saxlanılır. Gelfand həmçinin riboswitchləri əhatə edən tənzimləyici şəbəkələrin təkamülü ilə bağlı bəzi ilkin işləri təqdim etdi.

Ardıcıl genomlarda zülal-domen ailələrinin müşahidə paylanmasını izah etmək məqsədi Koonin və həmkarlarını Doğum, Ölüm və İnnovasiya Modelini (BDIM) inkişaf etdirməyə vadar etdi. BDİM-də parametrləri dəyişdirməklə tədqiqatçılar müxtəlif təkamül proseslərinin domen ailələrinin müşahidə olunan paylanmalarını necə formalaşdırdığını araşdıra bilərlər. Ən sadə xətti BDIM genomlarda domen-ailə ölçülərinin müşahidə olunan paylanmasına əla uyğunluq göstərsə də, modelə stokastikliyin tətbiqi çox böyük təkamül vaxtlarına gətirib çıxarır. Koonin, modeldəki dəyişikliklərin ən azı təkamülü necə sürətləndirə biləcəyini nümayiş etdirdi silisiumda.


2 SİSTEMƏ İCLAMA

CentiScaPe yalnız yönləndirilməyən şəbəkələr üçün bir neçə şəbəkə mərkəzini hesablayır. Hesablanmış parametrlər bunlardır: Orta Məsafə, Diametr, Dərəcə, Stress, Aralıq, Radiallıq, Yaxınlıq, Centroid Dəyəri və Eksantriklik. Plug-in yardımı və onlayn fayllar hər bir mərkəz üçün tərif, təsvir, bioloji əhəmiyyət və hesablama mürəkkəbliyi ilə təmin edilir (Əlavə Cədvəllər S2 və S3, CentralitiesTutorial). Hər bir hesablanmış mərkəzlik üçün min, maks və orta qiymətlər verilir. Birdən çox şəbəkə təhlili də dəstəklənir. Mərkəzlik dəyərləri Cytoscape atributları brauzerində görünür, beləliklə, onlar normal atributlar kimi yadda saxlanıla və yüklənə bilər, beləliklə, onların Cytoscape xəritəçəkmə əsas xüsusiyyətləri ilə vizuallaşdırılmasına imkan verir. Hesablama tamamlandıqdan sonra CentiScaPe qrafik interfeysindən istifadə edərək faktiki təhlil başlayır. CentiScaPe nəticələri qrafik çıxışlar kimi göstərmək üçün pulsuz JFreeChart Java kitabxanalarından (http://jfree.org/jfreechart/) istifadə edir. Təhlilin ilk addımı CentiScaPe-nin Boolean məntiqinə əsaslanan nəticə panelidir. Cytoscape-in ​​Nəticələr Panelində təqdim edilmiş sürgülərdən istifadə etməklə daha yüksək, kiçik və ya istifadəçi tərəfindən müəyyən edilmiş həddi dəyərə bərabər olan mərkəzlik dəyərlərinə malik olan qovşaqları vurğulamaq mümkündür (orta dəyər standart olaraq istifadə olunur). Lazım gələrsə, bir və ya bir neçə mərkəz deaktiv edilə bilər. İstifadəçi bəzi mərkəzlər üçün daha çox/bərabər, digərləri üçün daha az/bərabər variantı seçə bilər və onlara AND-OR operatorları ilə qoşula bilər. Bu funksiya dərhal suallara cavab verə bilər: ‘Hansı qovşaqlar arasında yüksək, lakin aşağı ekssentriklik var?’ Diqqət qazanmaq üçün hədd əl ilə də dəyişdirilə bilər. Düyünlər öz qovşaqlarına xas dəyərlərinə görə seçildikdən sonra, normal Cytoscape əsas xüsusiyyətlərindən istifadə etməklə müvafiq subqraf çıxarıla və göstərilə bilər. İki növ qrafik çıxış dəstəklənir: mərkəzliyə görə süjet və qovşaq üzrə süjet, hər ikisi digər mərkəzləşdirmə alətləri ilə mümkün olmayan təhlilə imkan verir. İstifadəçi onların arasında və ya eksperimental məlumatlarla, məsələn, gen ifadə səviyyəsi və ya zülal fosforlaşma səviyyəsi (mərkəzliklər üzrə süjet) kimi mərkəzlikləri əlaqələndirə bilər və bütün mərkəzlik dəyərlərini düyün üzrə təhlil edə bilər (şəkil 1) . Qrafiklər jpeg faylında saxlanıla bilər.

İnsan kinofosfatomunun şəbəkə təhlili. (A) Protein kinaz MAPK1, şəbəkə strukturunda və funksiyasında mərkəzi rolunu təklif edən hesablanmış mərkəzlərin əksəriyyəti üçün yüksək mərkəzlik dəyərlərini göstərir. Hər bir mərkəzlik üçün xüsusi node dəyəri (boz), orta dəyər (qara), minimum dəyər (açıq boz) və maksimum dəyər (ağ) göstərilir. (B) Tirozində zülal fosforlaşmasının mərkəzi dəyəri və intensivliyi arasında korrelyasiya. Yüksək centroid dəyəri və yüksək fosforlaşma səviyyəsi olan zülallar qrafikin yuxarı/sağ kvadrantında asanlıqla müəyyən edilir. Siçanın süjetdəki həndəsi fiqurların üzərinə yönəldilməsi müvafiq node ID və atribut dəyərlərini göstərir (bax: Bölmə 3 və Əlavə Materiallar).

İnsan kinofosfatomunun şəbəkə təhlili. (A) Protein kinaz MAPK1, şəbəkə strukturunda və funksiyasında mərkəzi rolunu təklif edən hesablanmış mərkəzlərin əksəriyyəti üçün yüksək mərkəzlik dəyərlərini göstərir. Hər bir mərkəzlik üçün xüsusi node dəyəri (boz), orta dəyər (qara), minimum dəyər (açıq boz) və maksimum dəyər (ağ) göstərilir. (B) Tirozində zülal fosforlaşmasının mərkəzi dəyəri və intensivliyi arasında korrelyasiya. Yüksək centroid dəyəri və yüksək fosforlaşma səviyyəsi olan zülallar qrafikin yuxarı/sağ kvadrantında asanlıqla müəyyən edilir. Siçanın süjetdəki həndəsi fiqurların üzərinə yönəldilməsi müvafiq node ID və atribut dəyərlərini göstərir (bax: Bölmə 3 və Əlavə Materiallar).

The mərkəzliyə görə süjet vizuallaşdırma iki seçilmiş parametrin birləşməsinə görə ən uyğun olan qovşaqları və/və ya qovşaqlar qrupunu ayırd etmək üçün asan və rahat üsuldur. O, genomik və/və ya proteomik analizdən eksperimental məlumatlar kimi mərkəzliklər və/və ya digər kəmiyyət node atributları arasında korrelyasiya göstərir. Mərkəzlik seçiminin nəticəsi həndəsi forma ilə təmsil olunan hər bir fərdi düyünün Dekart oxuna uyğunlaşdırıldığı qrafikdir. Üfüqi və şaquli oxda seçilmiş atributların qiymətləri bildirilir. Müvafiq qovşaqların əksəriyyəti qrafikin yuxarı sağ kvadrantında asanlıqla müəyyən edilir. Şəkil 1 (Əlavə Şəkil S1) IL-8 ilə stimullaşdırılan insan ilkin polimorfonükleer neytrofillərinin (PMNs) analizindən əldə edilən insan kino-fosfatom şəbəkəsində zülal tirozinin fosforilləşməsinin intensivliyi üzərində mərkəzi dəyərlərin qrafikini göstərir (Bölmə 3) . Hər iki parametr üçün yüksək dəyərə malik olan zülallar, ehtimal ki, şəbəkədə həlledici tənzimləyici rol oynayır. İstifadəçi beş müxtəlif üsulla plan qura bilər: mərkəzliyə qarşı mərkəzlik, mərkəzlik eksperimental məlumatlara qarşı, eksperimental məlumatlara qarşı eksperimental məlumat, özünə qarşı mərkəzlik və eksperimental məlumat özünə qarşı. Xüsusilə, süjet funksiyasından istifadə etməyin xüsusi yolu iki eksperimental məlumat atributunun səpələnmə qrafikini vizuallaşdırmaqdır. Bu, plug-in əlavə funksiyasıdır və mərkəzlik/mərkəzlik seçimi və mərkəzlik/eksperimental atribut seçimi ilə eyni şəkildə istifadə edilə bilər. Əgər həm üfüqi, həm də şaquli ox üçün eyni mərkəzliyi (və ya eyni eksperimental atribut) seçməklə mərkəzlik üzrə süjet seçimindən istifadə edilərsə, nəticə seçilmiş parametrin yüksək qiymətlərinə malik olan qovşaqlardan aşağı dəyərlərə malik olan qovşaqların asanlıqla fərqləndirilməsidir. Beləliklə, "mərkəzliyə görə süjet" xüsusiyyətinin əsas istifadəsi əlavə təhlil ediləcək alt şəbəkələri çıxarmaq üçün xüsusi topoloji və/və ya eksperimental xassələrin birləşməsinə uyğun olaraq qruplaşdırılmış qovşaqlar qrupunu müəyyən etməkdir. Topoloji xassələrin eksperimental məlumatlarla birləşməsi alt şəbəkə funksiyasının daha mənalı proqnozlarının eksperimental olaraq təsdiqlənməsinə imkan vermək üçün faydalıdır.

The qovşaq seçimi, CentiScaPe-nin başqa bir unikal xüsusiyyəti, hər bir qovşaq üçün bar qrafiki kimi göstərilən bütün hesablanmış mərkəzlərin dəyərini göstərir. Orta, maksimum və min dəyərlər müxtəlif rənglərlə təmsil olunur. Vizuallaşdırmanı asanlaşdırmaq üçün qrafikdəki bütün qiymətlər normallaşdırılır və siçanı çubuq üzərində göstərəndə real dəyərlər görünür. Şəkil 1 (Əlavə Şəkil S2) misal olaraq qlobal insan kinofosfatomundan hesablanmış MAPK1 üçün dəyərləri göstərir.


Maddələr mübadiləsinin şəbəkə təhlili

Hüceyrə metabolizması, qlükoza və ya asetat kimi substratların fermentlər tərəfindən məhsullara çevrildiyi enzimatik reaksiyalardan asılıdır. Bununla belə, metabolik reaksiyalar toplusu bir çox müxtəlif yollarla şəbəkə təmsilinə çevrilə bilər. Şəkil 4 sadə metabolik reaksiya dəstinin bir neçə mümkün şəbəkə təsvirini nümayiş etdirir. Şəkil 4A A-F metabolitləri arasındakı əlaqəni təsvir edir. Birinci reaksiyada A+B→C+D deyirik ki, A və B educts, C və D isə məhsuldur. Ümumi şəbəkə təmsili Şəkil 4C-də göstərilir, burada metabolitlər düyünlərdir və iki metabolit eyni reaksiyada müvafiq olaraq eduksiya və məhsul kimi iştirak edirsə, istiqamətsiz əlaqə ilə bağlanır. Qeyd edək ki, bir əlaqə tək bir reaksiya və ya fermenti təmsil etmir, çünki iki metabolit çoxlu reaksiyalarda görünə bilər. Bu ehtimalın nümunəsi Şəkil 4A-da göstərilmişdir, burada A və D metabolitləri R reaksiyalarında birgə baş verir.1 və R3, və Şəkil 4C-də A və D arasındakı əlaqə hər iki reaksiyaya uyğundur. Xəritəçəkməni daha da çətinləşdirmək üçün bir reaksiya çoxlu keçid kimi də görünə bilər (bax. Şəkil 4). Alternativ təmsil ikitərəfli şəbəkədir (Şəkil 4E), burada iki növ qovşaq metabolitlər və ya fermentlərdir. Bu halda, bir metabolitdən (dan) fermentə (dan) istiqamətlənmiş əlaqə metabolitin həmin reaksiyada təsiredici (məhsul) rolunu oynadığını göstərir. Nəhayət, metabolik reaksiya dəsti reaksiya-reaksiya şəbəkəsi kimi də göstərilə bilər (Şəkil 4F). Burada qovşaqlar reaksiyalardır və iki qovşaq (reaksiyalar) arasında (ehtimal ki, yönəldilmiş) əlaqə daxildir. ij Əgər metabolit reaksiya zamanı məhsul (məhsul) kimi istifadə olunursa i və reaksiya məhsulu (educt) kimi j.

Metabolik şəbəkə quruluşu

Şəklin 4-ün müxtəlif şəbəkə təsvirləri müxtəlif statistik xüsusiyyətlərə malikdir. Bakterial maddələr mübadiləsindən istifadə E. coli nümunə olaraq, Şəkil 5 keçid paylanmasındakı fərqləri göstərir, P(k), Şəkil 4B–D-də təfərrüatlı şəkildə verilmiş üç şəbəkə təsviri ilə nəzərdə tutulur. Qeyd edək ki P(k) Şəkil 5-in bütün panellərində ağır quyruqludur, lakin nəticə ikitərəfli şəbəkə təmsili üçün o qədər də sadə deyil (Şəkil 4E). Bu halda, metabolitlər üçün metabolitləri və fermentləri ayırd etmək mümkündür, əlaqə paylanması ağır quyruqlu, ferment paylanması isə eksponensial ilə ən uyğundur. Bu təəccüblü deyil, çünki ATP və ya NADP kimi kofaktorlar bir fermentin məhdud sayda aktiv sahələrə malik olduğu halda yüzlərlə reaksiyaya kömək edə bilər. Müxtəlif şəbəkə təmsillərinin potensial meyllərini daha da müqayisə etmək və müqayisə etmək üçün Cədvəl 2 qruplaşmanı göstərir<C> və assortitivlik ρ Şəkil 4B,C-nin şəbəkə təsvirlərindən istifadə edən üç orqanizm üçün. Gözlənildiyi kimi, Şəkil 4B-yə uyğun gələn qruplaşma və assortitivlik Şəkil 4C-dən xeyli yüksəkdir, çünki birincidə şəbəkə təmsili hər reaksiya üçün tam əlaqəli subqrafı nəzərdə tutur.

Aşağıda təsvir olunan şəbəkə təsvirlərindən istifadə edərək üç orqanizmin metabolik şəbəkəsi üçün orta qruplaşma və assortitivlik.Şəkil 4B,C

Orqanizm. N . MB . MC . <C>B . <C>C . ρB . ρC .
H. pylori489 4058 1920 0.72 0.28 –0.285 –0.261
E. coli540 3753 1867 0.66 0.20 –0.251 –0.217
S. cerevisiae1064 6941 4031 0.67 0.23 –0.182 –0.150
Orqanizm. N . MB . MC . <C>B . <C>C . ρB . ρC .
H. pylori489 4058 1920 0.72 0.28 –0.285 –0.261
E. coli540 3753 1867 0.66 0.20 –0.251 –0.217
S. cerevisiae1064 6941 4031 0.67 0.23 –0.182 –0.150

İxtisarlar: N, qovşaqların sayı M, keçidlərin sayı<C>, orta klasterləşmə ρ, assortitivlik alt simvolu B və C, müvafiq olaraq Şəkil 4B və Şəkil 4C-də göstərilən şəbəkə təsvirləri

Hüceyrə metabolizması şəbəkə şəklində təmsil oluna bilər. (A) Oyuncaq metabolik reaksiya dəsti. Reaksiya dəstinin şəbəkə təsviri: (B) bir reaksiyada bütün metabolitləri yönləndirilməmiş bağlarla birləşdirən (C) substratlar yalnız istiqamətsiz əlaqələri olan məhsullara bağlıdır və (D) C-də olduğu kimi. (E) Reaksiya dəstinin ikitərəfli şəbəkə təmsili. (F) Reaksiyaları qovşaqlar kimi olan şəbəkə və bir metaboliti bir məhsul-məhsul kimi paylaşan reaksiyalar bağlıdır.

Hüceyrə metabolizması şəbəkə şəklində təmsil oluna bilər. (A) Oyuncaq metabolik reaksiya dəsti. Reaksiya dəstinin şəbəkə təsviri: (B) bir reaksiyada bütün metabolitləri yönləndirilməmiş bağlantılarla birləşdirən (C) substratlar yalnız istiqamətsiz əlaqələri olan məhsullara bağlıdır və (D) C-də olduğu kimi. (E) Reaksiya dəstinin ikitərəfli şəbəkə təsviri. (F) Reaksiyaları qovşaqlar kimi olan şəbəkə və bir metaboliti bir məhsul-məhsul kimi paylaşan reaksiyalar bağlıdır.

Bağlantı paylamaları P(k) of E. coliŞəkil üç metabolik şəbəkə nümayəndəlikləri istifadə maddələr mübadiləsi. 4. Panel A Fig uyğundur. 4B B Şəkil uyğundur. 4C C uyğundur Şəkil.

Bağlantı paylamaları P(k) of E. coliŞəkil üç metabolik şəbəkə nümayəndəlikləri istifadə maddələr mübadiləsi. 4. Panel A Fig uyğundur. 4B B Şəkil uyğundur. 4C C uyğundur Şəkil.

Ağırlıqlı metabolik şəbəkələr

Şəbəkə tədqiqatlarının əksəriyyəti reaksiyadan reaksiyaya əhəmiyyətli dərəcədə dəyişə bilən metabolik fəaliyyətin sürətinə deyil, topoloji xüsusiyyətlərə yönəlmişdir. Bu mühüm funksiya standart topoloji yanaşmalar tərəfindən tutulmur. Metabolik şəbəkənin strukturunun metabolik fəaliyyətə necə təsir etdiyini başa düşmək üçün bu məlumatı şəbəkə təsvirinə daxil etmək lazımdır. Mənalı anlayış bizdən qarşılıqlı təsirlərin intensivliyini (yəni gücü), istiqamətini (mümkün olduqda) və müvəqqəti aspektləri nəzərə almağı tələb edir. Hüceyrə daxilində metabolik fəaliyyətin müvəqqəti aspektləri haqqında hələ də çox şey məlum olmasa da, son nəticələr tək hüceyrəli maddələr mübadiləsində qarşılıqlı təsirlərin nisbi intensivliyi haqqında məlumat verdi (Sauer et al., 1999 Canonaco et al., 2001 Gombert et al. , 2001 Emmerling və digərləri, 2002 Fischer və Sauer, 2003 Cannizzaro et al., 2004 Blank et al., 2005 Fischer and Sauer, 2005). Biz bu nəticələri şəbəkə təhlilinə daxil edə bilərik ki, bağlantılar yalnız mövcud və ya yox, həm də əlavə olaraq iki qovşaq arasında qeyri-bərabər qarşılıqlı təsir gücünü əks etdirən “bağlantı çəkisi” daşısın. Metabolik şəbəkə üçün təbii, unikal olmasa da, qarşılıqlı təsir gücünün ölçülməsi, reaksiyanın “axı” adlanan vahid vaxtda məhsula çevrilən substratın miqdarıdır.

“Flux-balansın təhlili” (FBA) adlanan sadə xətti optimallaşdırma yanaşması bizə bütün hüceyrəli metabolik şəbəkədə hər reaksiya üçün axının sürətini hesablamağa imkan verir. FBA metodu bütün hüceyrə metabolitlərinin konsentrasiyasının, [Ai], hüceyrə membranı vasitəsilə daşınmağa tabe olmayan d[ sabit vəziyyət məhdudiyyətini təmin etməlidir.Ai]/dtjSijνj=0, harada Sij metabolitin stokiometrik əmsalıdır Ai reaksiyada j, t vaxtdır və νjreaksiyanın sabit vəziyyət axınıdır j. Biz konvensiyaya əməl edirik Sij<0 (Sij>0) metabolit olarsa i reaksiyada olan substratdır (məhsul). j. Nümunə olaraq Şəkil 4A-nı götürün. Stokiometrik reaksiya əmsalları j=R3 ondadırlar SA, R3=–2, SE, R3=–1, SD,R3=1, isə SB,R3=SC, R3=SF, R3=0. Qeyd edək ki, istənilən axın dəyəri νi sabit vəziyyət məhdudiyyətinin təmin edilməsi hüceyrənin stoxiometrik olaraq icazə verilən vəziyyətinə uyğundur. Bioloji cəhətdən uyğun olan axın dəyərlərini seçmək üçün hüceyrə artımını optimallaşdırırıq. Təcrübələr bu fərziyyəni bir neçə şəraitdə dəstəkləyir, lakin başqa mənalı məqsədlər də var. Baxın: Bonarius et al.(Bonarius et al., 1997) və Kauffman et al. (Kauffman et al., 2003) FBA-nın daha ətraflı müzakirəsi üçün.

Qönçələnən mayaların metabolik şəbəkəsi üçün FBA analizindən metabolik reaksiya axını dəyərlərinin (bağlantı çəkilərinin) paylanması S. cerevisiae(A) aerob, qlükoza-məhdud və (B) aerob, asetat-məhdud şəraitdə.

Qönçələnən mayaların metabolik şəbəkəsi üçün FBA analizindən metabolik reaksiya axını dəyərlərinin (link çəkilərinin) paylanması S. cerevisiae(A) aerob, qlükoza-məhdud və (B) aerob, asetat-məhdud şəraitdə.

Bütün genom annotasiyasındakı son irəliləyişlər yüksək dəqiqliyə malik bütün hüceyrə səviyyəsində metabolik şəbəkələr yaratmağa imkan verdi. Prokaryotiklərin metabolik modelləri Helicobacter pyloriE. coli, həmçinin eukariot S. cerevisiae, 'əsas genləri' proqnozlaşdırmaq üçün istifadə edilmişdir (Edwards və Palsson, 2000 Schilling et al., 2002 Duarte et al., 2004 Papp et al., 2004), burada bir genin hərəkətinin bir tərəfindən dəyişdirildiyi "epistatik qarşılıqlı təsirlər" və ya müxtəlif lokuslarda çoxlu genlər (Segre və digərləri, 2005) və mümkün 'minimal mikrob genomları' (Burgard və digərləri, 2001 Pal və digərləri, 2006). FBA-dan gələn axınlar hər bir reaksiyanın nisbi aktivliyini ölçür. Xüsusilə, Almaas et al. nümayiş etdirin ki, dərəcə paylanmasına bənzər, axının paylanması E. coli güclü ümumi qeyri-bərabərlik nümayiş etdirir: eyni mühitdə bir neçə böyüklük sırasını əhatə edən axını olan reaksiyalar birlikdə mövcuddur (Almaas et al., 2004). FBA hesablama yanaşmasının tətbiqi, axının paylanması S. cerevisiae (şək. 6) ağır quyruqlu olduğunu göstərir P(ν)∼ν –α axını göstəricisi α=1.5 ilə. Son bir təcrübədə, mərkəzi maddələr mübadiləsinin müxtəlif axınının gücü E. coli Nüvə maqnit rezonansı (NMR) üsulları ilə ölçüldü (Emmerling et al., 2002), güc qanunu axınından asılılığı aşkar etdi. P(ν)∼ν –1 (Almaas et al., 2004). Bu güc qanunu davranışı göstərir ki, kiçik axınları olan reaksiyaların böyük əksəriyyəti böyük axını olan bir neçə reaksiya ilə birlikdə mövcuddur.

üçün node gücü dəyərlərinin paylanması S. cerevisiae (A) aerob, qlükoza-məhdud və (B) aerob, asetat-məhdud şəraitdə metabolizm.

üçün node gücü dəyərlərinin paylanması S. cerevisiae (A) aerob, qlükoza-məhdud və (B) aerob, asetat-məhdud şəraitdə metabolizm.

FBA yanaşması bizə metabolik şəbəkəni ağırlıqlı şəbəkə kimi təhlil etməyə imkan verir, çünki hər reaksiyaya bir axın dəyəri təyin olunur. Qeyri-çəkili şəbəkə ölçülərinin belə ümumiləşdirilməsi əvvəlcə hava nəqliyyatı və həmmüəlliflik şəbəkələri kontekstində tətbiq edilmişdir (Barrat et al., 2004). Ümumiləşdirilmiş şəbəkə ölçülərindən birincisi “qovşaq gücü” adlanır. si, bir node i, kimi müəyyən edilir sijwijaij,harada wij bağlayıcı qovşaqların çəkisidir ij, və aij əvvəlki kimi bitişiklik matrisidir. Düyün gücü ağırlıqlı şəbəkələr üçün qovşaq dərəcəsinin ümumiləşdirilməsi kimi çıxış edir və bir qovşaqla əlaqəli bağlantıların ümumi çəkisini cəmləşdirir. Şəkil 7 node güclərinin paylanmasını göstərir, P(s), üçün E. coli tək karbon mənbəyi kimi qlükoza ilə metabolizm.

Biz klasterləşmə əmsalını çəkili şəbəkələrə ümumiləşdirməklə davam edirik. ildən ci üçbucaqların yerli sıxlığını göstərirsə, link-çəkiləri ilə oxşar tərif böyük və ya kiçik çəkilərin bir yerdə toplanması ehtimalının az və ya çox olub olmadığını ayırd etməyə imkan verməlidir. Biz Barrat və digərləri (Barrat et al., 2004) tərəfindən verilmiş mümkün təriflərdən birini qeyd edirik. cw,i, və orta çəkili klasterləşmə<Cw>=(1/Nicw,i. Əgər çəkilər və topologiya arasında korrelyasiya yoxdursa, klasterləşmə əmsalının bu yeni tərifi çəkisiz şəbəkəninkinə bərabərdir. Bundan əlavə, iki mümkün ssenari müəyyən edə bilərik. Əgər <Cw> daha böyükdür <C>, böyük çəkilər əsasən yerli klasterlərdə paylanır, halbuki əgər <Cw> -dən azdır <C>,üçbucaqlar əsasən aşağı çəkili linklərdən istifadə etməklə qurulur. Bir qədər fərqli xassələrə malik olan çəkili klasterləşmə əmsalının digər mümkün tərifləri təklif edilmişdir (Onnela et al., 2005 Zhang və Horvath, 2005 Holme et al., 2007).

Fluxlar və metabolik şəbəkə quruluşu

Metabolik şəbəkənin axınının paylanması şəbəkə topologiyasına əsaslanır. Bu asılılığın bəziləri arasındakı əlaqə öyrənilərək başa düşülür wij, əlaqə birləşdirən qovşaqların gücü ij və onların müvafiq əlaqələri, kikj. Metabolik axınların miqyası<wij>∼(kikj) θ , burada θ=0,5 qlükoza ilə məhdud şəraitdə S. cerevisiae(Şəkil 8A) və E. coli(Macdonald et al., 2005), eləcə də Dünya-Hava-Nəqliyyat şəbəkəsi (Barrat et al., 2004). Eyni davranışı şəbəkə modellərində də tapa bilərik. Nümunə olaraq, Barabasi-Albert şəbəkə modelində aralıq-mərkəzlik [müəyyən bir node və ya keçiddən neçə ən qısa yolun istifadə etməsinin ölçüsü (bax Brandes, 2001 Freeman, 1977 Newman, 2001 Wasserman and Faust, 1994) (Şəkil 8C) )]. Bununla belə, 8B-də göstərildiyi kimi, θ üçün başqa qiymətlər də mümkündür, burada biz asetatla məhdud şəraitdə metabolik axınlar üçün θ=0,7 tapırıq.

Şəbəkə strukturu tək metabolitlər səviyyəsində axın modellərinə necə təsir edir? Müşahidə olunan miqyassız axının paylanması iki tamamilə fərqli potensial yerli axını strukturu ilə uyğun gəlir. Homojen bir yerli təşkilat, müəyyən bir metaboliti istehsal edən (istehlak edən) bütün reaksiyaların müqayisə edilə bilən axın dəyərlərinə malik olmasını nəzərdə tutur. Digər tərəfdən, əgər yerli axının təşkili heterojendirsə, hər bir metabolit dominant mənbə (istehlak) reaksiyasına malikdirsə, daha lokallaşdırılmış və ya “isti magistral” gözlənilir. Bu iki ssenarini ayırd etmək üçün ölçü müəyyən edirik Y(k,i) (Barthelemy et al., 2003 Almaas et al.,2004) tərəfindən istehsal edilən və ya istehlak edilən hər bir metabolit üçün kreaksiyalar, aşağıdakı xüsusiyyətlərə malikdir. Əgər bütün reaksiyalar metabolit istehsal edirsə (istehlak edir). i müqayisəli dəyərlərə malik olmaq, Y(k,i)≈1/k. Bununla belə, tək reaksiyanın aktivliyi üstünlük təşkil edirsə, onda Y(k,i)≈1, yəni. Y(k,i) müstəqildir k. Bu iki hal üçün E. coli metabolik performans yeganə mövcud karbon mənbəyi kimi qlükoza və suksinat ilə optimallaşdırılır, Y(k)∼k -0,27 . Bu, yuxarıda təsvir edilən iki ekstremal hal arasında ara davranışdır. Bununla belə, β=–0,27 eksponent dəyəri onu göstərir ki, ümumi axının paylanmasında müşahidə olunan geniş miqyaslı qeyri-homogenlik fərdi metabolitlər səviyyəsində də getdikcə etibarlıdır.

Nəticədə, əksər metabolitlər üçün onun istehsalında və ya istehlakında üstünlük təşkil edən tək bir reaksiya müəyyən edilə bilər. Sadə bir alqoritm 'yüksək axınlı magistral' (HFB) adlanan bu dominant reaksiyalardan ibarət olan alt şəbəkəni çıxarmağa qadirdir (Almaas et al., 2004). This algorithm has the following two steps: (1) for each metabolite, discard all incoming and outgoing links except the two links that dominate mass production and (2) from the resulting set of reactions, keep only those reactions that appear as both a maximal producer and a maximal consumer.

Note that the resulting HFB is specific to the particular choice of system boundary conditions (i.e. environment). Interestingly, the HFB mostly consists of reactions linked together, forming a giant component with a star-like topology that includes almost all metabolites produced in a specific growth environment. Only a few pathways are disconnected while these pathways are members of the HFB, their end-products serve only as the second most important source for some other HFB metabolite. One may further analyze the properties of the HFB (Almaas et al.,2004) however, we limit our discussion and simply mention that groups of individual HFB reactions largely agree with the traditional,biochemistry-based partitioning of cellular metabolism into pathways. For example, in the E. coli metabolic model, all metabolites of the citric acid cycle are recovered, and so are a considerable fraction of other important pathways, such as those being involved in histidine, murein and purine biosynthesis, to mention a few. While the detailed nature of the HFB depends on the particular growth conditions, the HFB captures the reactions that dominate the metabolic activity for this condition. As such, it offers a complementary approach to elementary flux mode and extreme pathway analyses(Schuster and Hilgetag, 1994 Schilling et al., 2000 Papin et al., 2004), which successfully determine the available modes of operation for smaller metabolic sub-networks.

Metabolic core reactions

Any whole-cell metabolic model contains a number of transport reactions for the uptake of nutrients and excretion of byproducts. Consequently, we may systematically sample among all possible environments captured by the model through varying the constraints on uptake reactions. This analysis suggests that optimal metabolic flows are adjusted to environmental changes through two distinct mechanisms (Almaas et al.,2004). The more common mechanism is `flux plasticity', involving changes in the fluxes of already active reactions when the organism is shifted from one growth condition to another. For example, changing from glucose- to succinate-rich media altered the flux of 264 E. coli reactions by more than 20%. Less commonly, environmental changes may induce `structural plasticity', resulting in changes to the metabolism's active wiring diagram,turning on previously zero-flux reactions and inhibiting previously active pathways. For example, when shifting E. coli cells from glucose- to succinate-rich media, 11 previously active reactions were turned off completely, while nine previously inactive reactions were turned on.

Correlation between (normalized) link weights and local connectivity for(A) metabolic fluxes in S. cerevisiae in glucose-limited and (B)acetate-limited conditions, as well as (C) betweenness-centrality for the Barabási–Albert model. The broken lines serve as visual guides only.

Correlation between (normalized) link weights and local connectivity for(A) metabolic fluxes in S. cerevisiae in glucose-limited and (B)acetate-limited conditions, as well as (C) betweenness-centrality for the Barabási–Albert model. The broken lines serve as visual guides only.

The `metabolic core' is the set of reactions found to be active (carrying a non-zero metabolic flux) in all tested environments. In recent computational experiments where more than 30 000 possible environments were sampled, the metabolic core contained 138 of the 381 metabolic reactions in the model of H. pylori (36.2%), 90 of 758 in E. coli (11.9%) and 33 of 1172 in S. cerevisiae (2.8%)(Almaas et al., 2005). While these reactions respond to environmental changes only through flux-based plasticity, the remaining reactions are conditionally active, being turned on only in specific growth conditions.

The metabolic core can be further partitioned into two types of reactions. The first type consists of those that are essential for biomass formation under all environmental conditions (81 out of 90 reactions in E. coli), while the second type of reaction is required only to assure optimal metabolic performance. In case of the inactivation of the second type,alternative sub-optimal pathways can be used to ensure cellular survival. However, the compact core of S. cerevisiae only contains reactions predicted by FBA to be indispensable for biomass formation under all growth conditions. A similar selection of metabolic reactions was suggested by Burgard et al. (Burgard et al.,2001). Their `minimal reaction' contains the metabolic core as well as all reactions necessary for the sustained growth on any chosen substrate. A different definition of a minimal reaction set was proposed by Reed and Palsson (Reed and Palsson,2004), which consists of the 201 reactions that are always active in E. coli for all 136 aerobic and anaerobic single-carbon-source`minimal environments' capable of sustaining optimal growth.

A reasonable speculation is that the reactions in the metabolic core play an important role in the maintenance of crucial metabolic functions since they are active under all environmental conditions. Consequently, the absence of individual core reactions may lead to significant metabolic disruptions. This hypothesis is strengthened through cross-correlation with genome-scale gene-deletion data (Gerdes et al.,2003): 74.7% of those E. coli enzymes that catalyze core metabolic reactions (i.e. core enzymes) are essential, compared with a 19.6%lethality fraction for the non-core enzymes. A similar pattern of elevated essentiality is also present when analyzing large-scale deletion data for S. cerevisiae (Giaever et al.,2002). Here, essential enzymes catalyze 84% of the core reactions,whereas the conditionally active enzymes have an average essentiality of only 15.6% (Almaas et al., 2005). The likelihood that the cores contain such a large concentration of essential enzymes by chance is minuscule, with P-values of 3.3×10 –23 and 9.0×10 –13 for E. coli and yeast, respectively.

Metabolic core reactions also stand apart from the conditionally active ones when comparing their evolutionary conservation. In comparing the core enzymes of E. coli with a reference set of 32 bacteria, the average core conservation rate is 71.1% (P<10 –6 ) while the non-core enzymes have a homology matching of only 47.7%. Taking into account correlations between essentiality and evolutionary conservation, one would expect the core enzymes to show a conservation level of 63.4%(Almaas et al., 2005).

These results indicate that an organism's ability to adapt to changing environmental conditions rests largely on the continuous activity of the metabolic core, regardless of the environmental conditions, while the conditionally active metabolic reactions represent the different ways in which a cell is capable of utilizing substrates from its environment. This suggests that the core enzymes that are essential for biomass formation, both for optimal and suboptimal growth, may provide effective antibiotic targets, given the cell's need to maintain the activity of these enzymes in all conditions.


Behavioral Medicine

Perceptive of the factors that sway human health and cause diseases are the chief driving forces of biological research. With advancement in quantitative techniques, large-scale measurement methods and with the close combination between experimental and computational approaches, Biology has lately gained new technological and conceptual tools to investigate, model, and understand living organisms at the system level. The young discipline of Systems Biology is devoted to the study of well-characterized model organisms. It is clear since the days of the human genome project that applications of system-wide approaches to human biology would open up great breaks in medicine.

Recent lessons learned from Systems Biology, when used on simple organisms like bacteria or yeast, predict the kind of understanding that will profit both basic medical research and clinical applications giving deeper appreciation of the genotype–phenotype relationship impact of the interactions between environmental conditions and genotype new mechanistic and functional understanding based on global unbiased approaches explanation of potent predictive models capturing the details of physiological states, progress on these various faces clearly depend on different types of research, ranging from investigations on basic aspects of human biology to the more clinically oriented applications. Appreciably, as techniques and concepts are established, a new discipline is budding at the crossing point between Medicine and Systems Biology.

In fields pertinent to medical research, together with cancer biology, deciphering the mechanisms of disease requires a deep knowledge of how signaling the process of shuffling of genes pathways operates. Quantitative large-scale study of proteins has made possible the simultaneous monitoring of the simultaneous activity of multiple signaling molecules, enabling a broader and unbiased view of cellular signaling proceedings. This type of high-throughput screening can be correlated to biological response like proliferation and cell migration to further understanding of the pathways known to be deregulated in cancer. These approaches reveal the unavoidable fact that biological pathways are highly interrelated, which represents one of the major motivations for adopting a system-level approach in biology. The impact of plugging in on biological outcome is analyzed to explain synergies and other non-intuitive interactions observed between concurrently applied drugs, with vital outcomes for drug design and pharmacology. The concept of linear pathway is confronted by network representations, which highlight the significance of interactions between components of a biological system. This network-based conceptual framework transforms current models in disease classification and treatment. The main practical challenge is how to figure out the structure of complex networks that underlie biological processes and how to characterize their state when disturbed by disease. New calculation strategies combined with the now well-established genome-wide expression profiling techniques provide new tools to reverse-engineer network structure and to identify and track mediators associated with a disease.

In view of the fact of completion of the human genome sequence, research in human genetics has been progressing at a rapid pace. With major achievements including realization of the haplotype map project facilitating the analysis of human genetic variability, the recent flurry of genome-wide associated studies providing a host of potential genetic determinants for major common diseases and the arrival of the first personalized human genome sequences. The power of genetics and genomics to explore the human disease scenery does not need to be demonstrated any more. Beyond genetic determinants, diseases are characterized by a disturbed physiology, and methods providing a wider and deeper window into physiological states will be influential to get hold of an integrated view of human disease. By their proximity to physiological output, metabolite measurements provide such a window, and advances in the associated techniques have led to the development of the field of metabonomics (measuring and mathematically modeling changes in the levels of products of metabolism found in biological fluids and tissues), pioneered by Jeremy Nicholson. The study reveals the deep sway exerted by gut bacterial flora on the metabolic equilibrium of the host and, as a consequence, on its health status. This study demonstrates that the genotype–phenotype relationship is far from being the entire story when dealing with disease, and it emphasizes the vital significance of putting together all aspects of physiology, including contributions from the totality of microbes and environment, thus adopting an even wider scope than the genome-wide model.

Great anticipation generated by the application of high-throughput technologies to human samples is that huge information gathered can lead to more powerful models able to predict susceptibility to disease, response to treatment and even more challenging, help in the prognosis of disease outcome. It is the latter question of prognosis that is addressed in the study by MacBeath and co-workers Knickerbocker et al, 2007, this book is designed to introduce biologists, clinicians and computational researchers to fundamental data analysis principles, techniques and tools for supporting the discovery of biomarkers and the implementation of diagnostic, prognostic systems. It focuses on how fundamental statistical and data mining approaches can support biomarker discovery and evaluation, emphasizing applications based on different types of “omic” data. The work also discusses design factors, requirements and techniques for disease screening, diagnostic and prognostic applications. It imparts knowledge needed to assess the requirements, computational approaches and outputs in disease biomarker research. There are also commentaries from guest experts containing detailed discussions of methodologies and applications based on specific types of “omic” data, as well as their integration. It also covers the main range of data sources currently used for biomarker discovery. It deals with the main range of data sources currently used for biomarker discovery. It emphasizes on concepts, design principles and methodologies that can be extended or tailored to more specific applications. It also offers principles and methods for assessing the bioinformatic-biostatistic limitations, strengths and challenges in biomarker discovery studies. The study discusses systems biology approaches and applications. The work includes expert chapter commentaries to further discuss relevance of techniques, summarize biological/clinical implications and provide alternative interpretations allowing integration of clinical parameters with protein microarray measurements of blood samples permitting improved prediction of early mortality of patients initiating a kidney dialysis treatment. Wider application of these technologies is likely to be instrumental in opening the door to the era of personalized medicine with tailored strategies encircling all aspects of clinical practice, including prevention, diagnosis, treatment and prognosis.

Interpreting the Systems Biology framework to the human ‘system’ is a formidable challenge because of the intimidating intricacy of human physiology and also because the human condition involve serious consideration of ethical, legal, safety, individual and epidemiological issues. Revolutionary technologies, fresh insights, immense digitalization of information will entitle clear thinking and innovation in the formulation of governance policies. These excerpts of recent concrete contribution to the field stimulates reflections and debates, extending beyond the Systems Biology community, enabling to realize full potential and promises of Systems Medicine in harmony with societal standards.


Third Strategy: Use of Novel Centrality Concepts

In addition to the use of individual classical centrality measures and their combinations to identify essential/lethal nodes in biological networks, new indices were designed using other features associated with nodes in biological networks. For instance, Yu et al. in 2004 introduced the notion of marginal essentiality which states that the essentiality of a gene is directly associated to its connectivity and the number of functions of that gene (Yu et al., 2004). Estrada and Rodriguez-Velazquez, in 2005 proposed a new index, subgraph centrality (SC) which characterizes the contribution of each node in all subgraphs of a network. The authors claimed that SC index is better in discriminating the nodes of a network than alternate classical measures such as degree, closeness, betweenness, and eigenvector centralities and is more highly correlated with the lethality of individual proteins removed from the proteome (Estrada and Rodriguez-Velazquez, 2005). Tew et al. defined a functional centrality as the topological centrality within a subnetwork of proteins with similar functions, called neighborhood functional centrality (NFC). NFC predicted the lethal proteins in four S. cerevisiae PPI datasets and was able to detect low connectivity lethal proteins that were previously undetected by conventional methods (Tew et al., 2007). Then, Koschutzki and Schreiber demonstrated that motif-based centralities yield better results in gene regulatory networks (Koschützki and Schreiber, 2008). Efforts were made to better predict and improve the existing methods for new insights of centrality usage in biology. For example, Hart et al. used an unsupervised probabilistic scoring scheme on large-scale yeast mass-spectrometry data, emphasizing that essentiality is the product of protein complexes rather than individual proteins (Hart et al., 2007). Piraveenan et al. used topological connectivity, as well as the percolation states of individual nodes in network percolation scenarios (such as infection transmission in a social network of individuals) to quantify relative impact of nodes (Piraveenan et al., 2013). Simko and Csermely applied game centrality to design more competent interventions in cellular networks (Simko and Csermely, 2013), and Szalay and Csermely developed perturbation centrality to provide a large variety of novel options to assess signaling, drug action, environmental, and social interventions (Szalay and Csermely, 2013). Wuchty recently determined minimum dominating sets (MDSet) as optimized subsets of proteins that play a role in the control of the underlying networks by enabling remaining proteins to be reached in one step. MDSet are enriched with essential, cancer-related, and virus-targeted genes. The author also compared the MDSet proteins with hub proteins and showed a higher impact of MDSet proteins on network resilience (Wuchty, 2014).


Biological significance of network parameters - Biology

Analysis of the structure of biological networks often uses statistical tests to establish the over-representation of motifs, which are thought to be important building blocks of such networks, related to their biological functions. However, there is disagreement as to the statistical significance of these motifs, and there are potential problems with standard methods for estimating this significance. Exponential random graph models (ERGMs) are a class of statistical model that can overcome some of the shortcomings of commonly used methods for testing the statistical significance of motifs. ERGMs were first introduced into the bioinformatics literature over ten years ago but have had limited application to biological networks, possibly due to the practical difficulty of estimating model parameters. Advances in estimation algorithms now afford analysis of much larger networks in practical time. We illustrate the application of ERGM to both an undirected protein-protein interaction (PPI) network and directed gene regulatory networks. ERGM models indicate over-representation of triangles in the PPI network, and confirm results from previous research as to over-representation of transitive triangles (feed-forward loop) in an E. coli and a yeast regulatory network. We also confirm, using ERGMs, previous research showing that under-representation of the cyclic triangle (feedback loop) can be explained as a consequence of other topological features.


Correlation-Based Network Generation, Visualization, and Analysis as a Powerful Tool in Biological Studies: A Case Study in Cancer Cell Metabolism

In the last decade vast data sets are being generated in biological and medical studies. The challenge lies in their summary, complexity reduction, and interpretation. Correlation-based networks and graph-theory based properties of this type of networks can be successfully used during this process. However, the procedure has its pitfalls and requires specific knowledge that often lays beyond classical biology and includes many computational tools and software. Here we introduce one of a series of methods for correlation-based network generation and analysis using freely available software. The pipeline allows the user to control each step of the network generation and provides flexibility in selection of correlation methods and thresholds. The pipeline was implemented on published metabolomics data of a population of human breast carcinoma cell lines MDA-MB-231 under two conditions: normal and hypoxia. The analysis revealed significant differences between the metabolic networks in response to the tested conditions. The network under hypoxia had 1.7 times more significant correlations between metabolites, compared to normal conditions. Unique metabolic interactions were identified which could lead to the identification of improved markers or aid in elucidating the mechanism of regulation between distantly related metabolites induced by the cancer growth.

1. Giriş

Advanced technology methods for high-throughput biological studies, such as metabolomics and transcriptomics developed during the last decades, are successfully applied in biomedical research [1], plant studies [2], and microbiology [3]. The wide use of these technologies led to the accumulation of data on biological processes at their multiple levels (metabolic, genetic, enzymatic, physiological, phenotypical, etc.) and called for the development of tools to ease the visualization, analysis, and interpretation of an often complex and multidimensional matrix. Furthermore, the readily available “omics” technologies in biological laboratories prompted biologists to enter a field often needing extensive computational knowhow and led to the increased interest in biological interaction networks [4]. Thus, in the recent decades networks describing cellular processes were generated for human [5], yeast [6], and plants [7].

Networks can be presented as graphs, that is, a set of vertices (V) connected by edges (E), and consequently can be analyzed using graph theory, an approach that has been increasingly implemented in biological studies during the last decade. It is commonly accepted that graph theory as a scientific discipline was first used by the Swiss mathematician Leonhard Euler in 1735-1736, tackling the Königsberg bridge problem. Later, in the 19th and 20th centuries, graph theory was formulated and eventually introduced for applied fields, such as physics, computer science, and biology [8]. Today, graph theory consists of many tens of basic definitions and properties [9]. The understanding of the biological networks lies in the nature of the vertices and edges between them that is, the vertices may represent one of the components of the three major molecular levels: genes, proteins, or metabolites, while the edges between them represent gene coexpression, protein-protein interactions, or biochemical conversions of metabolites, respectively [10]. However, molecular networks are not delimited to illustrate single-level component interactions. They can also show cross-level interactions. Alternatively, and perhaps a little counterintuitive, a network may incorporate vertices representing a set of metabolic reactions, where the connection between a pair of vertices is established if the reactions share one or multiple metabolites used or produced by these reactions [11, 12]. In other networks, vertices represent a community of molecular components, especially used with very vast data sets (>1000 of components) such as in weighted gene coexpression network analysis (WGCNA). Here, a single vertex delineates a module of genes and edges between vertices represent the correlation between them. This allows reducing the complexity of the network and simultaneously retains most of the information used for the interpretation of the gene coexpression results [13]. In simple words, vertices and edges represent the information as defined by the creator/user of the network.

In the last decade, correlation-based network analysis (CNA) has become a popular data-mining tool for visualizing and analyzing biological relationships within large data sets [13, 14]. In this type of networks, vertices and edges represent molecular elements (e.g., metabolites or genes) and their correlation coefficient (strength and sign), respectively [10, 15, 16]. Edges inferred by correlation analyses reflect a coordinated behavior between vertices across the data set (treatments, genotypes, conditions, and time). The type of correlation has to be selected based on the parametrical distribution of the data. In large population studies, data has to be tested for normality using existing tests, for example, the Shapiro-Wilk test. The Pearson correlation should be applied to normally distributed data, while Spearman’s rank correlation should be used for data violating the assumption of normal distribution. CNA was successfully applied to various biological systems it revealed, for example, metabolic markers related to plant growth and biomass in Arabidopsis thaliana recombinant inbred lines (RIL) and introgression lines (IL) [17, 18], the role of gene Col5a2 in myocardial infarction [19], effect of hypoxia on tumor cell biochemistry [20], and recently, identification of genetically based mechanism of the regulation of amino acid metabolism [2].

Graph theory defines a number of network properties that allow successful analysis and interpretation of correlation networks (CN). These properties are a set of measures that describe the graph topology from different vantage points. CNs are undirected graphs, reflecting the coordinated behavior of two or more adjacent vertices (connected vertices) and the biological components they represent and not the effect of one vertex/component onto another, that is, a directed network. Properties that may have biological significance have been reviewed by Toubiana et al. [10] they include (a) vertex degree: the number of edges incident on a given vertex [21], (b) centrality score: reflecting the number of shortest paths between a vertex and any other vertex in the network, (c) network diameter: the maximal shortest path between any two vertices in the graph, (d) network density: the ratio of existing edges to the number of all possible edges of a network, (e) vertex betweenness centrality: the relative number of the shortest paths between any two vertices that pass via a specific vertex, and (f) modules: subgraphs, within a global network characterized by higher connectivity (biologically interpreted as possible tighter coordination) between their components compared to other regions of the network. The analysis of these modules within the obtained network helped in the prediction of diseases [22, 23]. In this contribution we aim at providing an easy-to-implement pipeline for the generation of CNs for biologists without extensive computational skills. To do so, we are demonstrating the potential use of CNs in cancer studies.

Nowadays, there exist a number of software tools that allow researchers to generate networks, visualize them, and analyze their structure, via the calculation of a number of network properties, based on their own experimental data. Commonly known tools are Cytoscape [24], Gephi [25], and iGraph [26]. Each software has its benefits and disadvantages. For example, while iGraph requires programming skills and knowledge of the R programming language syntax, graphical-user-interface (GUI) based programs, such as Gephi and Cytoscape, do not, simplifying the interaction with the user. On the other hand, while script-based programs allow for the extension of existing functions and integration of compatible libraries, increasing the number of potential properties to be calculated, GUI programs are bound to the functionalities of the version of the software the researcher is using. However, Cytoscape and Gephi both offer a greater and easier-to-use set of visualization tools for networks, whereas the visualization functionalities of iGraph are rather limited and difficult to handle. Cytoscape allows for the integration of externally developed plugins, exerting functionality as desired by its developer. However, this option requires knowledge of the Java programming language and an understanding of how to interface it with the Cytoscape software.

The current proposed stepwise pipeline allows the user to control each step of the network creation, as it provides flexibility in selection of correlation methods and thresholds and describes easy-to-handle options to analyze the network topology. The pipeline works irrespective of the nature of the data set and can be implemented by a combined use of the freely distributed Apache OpenOffice software (http://www.openoffice.org/), built-in packages within the R-environment [27], and Cytoscape [24].

2. Method

The construction of correlation-based networks starts form the calculation of the pairwise correlation coefficients between any two pairs of vectors of a given data set. One of the easiest ways to complete this calculation in big sets of data is to exploit the freely available R-software. There are several packages developed for correlation analysis under the R-environment. It is very important for the output matrix to select the proper type of correlation coefficient (Pearson, Spearman, Kendal, etc., represented as the letter “r”) and its corresponding thresholds (rsəh). We recommend using the “psych” package under the R-environment [27, 28]. This package allows calculation of two diagonal matrices: (1) a symmetric diagonal r-matrix and (2) a symmetric diagonal p-matrix, where the lower triangle stores the

-dəyərlər and the upper triangle the multiple hypotheses corrected -dəyərlər, corrected either by the Bonferroni correction or by applying a false discovery rate (FDR) correction. The obtained matrix with both r- and raw/adjusted -dəyərlər can be then transformed to the table view and exported to any spreadsheet software for a supervised selection of significant correlation coefficients. The thresholds of significance should be selected in respect to the nature and size of the data and considering the general suggestions as described in the introduction and elsewhere [29]. The selected significant correlation values can be easily converted to a table, listing in three columns the vertices that are adjacent to each other. This table is subsequently used as a template to illustrate the network using Cytoscape. We have chosen Cytoscape out of the list of network software as it was specifically developed for biological data, because of its intuitively understandable interface, wide range of visualization options, and available additional plugins for calculations of the main network properties. The method’s workflow is presented in Figure 1.

2.1. Method Pipeline
2.1.1. Download R-Environment and Required R-Packages

To start the workflow, first download and install the latest version of R-environment from the following website: https://www.r-project.org/. For the processes described here two R-packages will be used: “psych” [28] and “reshape2” [30]. Both packages are freely available for downloading via the R-environment window. As mentioned above, the R-environment is a freely available powerful statistical software often used to analyze biological data. Its benefits stem from the integration of various built-in functions and libraries/packages, supplemented by its ability to complement these by numerous externally developed packages and the freedom to combine them as necessary. Often, different packages offer different functions tackling the same task. For example, to compute correlation coefficients, one may use the core built-in function “cor” or the “rcorr” function of the Hmisc-package [31]. For the current work we have chosen specifically the “psych” package to perform correlation analysis as it conveniently computes the

coefficients and its corresponding values and also performs post hoc tests to correct for multiple hypothesis testing (MHT). The package “reshape2” allows converting a matrix into a table and was chosen for this work for its easy implementation.

2.1.2. Adjusting the Allocated Memory

Before beginning with the actual analysis, we recommend checking for the size of virtual memory available for R and Cytoscape, considering the potential large size of a data set. To do so for R under Windows OS type memory.limit() and if the result is smaller than the potential amount of your data set, increase the memory by typing memory.limit(size = 4096). This step allocates 4096 MB, equivalent to 4 GB (maximal number for 32 GB systems) of virtual memory, to the R-software. Unix-based OS’s do not offer this function, as their virtual memory management is dynamic, adjusting itself to new and existing processes.

Similarly to the R-software the user may increase the memory allocated to Cytoscape, if, for instance, the size of a network is too large. Cytoscape is a Java-based software, so the first step here will be to access the Configure Java option via the Programs list. Next, select the Java tab in the displayed window, click on Baxın button, and type -Xms4096m içinə Runtime parameters line to allocated 4 GB of memory to the Cytoscape software. The amount of allocated memory is editable.

2.1.3. Producing the Matrices (the R Code Necessary to Complete the Steps Described below Can Be Found in Supplementary Figure 1)

After the size of virtual memory is set, the user can start the pipeline according to the protocol presented in Supplementary Figure 1 available online at http://dx.doi.org/10.1155/2016/8313272. The described protocol represents a set of consequent commands (with an exception to the parallel computation of the r--dəyər matrices using the “psych” package), where the execution of one step is dependent on the former.

The output of the executed protocol will provide two separate files that can be opened in spreadsheet software. One of the files, “r_table.csv,” will represent a table view of the correlation matrix, and the second file, “səh_table,” will represent the same table where r-values will be replaced by the correspondent dəyərlər. Probably the single disadvantage of this method is the time of calculation that strongly depends on number of the variables for the analysis and can be problematic for large (more than 500 variables) data sets. Nevertheless, the vast majority of metabolomics data sets does not exceed this amount of variables and usually is much smaller. Thus, the reader should not run into problems when executing the above code.

The obtained files “r_table.csv” and “səh_table.csv” can be opened in any spreadsheet software (in our case OpenOffice). The next step is to remove the first column in each file and copy the rest to a new multisheet file on separate sheets for the r-values and the -values, müvafiq olaraq. This step will provide two tables with two identical columns with the names of the variables, for example, metabolites/genes, and different third column with r- və -values, müvafiq olaraq. At this stage the correlation threshold has to be selected.

2.1.4. Selection of Significant Interactions and Arrangement of the Data to the Network Format Spreadsheet Software

Correlation coefficients, r, are the determining elements in CN construction the threshold of acceptable -value range and the threshold of its statistical significance will greatly affect the output of the network and its interpretation. The significance of a correlation is a two-factor concept. The first factor, the correlation coefficient (r), is expressed as a value ranging from −1 to 1, where positive and negative values represent a relation, alike or inverse, between the changes in the measure of the two variables. The magnitude of the coefficient reveals the strength of this relationship. However, the reliability of the model also depends on a second factor: the probability (səh) of the detected r-values, reflecting a true relation. This value ranges from 0 to 1 and depends to a great extent on the sample size [32] but also on the experimental setup and the biological system of study. The selection of the threshold for both values depends largely on the researcher. It is trivial that

(perfect positive correlation) or

(perfect negative correlation) represent strong coordinated behaviors, while

shows the absence of a relation between the variables. But what can be said about intermediate r’s? The “rule of thumb” suggests that there is no absolute r-threshold and different scientific disciplines apply different r-dəyər thresholds. For example, in biology, thresholds from as low as |±0.3| have been proposed to be relevant, for example, for metabolic data in tomato introgression lines seeds and fruits [33], while in physics, an r-dəyər lower than |±0.9| is often considered insignificant. Adətən r ≥ |±0.5| is considered as “strong” by most of researches in biological systems [34]. The -dəyər that reflects significance of a correlation is usually accepted at three levels: 0.05, 0.01, and 0.001 [32]. However, since correlation analysis is applied on large data sets, -dəyərlər should usually be corrected by one of the post hoc tests for MHT, such as the Bonferroni correction or the false discovery rate (FDR) method, with the aim of avoiding false positives.

After both parameters of significance are decided, create a new sheet and copy the first two columns from any of the sheets (they are identical). In the first cell of the third column input the following formula:


Nəticə

We have reviewed several classes of approaches for network embedding, including spectral-based methods, random-walk based approaches and deep neural network techniques. We have demonstrated the utility of these approaches in a broad set of applications, ranging from network alignment to community detection, protein function prediction, and network denoising. We have also discussed recent embedding approaches in pharmacogenomics. We were interested in seeing whether the field of network embedding indeed enhances the types of questions that can be answered using graph-based approaches and our conclusion is that there is value in both graph-based and graph-embedding-based methods in a variety of applications.

In our experiments we found that depending on the task at hand and metric used, sometimes graph-based methods outperformed network embedding tools. This was the case with, for example, IsoRank beating MuNK with respect to edge conservation in network alignment, whereas MuNK outperformed IsoRank according to the area under the precision recall curve with respect to node mapping. In community detection experiments, our results were reversed, where the embedding method outperformed the graph-based method 3 out of 4 times. In fact, there is no single metric according to which one type of method is consistently better than the other. Even in compute time, where embedding methods outperform graph-based methods most of the time, on the function prediction task graph-based GeneMANIA outperforms the embedding method Mashup. This implies that the choice of graph-based versus embedding-based method will depend on many factors, not just the task at hand, but also the aspect or evaluation measure of highest importance to the user.

The network embedding principles create new opportunities to model large network datasets and move beyond standard prediction tasks of node classification, link prediction, and node clustering. For example, given a partially observed network of interactions between drugs, diseases, and proteins, one might be interested in posing a logical query: “What proteins are likely to be associated with diseases that have both symptoms X and Y?” Such a query requires reasoning about all possible proteins that might be associated with at least two diseases, which, in turn, clinically manifest through symptoms X and Y. Valid answers to such queries correspond to subgraphs. Since edges in the network might be missing because of biotechnological limits and natural variation, naively answering the queries requires enumeration over all possible combinations of diseases (Hamilton et al., 2018) developed a network embedding approach that answers such complex logical queries and achieves a time complexity linear in the size of a query, compared to the exponential complexity required by a naive enumeration-based approach. The approach embeds nodes into a low-dimensional space and represents logical operators as learned geometric operations in this embedding space. They demonstrated the utility of the approach in a study involving a biomedical network of drugs, diseases, proteins, side effects, and protein functions with millions of edges.

We summarize network embedding tools that are used in the biomedical field in Table 2. We expect the importance of these tools to grow with the magnitude and complexity of biomedical data that are being generated.

Cədvəl 2. A summary of network embedding tools and their applications.


Videoya baxın: Nefes - Gelen Deyilsen Yeni Klip 2021 (Oktyabr 2022).