Məlumat

Minimum uzanan ağac bizə təkamül əcdadları haqqında faydalı bir şey söyləyirmi?

Minimum uzanan ağac bizə təkamül əcdadları haqqında faydalı bir şey söyləyirmi?


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Sual marağın olmaması səbəbindən bioinformatika stackexchange-dən köçdü.

Mən bioinformatikada yeniyəm və bioinformatika kitabını oxuyuram və görünür, filogenetik ağacın hesablanması olduqca mürəkkəb prosesdir.

Maraqlıdır ki, oxşarlıq matrisindən minimum yayılma ağacı (MST) yaratmaq faktiki filogenetik ağaca layiqli yaxınlaşma təmin edəcəkmi, yəni orqanizmlər toplusunun təkamül əcdadı haqqında bəzi məlumatlar verəcəkmi? Düşündüyüm odur ki, qədim atalardan uzaqlaşan heyvanlar həmişə son zamanlarda fərqlənən heyvanlardan daha uzaqda olacaqlar, buna görə də MST heç olmasa hansı heyvanların genetik əlaqəli və genetik cəhətdən uzaq olduğunu göstərəcək.

Mən başa düşürəm ki, bu, filogenetik ağacla tamamilə eyni şey deyil, amma görünür, mənə filogenetik ağac tərəfindən verilən eyni məlumatlardan bəzilərini verir, yəni hansı heyvanların genetik olaraq yaxından əlaqəli, hansıların isə uzaq qohumlarıdır.

İstinad üçün, mən normallaşdırılmış sıxılma məsafəsi (NCD) metrikası əsasında oxşarlığı ölçürəm. Metrik, Cilibrasi və Vitanyi tərəfindən "Sıkıştırma ilə Kümelenme" də təyin edilmişdir.

İstinad edilən kağızdan verilənlər toplusundan istifadə edən nümunə MST. Bəzi hissələr, primatların yığılması kimi biologiya haqqında ilkin biliklərimdən məntiqlidir. Digər hissələr mənim üçün yenidir və əlaqələrin metrikanın təsadüfi bir xüsusiyyəti, MST və ya gerçək olub olmadığını dəqiq bilmirəm. Məsələn, MST-ə görə inəklər atlarla deyil, balinalarla daha çox əlaqəlidir, pişiklər və itlər suitilərdən və ya əksinə təkamülə uğramış kimi görünür, donuzlar isə yarasalardan dovşanlara və balinalara qədər müxtəlif heyvanlarla əlaqəlidir.

Diqqət yetirin ki, 'randgen' qovşaqları, sağlamlıq yoxlaması olaraq verilənlər bazasına əlavə etdiyim təsadüfi şəkildə yaradılan DNT ardıcıllığıdır. Gözlənildiyi kimi, həqiqi heyvan DNT sekanslarının populyasiyasına qarışmaq əvəzinə özləri budaqda olurlar. Kümelenmelerinin səbəbi, siqnalın gücləndirilməsi üçün hər bir DNT ardıcıllığını 40 dəfə təkrar etməyim və təkrarlanan qısa təsadüfi ardıcıllıqların sıxışa bilməsidir. Təsadüfi DNT ardıcıllıqları yəqin ki, çoxluq təşkil edir, çünki onlar təsadüfi alt ardıcıllıqları bölüşməyə meyllidirlər, məməlilərin DNT ardıcıllığı isə nizamlıdır və daha az təsadüfi alt ardıcıllığa malikdir.

Budur ağacı çoxaltmaq üçün repo. https://github.com/yters/ncd


Qrafikiniz ağaclar və filogeniya üçün vacib olan ağacın qovşaqlarını, budaqlanma nöqtələrini buraxır.

Məlumat faylını oxuduğunuz zaman mötərizələri saymalısınız ((( ))) çünki onlar ağacın qovşaqlarının, ümumi əcdadlarının harada olduğunu bildirir.

Bənzərlik üçün mürəkkəb məlumatların çıxarılmasından əvvəl sadə filogeniya ağacları yaratmalısınız. Adlar latıncadır? genetik məsafə nömrələri varmı? Hansı format və məlumatlardan istifadə edirsiniz? Ümumi heyvan adlarını verdiniz. "pələng"i axtara bilmək üçün ümumi və latın adlarından ibarət verilənlər bazasından istifadə etməli ola bilərsiniz... bu verilənlər bazası "panthera tigris tigris"i qaytaracaq... Və sonra heyvanları axtarmaq üçün ağac budaqlarında yuxarı və aşağı sürünməyə başlaya bilərsiniz. Dəclə ilə əlaqəli, mötərizələri sayaraq və bu ada yaxın növləri işarələyərək.

Ağacın 5000 heyvana partlamasının qarşısını almaq üçün 1/axtarış dərinliyi təyin edə bilərsiniz. Dərinlik 5, Beş, beş mötərizədən irəli getməyəcək: (((((panthera_tigris_tigris)(lion)(cheetah))))) 2/növün təsadüfi bir hissəsini təmsil edir (1/100 5000 ağacdan 50 heyvan verir) ) 3/ data mining əsasında müəyyən heyvanları seçmək üçün statistik ölçülərdən istifadə edin.

Balinalardan meymunlara səyahət etmək istəyirsinizsə, məməlilər ailəsinin əksəriyyətinə sahib olacaqsınız və düyünləri və mötərizələri onlarla saya biləcəksiniz.

5000 növün təhlilinin bir dəfə oxunması 1 saat çəkə bilən böyük hesablama yükü olması deyil, 40 dəfə də olsun!

Bənzərliyi, mötərizələrin sayını / genetik məsafə nömrələrini ölçmək üçün hansı statistikadan istifadə edirsinizsə, bir zamanlar ağacları budaqlar, qovşaqlar və yarpaqlar kimi təmsil etməli idiniz, çünki ağac məlumatları bunu nəzərdə tutur.

Düyünlərdən və təsadüfi heyvan seçimindən istifadə edərək bir ağac çəkməyi məsləhət görürəm, məsələn, heyvanın son ağacda çəkilməsi ehtimalı 1%. Ağacınızın budaqları olduqda və OK rəsm çəkərkən, kompleks MST / MCD seçimi üçün 1% seçim xəttini dəyişdirin.


Videoya baxın: İnanç Dünyası (Yanvar 2023).