Məlumat

Ardıcıl təkamül simulyasiya aləti

Ardıcıl təkamül simulyasiya aləti


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Mən xüsusi mutasiya modeli və doğum-ölüm modeli nəzərə alınmaqla ardıcıl təkamülü simulyasiya etmək üçün alət axtarıram. Mən INDELible, Seq-Gen və PhyloSim kimi alətlər və paketlərdən xəbərdaram, lakin onlar filogenetik ağaclar boyunca təkamülü simulyasiya edir. İstədiyim bir ardıcıllıq vermək və alətdən bu ardıcıllığın təkamülünü N nəsillər vasitəsilə simulyasiya etməsini xahiş etməkdir. Çıxış nəsil ardıcıllığının böyük bir dəstəsi olmalıdır. Mən özüm belə bir alət yazmağı düşünürdüm, amma artıq kodlanmış bir şey axtarmaq həmişə yaxşıdır.


Bir dəstə populyasiya genetikasının irəli və geriyə (birləşmə) simulyasiya platformaları mövcuddur. Budur, tam olmayan bir siyahı. Onların hamısı fərqlidir və ehtiyaclarınıza daha uyğun olanı görmək üçün onların təlimatından keçməli olacaqsınız.

Proqram təminatının siyahısı

Budur belə platformaların uzun siyahısı. Siyahı, şübhəsiz ki, bu gün bir az köhnəlmiş ola bilər və bu proqramların bir çoxu yavaş və ya müəllifləri tərəfindən tərk edilmiş ola bilər.

Təcrübəmə görə ən ümumi proqramlar

Bəziləri digərlərindən daha çox tanınır. Şəxsən mən artıq nəşrdə aşağıdakı platformaların istifadəsini gördüm: SimCoal, Nemo, Slim və SFS_Code.

SimBit

Təbii ki, mən öz simulyasiya platformamı göstərməliyəm SimBit. Təcrübəmə görə, SimBit adətən Nemodan daha sürətlidir. O, çox kiçik simulyasiyalar üçün SFS_Code və SLim-dən daha yavaşdır, lakin genetik müxtəlifliyin azaldılması ilə simulyasiyalara ehtiyacınız olduqda SFS_Code və SLim-dən çox daha sürətli olur.

Bu proqramlar haqqında ən vacib məqam

Proqramları əsas götürərək müqayisə etməlisiniz

  • Mövcudluq məsləhət vermək və yeni xüsusiyyətlər gətirmək üçün müəllif
    • Müəlliflərə hörmətlə şəxsi təcrübəmdən burada danışmayacağam!
  • Sürət / RAM istifadəsi
    • Düşünürəm ki, SimBit adətən Nemodan daha sürətlidir (və daha az RAM istifadə edir). SFS_code və SLim aşağı genetik müxtəlifliyə malik simulyasiyalar üçün çox sürətli, lakin yüksək genetik müxtəlifliyə malik simulyasiyalar üçün çox yavaşdır.
  • Çeviklik
    • Nemo, SLim və SimBit çox çevikdir (lakin onlar fərqli şeylər edirlər), lakin SFS_code əslində belə deyil.
  • İstifadəçi interfeysi
    • Nemo səhv hesabatını olduqca zəif hesab edirəm. SimBit səhv hesabatını bəyənirəm. SLim interfeysi çox gözəldir (eidos istifadə edərək) və hətta GUI ilə gəlir (mən özüm GUI-dən heç vaxt istifadə etməmişəm).
  • Bugs pulsuz
    • Bir neçə nəfər SFS_code-da (şəxsi ünsiyyət və təcrübə) mühüm səhvlər tapdı.

Nemo, SLim, SFS_code və SimBit arasında bir az daha ətraflı müqayisə

Mən şəxsən keçmişdə NEMO, SFS_CODE və SLim istifadə etmişəm (indi yalnız SimBit-dən istifadə edirəm). Ona görə də aşağıda yalnız bu 4-ü haqqında danışa bilərəm.

Dörd modelin hamısı müəllifləri tərəfindən yaxşıca yenilənir və saxlanılır və əlbəttə ki, hər kəsin mənbə koduna çıxışı var.

SFS_code və SLim kiçik simulyasiyalar üçün çox sürətlidir. SFS_code və SLim məsələsi ondan ibarətdir ki, RAM istifadəsi və işləmə müddəti genetik müxtəlifliyin eksponensial funksiyasıdır. Bu o deməkdir ki, bəzi simulyasiyalar tez bir zamanda tamamilə idarəolunmaz hala gələ bilər. Ancaq bir az genetik müxtəliflik gözləyirsinizsə, bu əla vasitədir.

SimBit adətən Nemodan daha sürətlidir, ən azı böyük genomlar üçün. Bu fərq böyük genomlar üçün xüsusilə aydın olur. Biri "Nəticələrimi almaq üçün bir neçə əlavə gün gözləmək yaxşıdır" deyə düşünə bilər, lakin iki proqram arasındakı sürət fərqi nəticələrinizi əldə etmək üçün bir həftə və ya 20 il gözləməyinizlə də fərq ola bilər. işləmə vaxtının və RAM istifadəsinin əhəmiyyətini laqeyd yanaşmayın ehtiyaclarınızı hesablamadan.

Nemo, həyat dövrü hadisələrinin sırasına gəldikdə çox çevikdir (məsələn, seçimdən əvvəl və ya sonra miqrasiyadır) və ən yeni versiya yaş strukturlu əhalinin simulyasiyasına imkan verir. SimBit çox çevikdir, çox sürətlidir və çox növləri və onların ekoloji qarşılıqlı təsirlərini simulyasiya etməyə imkan verir. SFS_code daha az çevikdir.


NEMO ilə bağlı yeganə narahatlığım odur ki, hər bir fərd çoxaldıqdan sonra ölür və eyni anda 256-dan çox allel ola bilməz.

SFS_code allellərin sayını 4-ə qədər məhdudlaşdırır. Nemo allellərin sayını 256-ya qədər məhdudlaşdırır (lakin siz həmçinin fenotipdən istifadə edə və hər lokusda float nömrəsinə sahib ola bilərsiniz). SimBit ya bi-allelik lokuslardan, mutasiyaların sayının hesablandığı blokdan (maksimum: 256 mutasiya; bu, demək olar ki, 256 alleldən fərqlidir) və ya fenotip üçün hər bir lokusda davamlı float sayından istifadə edir. Həqiqətən daha çox allele ehtiyacınız varmı? Niyə çoxlu allelli ardıcıllığı təmsil etmək üçün bir neçə lokusdan istifadə edə bilmirsiniz? Əsl biologiyanın ən kiçik lokusunda yalnız 4 allel ola bilər! SimBit bit başına sistemdən istifadə edir. Əgər ehtiyacınız varsa, deyin ki, 50.000 allel, onda siz sadəcə 16 bit (2 bayt) ardıcıllığı istəməlisiniz və siz $2^{16} = 65,536$ allel əldə edə bilərsiniz.

Bir blokda daha çox allele ehtiyacınız varsa (bu, mənim üçün bir az təəccüblüdür), yəqin ki, sadəcə müəllifdən soruşa bilərsiniz və onu bu xüsusiyyəti əlavə etməyin maraqlı olduğuna inandırsanız, sizə kömək etməyi qəbul edə bilər (o, ola bilər). daha çox dəstəyə ehtiyacınız varsa, müəlliflik mübadiləsində kömək etməyə daha çox hazır olun).

Bu kömək ümid edirik. Uğurlar!


Messer Lab - SLiM

SLiM, populyasiyanın genetik simulyasiyaları üçün güclü mühərriki özbaşına mürəkkəb təkamül ssenarilərini modelləşdirmək qabiliyyəti ilə birləşdirən təkamül simulyasiya çərçivəsidir. Simulyasiyalar simulyasiya edilmiş təkamül ssenarilərinin praktiki olaraq bütün aspektləri üzərində interaktiv nəzarət etməyə imkan verən inteqrasiya olunmuş Eidos skript dili vasitəsilə konfiqurasiya edilir. Əsas fərdi əsaslı simulyasiya mühərriki böyük populyasiyalarda bütün xromosomların modelləşdirilməsini təmin etmək üçün yüksək dərəcədə optimallaşdırılmışdır. Biz həmçinin asan simulyasiyanın qurulması, interaktiv icra müddətinə nəzarət və simulyasiya çıxışının dinamik vizuallaşdırılması üçün macOS və Linux-da qrafik istifadəçi interfeysi təqdim edirik.

4-5 günlük SLiM Seminarı artıq onlayndır. SLiM Seminarı həmçinin vaxtaşırı şəxsən təklif olunur. Əlavə məlumat üçün aşağıdakı SLiM Seminarları alt bölməsinə baxın.

Yükləmələr (versiya 3.6)

macOS Quraşdırıcısı incə komanda xətti alətini, SLiMgui qrafik inkişaf mühitini və hər iki təlimatı quraşdıracaq. (Əgər siz macOS-dasınızsa və bunun əvəzinə köhnə Kakao əsaslı SLiMguiLegacy tətbiqini işə salmaq istəyirsinizsə, nədənsə onu http://www.benhaller.com/slim/SLiMguiLegacy.app.zip saytından yükləyə və ya burada qura bilərsiniz. Xcode artıq quraşdırıcıya daxil deyil.) Digər Un*x platformalarında siz SLiM təlimatındakı təlimatlara əməl etməlisiniz (2-ci fəsil) platformanız üçün quraşdırıcı ola bilər və ya mənbələrdən qurmağınız lazım ola bilər. SLiM Windows-da da işləyə bilər, WSL altında ətraflı məlumat üçün təlimata baxın.

SLiM Təlimatına ümumi vəziyyətlər üçün reseptlər toplusu daxildir. Siz həmin reseptlərin zip arxivini yükləyə bilərsiniz, əgər istəyirsinizsə, onlar SLiMgui’s Fayl menyusu vasitəsilə də birbaşa mövcuddur. Eidos Təlimatı skript vasitəsilə SLiM-i idarə etmək üçün istifadə edilən Eidos dilinin təfərrüatlarını əhatə edir. Həm SLiM, həm də Eidos üçün istinad vərəqləri tam sənədlərdən minimal istifadə etməklə onlardan istifadəni asanlaşdırır.

Qeyd edək ki, burada təqdim olunan mənbə kodu arxivində nə macOS-a xüsusi kod, nə də Linux istifadəçiləri üçün nəzərdə tutulmuş SLiM üçün Xcode layihəsi yoxdur (macOS istifadəçilərinə mənbələrdən qurmaq əvəzinə macOS Quraşdırıcısından istifadə etmək tövsiyə olunur). MacOS faylları daxil olmaqla tam mənbələri GitHub-da tapa bilərsiniz, siz 3.6 kimi etiketli buraxılış və ya hazırkı inkişaf rəhbəri üçün mənbələri əldə edə bilərsiniz.

Biz həmçinin bəzi ümumi tapşırıqları yerinə yetirmək üçün istifadəçi tərəfindən müəyyən edilmiş Eidos funksiyaları kimi SLiM istifadəçiləri üçün əlavə faydalı məlumatlarla SLiM-Extras adlı GitHub repozitoriyasını təqdim edirik və biz başqalarının həmin anbara töhfələrini alqışlayırıq.

SLiMgui

SLiMgui qrafik modelləşdirmə mühiti (WSL altında macOS, Linux və Windows ilə uyğundur) ilə siz simulyasiyanızı işləyərkən vizuallaşdıra və onun parametrlərini real vaxt rejimində yoxlaya bilərsiniz ki, bu da simulyasiyanın daha asan inkişafına imkan verir.

Sürücü allelində məkan dəyişikliyi ilə altı subpopulyasiyalı ada modelində CRISPR/Cas9 “gene sürücüsünün” populyasiya dinamikasını simulyasiya edən SLiMgui-nin ekran görüntüsü. Eidos skript sahəsi solda, çıxış sağdadır. Əhali strukturunun vizual təsviri alt pəncərədə göstərilir və altı alt populyasiyada olan bütün fərdlər yuxarıda görünə bilər (nisbi uyğunluğuna görə rənglənir). Mərkəzi qara zolaq populyasiyada mövcud olan genetik dəyişkənliyin xülasəsini göstərir, nadir neytral mutasiyalar qısa sarı çubuqlar kimi görünür və hündür qırmızı çubuq fiksasiyaya yaxınlaşan sürücü allelini təmsil edir.

Poçt siyahıları

İki poçt siyahısı var. Zəhmət olmasa, aşağıdakı linklərdən istifadə edərək hər birinə və ya hər ikisinə abunə olun:

    : Yalnız elanlar üçün aşağı həcmli poçt siyahısı. İstifadəçilər bu siyahıya yaza bilməzlər. : SLiM istifadəçiləri arasında suallar, şərhlər, səhv hesabatları və müzakirələr üçün daha yüksək həcmli poçt siyahısı.

SLIM seminarları

Biz pulsuz və ictimaiyyətə açıq olan 5 günlük SLiM seminarları keçiririk (qeydiyyatla). Lakin hazırda bu seminarlar koronavirus pandemiyası səbəbindən dayandırılıb.

Seminar materialları artıq onlayndır, bunu özləri etmək istəyənlər üçün ətraflı məlumat üçün onlayn seminar yükləmə səhifəsinə daxil olun.


İlk SLiM seminarı: Umeå, İsveç, avqust 2019.

Xəbərlər

3 mart 2021: SLiM 3.6 buraxıldı! Bu, çoxlu yeni funksiyalar və bir neçə mühüm səhv düzəlişləri ilə əsas buraxılışdır. Bu təkmilləşdirmədir güclü bütün istifadəçilər üçün tövsiyə olunan 3.5 versiyası yanlış model nəticələrinə səbəb ola biləcək iki səhv səbəbindən istifadə edilməməlidir. Əlavə məlumat üçün elan və buraxılış qeydləri üçün slim-announce baxın.

8 dekabr 2020: SLiM 3.5 buraxıldı! Bu, çoxlu yeni funksiyalar və bir neçə mühüm səhv düzəlişləri ilə əsas buraxılışdır. Bu təkmilləşdirmə bütün istifadəçilər üçün tövsiyə olunur, lakin o, bir neçə yolla geriyə uyğunluğu/reproduktivliyi pozur, buraxılış qeydlərini diqqətlə oxuyun. Əlavə məlumat üçün elan və buraxılış qeydləri üçün slim-announce baxın.

12 may 2020: SLiM 3.4 buraxıldı! Bu, QtSLiM-in ilk buraxılışı, eləcə də bir neçə yeni funksiya və bir neçə səhv üçün düzəlişlər daxil olmaqla böyük buraxılışdır. Bu təkmilləşdirmə bütün istifadəçilər üçün tövsiyə olunur. Əlavə məlumat üçün həmişəki kimi slim-announce-ə baxın.

30 yanvar 2020: SLiM 3.3.2 buraxıldı! Bu, bir neçə kiçik təkmilləşdirmə və bir neçə səhv üçün düzəlişlər olan kiçik buraxılışdır (bir əhəmiyyətli). Bu təkmilləşdirmə bütün istifadəçilər üçün tövsiyə olunur. Əlavə məlumat üçün həmişəki kimi slim-announce-ə baxın.

13-17 yanvar 2020: Evimizdə, Kornelldə SLiM emalatxanası keçirdik! Biz indiyə qədər bir neçə iş görmüşük (İsveç, Böyük Britaniya, Nyu-York şəhəri), lakin bu, Korneldə ilkimiz idi. 28 iştirakçımız var idi və 3CPG tərəfindən maliyyələşdirilən nahar da daxil olmaqla, çox yaxşı keçdi. Bizim daha çox seminar planımız var (əvvəlki alt bölməyə baxın) əgər siz müəssisənizdə seminar keçirmək istəyirsinizsə, bizimlə əlaqə saxlayın!

28 sentyabr 2019: SLiM 3.3.1 buraxıldı! Bu versiya kiçik buraxılışdır, əsasən səhv düzəlişləri (bir neçə nadir, lakin pis səhvlər daxil olmaqla!). Bu təkmilləşdirmə bütün istifadəçilər üçün tövsiyə olunur. Əlavə məlumat üçün yeni təlimatlara və slim-announce elanında buraxılış qeydlərinə baxın.

15 may 2019: SLiM 3.3 buraxıldı! Bu versiya böyük yeni funksiyalar (nukleotid əsaslı modellər, mutasiya() geri çağırışlar və s.) və bəzi böyük, mühüm səhv düzəlişləri ilə əsas buraxılışdır. Bu təkmilləşdirmə bütün istifadəçilər üçün tövsiyə olunur. Əlavə məlumat üçün yeni təlimatlara və slim-announce elanında buraxılış qeydlərinə baxın.

29 yanvar 2019: SLiM 3.2.1 buraxıldı! Bu versiya kiçik bir buraxılışdır, bəzi kiçik xüsusiyyət əlavələri və bir neçə yeni resept, həmçinin səhv düzəlişləri təmin edir. Əlavə məlumat üçün yeni təlimatlara və slim-announce elanında buraxılış qeydlərinə baxın.

18 yanvar 2019: Son günlərdə SLiM ilə bağlı üç (!) yeni məqaləmiz nəşr olundu. (1) “SLiM 3: Wright-Fisher modelindən kənar irəli genetik simulyasiyalar”, qeyri-Wright-Fisher modelləri üçün dəstəyi və SLiM 3-də (DOI) davamlı məkanı təsvir edir. (2) “Yeni başlayanlar üçün SLiM 3-də təkamül modelləşdirmə”, yeni istifadəçiləri SLiM 3-də çoxlu əsas anlayışların (DOI) izahatları ilə sadə bir model hazırlayaraq gəzdirir. (3) “SLiM-də ağac ardıcıllığının qeydi bütün genomların irəli-zaman simulyasiyası üçün yeni üfüqlər açır”” modelin icrasını sürətləndirmək, yandırmaq üçün praktik tətbiqinin bir neçə nümunəsi ilə SLiM 3-də yeni ağac ardıcıllığının qeyd etmə xüsusiyyətini ətraflı müzakirə edir. simulyasiya və məlumat təhlilində (DOI). Ümid edirik ki, bu sənədlər üzərində işlədiyimiz bütün yeni materialları sürətləndirmək üçün faydalı olacaq!

6 noyabr 2018-ci il: SLiM 3.2 buraxıldı! Bu versiya böyük WF olmayan modellərin işini xeyli yaxşılaşdırır və çoxsaylı təkmilləşdirmələr və səhv düzəlişləri təmin edir. Ətraflı məlumat üçün yeni təlimatlara və slim-announce haqqında elanda buraxılış qeydlərinə baxın.

3 sentyabr 2018: SLiM 3.1 buraxıldı! Bu versiya məkanla qarşılıqlı əlaqənin performansını əhəmiyyətli dərəcədə yaxşılaşdırır və digər təkmilləşdirmələr və səhv düzəlişləri ilə yanaşı, ağac ardıcıllığının qeydinə təkmilləşdirmələr təqdim edir. Ətraflı məlumat üçün yeni təlimatlara və slim-announce haqqında elanda buraxılış qeydlərinə baxın.

2018-ci il 1 iyul: SLiM 3.0 buraxıldı! Bu, SLiM 2.0-ın 2016-cı ilin əvvəlində buraxılmasından bəri ilk tam versiya təkmilləşdirməmizdir. O, qeyri-Wright-Fisher (WF olmayan) modellər və ağac ardıcıllığı qeydi üçün dəstək əlavə edir, SLiM’s gücünü və çevikliyini əhəmiyyətli dərəcədə artıran iki xüsusiyyət. Bir çox kiçik təkmilləşdirmələr də edildi. Ətraflı məlumat üçün yeni təlimatlara və slim-announce haqqında elanda buraxılış qeydlərinə baxın.

16 dekabr 2017: SLiM 2.6 buraxıldı! Bu, böyük bir buraxılışdır, çoxlu yeni məhsullar yeni təlimatlara baxın və slim-announce haqqında elanda buraxılış qeydləri.

27 oktyabr 2017: SLiM 2.5 buraxıldı! Bu, çoxlu yeni məhsullar və bəzi mühüm səhv düzəlişləri ilə yeni təlimatlara və slim-announce-da elanda buraxılış qeydlərinə baxın.

12 sentyabr 2017: SLiM 2.4.2 buraxıldı (bir çox/əksər modeldən səhv çıxışa səbəb ola biləcək səhv üçün düzəliş).

26 iyul 2017: SLiM 2.4.1 buraxıldı (çox alt populyasiya simulyasiyalarında qəzalara və ya yanlış nəticələrə səbəb ola biləcək səhv üçün düzəliş).

14 iyul 2017: SLiM 2.4 buraxıldı! Bu, bir çox model növləri üçün sürət təkmilləşdirmələri, SLiMgui-də iş vaxtı profilinin yaradılması üçün yeni dəstək və bir çox digər xüsusiyyətləri olan əsas buraxılışdır. Cari sənədlər üçün yeni SLiM və Eidos təlimatlarına baxın. Slim-anons haqqında elanda buraxılış qeydləri də var.

18 aprel 2017: SLiM 2.3 buraxıldı! Bu, xüsusilə davamlı məkan və məkan qarşılıqlı əlaqə üçün dəstək əlavə edən əsas buraxılışdır. Cari sənədlər üçün yeni SLiM və Eidos təlimatlarına baxın. Slim-anons haqqında elanda buraxılış qeydləri də var.

22 fevral 2017: SLiM 2.2.1 buraxıldı (yeni reseptlər, kiçik funksiyalar və düzəlişlər).

8 dekabr 2016: SLiM 2.2 buraxıldı! Bu, böyük performans təkmilləşdirmələri və bir neçə yeni funksiya ilə əsas buraxılışdır. Cari sənədlər üçün yeni SLiM və Eidos təlimatlarına baxın. Slim-anons haqqında elanda buraxılış qeydləri də var.

8 noyabr 2016: SLiM 2.1.1 buraxıldı (əsasən səhv düzəlişləri, bəziləri ciddi).

4 oktyabr 2016: SLiM 2 ilə bağlı nəşrimiz Molekulyar Biologiya və Təkamül: DOI-də dərc edilmişdir.

19 sentyabr 2016: SLiM 2.1 buraxıldı! Bu, çoxlu funksiyalar əlavə edilmiş əsas buraxılışdır. Cari sənədlər üçün yeni SLiM və Eidos təlimatlarına baxın. Slim-anons haqqında elanda buraxılış qeydləri də var.

26 may 2016: SLiM 2.0.4 buraxıldı (kiçik səhv düzəlişləri).

12 may 2016-cı il: SLiM 2.0.3 buraxıldı (kodun tamamlanması üçün təkmilləşdirmələr).

6 may 2016: SLiM 2.0.2 buraxıldı (kiçik xüsusiyyət əlavələri).

27 aprel 2016: SLiM 2.0.1 buraxıldı (kiçik səhvlərin düzəldilməsi və kiçik funksiyaların əlavə edilməsi).

1 aprel 2016: SLiM 2.0 buraxıldı! Biz SLiM paketinin yeni əsas buraxılışı olan SLiM 2.0-ı elan etməkdən məmnunuq. SLiM 2.0 Eidos ilə skript qabiliyyəti və SLiMgui tətbiqindən istifadə edərək interaktiv simulyasiya işlənməsi əlavə edir. SLiM 2.0 buraxılışı haqqında daha çox təfərrüatlı bir blog yazısı hazırladıq.

Lisenziya və sitat

SLiM pulsuz açıq mənbə proqramdır, GNU General Public License versiyası 3 altında lisenziyalıdır. Əgər tədqiqatınızda SLiM-dən istifadə edirsinizsə, bizə istinad edin.

üçün SLiM 3, istinad:

Haller, B.C. və Messer, P.W. (2019). SLiM 3: Genetik simulyasiyaları Wright-Fisher modelindən kənara köçürün. Molekulyar Biologiya və Təkamül 36(3), 632–637. DOI

Istifadə edən modellər üçün ağac ardıcıllığının qeydi, istinad:

Haller, B.C., Galloway, J., Kelleher, J., Messer, P.W., & Ralph, P.L. (2019). SLiM-də ağac ardıcıllığının qeydi bütün genomların irəli-zaman simulyasiyası üçün yeni üfüqlər açır. Molekulyar Ekologiya Resursları 19(2), 552–566. DOI

Lazım gələrsə, bizim “protokol” sənədimizə istinad edin başlanğıc SLiM istifadəçiləri:

Haller, B.C. və Messer, P.W. (2019). Yeni başlayanlar üçün SLiM 3-də təkamül modelləşdirmə. Molekulyar Biologiya və Təkamül 36(5), 1101–1109. DOI

İstifadə edən köhnə modellər üçün SLiM 2, istinad:

Haller, B.C. və Messer, P.W. (2017). SLiM 2: Çevik, interaktiv irəli genetik simulyasiyalar. Molekulyar Biologiya və Təkamül 34(1), 230–240. DOI

Və üçün SLIM 1, istinad:

Messer, P.W. (2013). SLiM: Seçim və əlaqə ilə təkamülü simulyasiya etmək. Genetika 194(4), 1037–1039. DOI

SLiM simvolu

SLiM simvolu üçün qrafik faylları buradan yükləmək olar. Bu şəkillər bunlardır: Copyright (c) 2016–2019 Philipp Messer, Bütün hüquqlar qorunur. Bununla, SLiM icmasına hörmətlə yanaşan və dəstəklənən SLiM ilə əlaqəli məqsədlər üçün təkrar istifadə üçün icazə verilir. Bununla bağlı hər hansı bir şübhəniz varsa, icazə üçün bizimlə əlaqə saxlayın. Müxtəlif ölçülər və formatlar təqdim olunur.

Köhnə versiyalar

Yeni layihələr üçün cari versiyadan istifadə etmək tövsiyə olunur. SLiM 2.0-dan sonrakı köhnə versiyaları buraxılış etiketlərindən istifadə edərək GitHub-da tapmaq olar. Bu köhnə versiyalar artıq dəstəklənmir.

Nəşrlər

Başqalarının SLiM-dən necə istifadə etdiyini görmək faydalı ola bilər, bəzən hətta kağızda istifadə olunan faktiki SLiM modelini yükləyə bilərsiniz. Bununla belə, SLiM-ə istinad edən bütün nəşrlərin siyahısını yeniləmək çox vaxt apardı, buna görə də biz indi Google Scholar axtarışları, SLiM sənədlərimizə istinad edən sənədlər üçün bağlantılar təqdim edirik.


PopG quraşdırılması

Burada müxtəlif brauzerlərdən və əməliyyat sistemlərində PopG-ni saxlamaq, qablaşdırmadan çıxarmaq və quraşdırmaq üçün təlimatlar verilmişdir.Biz Windows, Mac OS X və Linux əməliyyat sistemlərində Chrome, Firefox, Safari və Internet Explorer brauzerlərini əhatə edirik.

  1. Linkə klikləyin.
  2. Brauzer pəncərəsinin aşağı sol hissəsindəki aşağı istiqamətli cizgi ox orada PopG.zip adlı nişanı göstərərək hərəkət edəcək.
  3. PopG.zip indi Yükləmələr qovluğunda tapılacaq.
  4. PopG.zip faylına klikləyin (və ya bu işləmirsə, iki dəfə klikləyin). Zip arxivi Yükləmələr qovluğuna çıxarılacaq. Qovluq PopG Yükləmələr qovluğunda yaradılacaq.
  5. Həmin qovluğu olmasını istədiyiniz yerə köçürün.
  1. Linkə klikləyin.
  2. Dialoq qutusu açılır və sizə icazə verməyi təklif edir Fayl saxlamaq. Bunu seçin.
  3. Zip arxivi PopG.zip Yükləmələr qovluğunda olacaq.
  4. Bunun üzərinə iki dəfə klikləyin. Arxiv və qovluq çıxarılacaq PopG Yükləmələr qovluğunda yaradılmışdır.
  5. Həmin qovluğu olmasını istədiyiniz yerə köçürün.
  1. Linkə klikləyin.
  2. Dialoq qutusu açılır və sizə icazə verməyi təklif edir Fayl saxlamaq. Bunu seçin.
  3. Zip faylı PopG.zip yükləmələr qovluğuna endiriləcək və avtomatik olaraq çıxarılacaq. Qovluq PopG Yükləmələr qovluğunda yaradılacaq.
  4. Onu istədiyiniz yerə köçürün.
  1. Linkə klikləyin.
  2. Zip faylı endirmələr qovluğuna endiriləcək və avtomatik olaraq çıxarılacaq. Qovluq PopG Yükləmələr qovluğunda yaradılacaq.
  3. Onu istədiyiniz yerə köçürün.

MAC PROBLEMİ: Mac OS X sistemlərində Zip arxivini çıxarmağa cəhd etdiyiniz zaman və ya Java icra olunanını işə salmağa cəhd etdiyiniz zaman sistem bunun naməlum tərtibatçıdan olmasından şikayət edə bilər. Sadəcə olaraq mən Apple Developer ID ilə faylı imzalamamışam. Siz ikona üzərində nəzarət düyməsini sıxaraq və təklif olunan standart parametrlərdən istifadə edərək faylı açmaq seçimini seçməklə əməliyyatın işləməsini təmin edə bilməlisiniz. Bundan uğurla keçdikdən sonra, bu sizi bir daha narahat etməyəcək.

Java arxivi

Java arxiv faylı PopG.jar qovluğunda olacaq PopG PopG-ni endirdikdən və quraşdırdıqdan sonra. Sisteminizdə Java quraşdırılıbsa, qovluğu tapmaqla Java proqramını işə sala bilməlisiniz PopG və faylın simvoluna klikləyin və ya iki dəfə vurun PopG.jar

Sənədlər səhifəsi

PopG qovluğuna indi oxuduğunuz hazırkı sənədlərin veb səhifəsi də daxildir. Bunu burada oxuya bilərsiniz və ya onun bir nüsxəsini maşınınızda saxlamaq üçün brauzerinizin Fayl menyusunda Saxla Saxla menyusundan istifadə edə bilərsiniz. Bu səhifənin son versiyasını bu linkdən istifadə edərək İnternetdə oxumaq olar.

PopG-nin köhnə versiyaları

Windows, Mac OS X və Linux sistemləri üçün tərtib edilmiş köhnə icra edilə bilən versiyalar, üstəlik bəzi daha köhnə əməliyyat sistemləri də var. Bunları PopG saytımızdakı köhnə qovluqdan əldə etmək olar. Əksər istifadəçilər bu köhnə icra sənədlərindən istifadə etməməlidir, ancaq bunu edirsinizsə, oxumaqla başlamalısınız OXUYUN həmin qovluqdakı fayl. Versiyalardan biri mövcud üç əsas əməliyyat sistemi, eləcə də C mənbə kodu üçün icra olunanları tərtib edən 3.4 versiyasıdır. Əgər sizdə Java yoxdursa və onu sisteminizdə quraşdıra bilmirsinizsə, bunlar faydalı ola bilər.

Android və iOS versiyaları haradadır?`

Planşetlər və hətta telefonlar üçün versiyaları əlçatan etmək istərdik. Təəssüf ki, qrafik funksiyalardan istifadə edə bilən Java versiyası Android əməliyyat sistemində və iOS əməliyyat sistemində mövcud deyil. Onların hər biri üçün proqramı ayrıca yenidən yazmalı olacağıq. Bu əməliyyat sistemlərindən hər hansı birində Java icraedici proqramlarımızı işə salmağın və onu işə salmağın bir yolunu bilirsinizsə, zəhmət olmasa bunu necə etdiyinizi bizə bildirin.

Kompüterinizdə Java olduğundan əmin olun

Əgər sizdə Java quraşdırılıbsa, PopG proqramını işə sala bilərsiniz. Ümumiyyətlə, Java artıq Mac OS X sistemlərində və Linux sistemlərində quraşdırılacaq. Əgər sizdə Java quraşdırılıb-quraşdırılmadığına əmin deyilsinizsə, yaza bilərsiniz java -versiya komanda pəncərəsində və Java mövcuddur, o, versiyanın nə olduğunu sizə xəbər verəcəkdir. Boş bir sətir geri alsanız, ya Java-nı yükləməlisiniz, ya da axtarış yolunuza onun olduğu yerə əlavə etməlisiniz. Windows sistemlərində və Java olmayan Mac OS X və ya Linux sistemlərində bu linkdən istifadə edərək heç bir ödəniş etmədən Java-nın ən son versiyasını quraşdıra bilərsiniz: java.com. Ən son Linux və Mac OS X sistemlərində adətən Java-nın kifayət qədər yeni versiyası artıq quraşdırılmışdır. Mac OS X sistemləri 10.4 (Leopard) və ondan əvvəlki versiyalarda PopG-ni işə salmaq üçün kifayət qədər yeni Java yoxdur. Windows sistemləri artıq quraşdırılmış Java ilə gəlmir, lakin o, yuxarıdakı veb saytından onlara quraşdırıla bilər.

Proqramın icrası

PopG Java proqramını işə salmaq üçün siz sadəcə olaraq PopG.jar faylının ikonasına klik etməlisiniz (və ya iki dəfə klikləyin) (həmçinin onu əmr pəncərəsindən hara getməklə işə sala bilərsiniz) PopG.jar saxlanılır və yazılır java -jar PopG.jar). Başlanğıc ekranı belə görünür:

PopG-ni idarə edən iki menyu var, Fayl və Çalıştır. Onlar əsas PopG pəncərəsinin yuxarı sol tərəfindədirlər.

Run menyusu

Run menyusu beş elementdən ibarətdir: Davam et/ , Davam et , Yeni Run , Yenidən başladın və Bütün Süjeti göstər .

İlk dəfə seçildikdə belə görünür:

New Run istisna olmaqla, hamısı boz rəngdədir. İlk qaçışınızı etdikdən sonra bütün seçimlər aktiv olacaq.

Yeni Run Əvvəlcə yalnız Yeni Run mövcuddur. Aşağıdakı dialoqu gətirir:

Bu, PopG işini idarə edən bütün parametrləri ehtiva edir. Nəzərə alın ki, iki eyni qaçış etmək istəmirsinizsə, adətən siz Random Number toxumunu daxil etmirsiniz. Redaktə etməyi bitirdikdən sonra işə başlamaq üçün OK qutusuna klikləyə bilərsiniz. Siz həmçinin işə başlamamaq üçün Ləğv et və bütün məlumat daxiletmə qutularını standart dəyərlərə sıfırlamaq üçün Defoltlara klikləyə bilərsiniz. Continue w/ Bu seçim əvvəllər New Run menyusuna daxil edilmiş eyni sayda nəsil üçün qaçışı davam etdirir. Davam et Bu qaçışı davam etdirir, lakin aşağıdakı dialoqu təqdim edir:

qaçışın növbəti davamında qaçış nəsillərinin sayını dəyişməyə imkan verir. Yenidən başla Bu, əvvəlki kimi eyni parametr dəyərləri ilə işə yenidən başlayır. Bəzi parametr dəyərlərini dəyişdirmək istəyirsinizsə, bunun əvəzinə New Run istifadə edin. Bütün Süjeti Göstər Bu, bütün nəsilləri eyni süjetdə təsvir edir. Qaçış zamanı süjetlər adətən yalnız son nəsillər qrupunu göstərəcək. Bu, indiyə qədər simulyasiya edilmiş bütün nəsilləri göstərir. Bu, simulyasiyanı bitirdiyiniz və bütün qaçışın nəticələrini çap etmək istədiyiniz zaman xüsusilə faydalıdır.

Təsadüfi ədəd generatoru

Proqram sistem saatınızdan avtomatik olaraq işə salınan təsadüfi ədəd generatorundan istifadə edir. Beləliklə, o sizə təsadüfi ədədlərin fərqli ardıcıllığını və beləliklə, proqramı hər dəfə işlətdiyiniz zaman fərqli bir nəticə verməlidir. Yeni işə salınma menyusunda, sistem saatından işə salınacaq, standart olaraq (Avtomatik yaratma) olaraq təyin edilmiş Təsadüfi nömrə toxumu üçün bir parametr var. PopG-də sazlama işləri aparmasanız və eyni təsadüfi nəticələrlə eyni qaçışı iki dəfə etmək istəməsəniz, yəqin ki, bunu dəyişdirmək üçün heç bir səbəbiniz olmayacaq. Eyni dəqiq qaçışı iki dəfə etmək istəyirsinizsə, (Avtomatik yaratma) sətirinin yerinə dəyər daxil edin və PopG təsadüfi ədəd generatorunu işə salmaq üçün bundan istifadə edəcək. Dəyişiklik etmədiyinizi fərz etsək calcPopG Java kodu daxilində gündəlik rejimdə işləsəniz, hər dəfə bu təsadüfi nömrə ilə başlayanda eyni nəticələr əldə edəcəksiniz.

Fayl menyusu

Buraya dörd menyu elementi daxildir. Bunlar Saxla , Çap , Haqqında və Çıxışdır .

İlk dəfə göstərildikdə belə görünür:

Saxla və Çap boz rəngdədir. İlk qaçışınızı etdikdən sonra onlar aktiv olacaqlar.

Saxla Bu standart saxlama faylı dialoqunu açır və qrafiki JPG və ya PNG faylı kimi saxlamağa imkan verir. Defolt ad, fayl formatına uyğun gələn uyğun genişlənmə ilə PopG-dir. Çap et Bu standart çap dialoqunu açır və sizə printeri seçib qrafiki çap etməyə imkan verir. Haqqında Proqramın müəllif hüququ bildirişini göstərir. Çıxın Bu öz-özünə izah olunur: proqram çıxır.

Özünüz tərtib edirsiniz

Təqdim olunan Java Jar paketi Java-nın əksər versiyalarında işləməlidir, çünki insanların çoxu proqramı özləri tərtib etməli olmayacaqlar. Beləliklə, yəqin ki, bu bölməni atlamalısınız. Ancaq PopG-nin funksionallığını dəyişdirmək istəyirsinizsə və ya təqdim edilmiş Jar faylını işlətməyən qeyri-adi Java mühitiniz varsa, sizə Java kompilyatoru lazımdır. Təkrar edirik: Əgər sadəcə proqramı işə salmaq lazımdırsa, paylamamızda olan Jar faylını işə salmalısınız. Heç bir şey tərtib etməyinizə ehtiyac yoxdur (baxmayaraq ki, Java quraşdırmalı ola bilərsiniz).

Proqramı tərtib etmək lazımdırsa, siz tapa bilərsiniz src yüklənmiş və açılmış qovluqdakı qovluq PopG saytımızdan əldə etdiyiniz. Faylı idxal edin PopGUserInterface.java -dan src sevimli Java redaktorunuza daxil edin (biz Tutulma). Siz onu birbaşa oradan icra edə və ya Java Jar-ı redaktordan ixrac edib icra edə bilərsiniz. PopGUserInterface.java heç bir xarici kitabxanaya istinad etmir, ehtiyac duyduğu hər şey daxilindədir JavaSE-1.6 sistem kitabxanası. Proqramımızı dəyişdirirsinizsə, bunu bitirdikdən sonra Java Jar-ı yaratmaqda heç bir probleminiz olmayacaq,

Edə bilmirsinizsə, bizə deyin, çünki bu, səhv olardı.

PopG ilə simulyasiya

Bu proqram iki allel, üç genotipin ixtiyari uyğunluğu, ixtiyari mutasiya dərəcəsi, təkrar populyasiyalar arasında ixtiyari miqrasiya sürəti və sonlu əhali ölçüsü ilə təsadüfi cütləşən populyasiyaların təkamülünü simulyasiya edir.

Proqramlar populyasiyanın ölçüsünü, üç genotipin uyğunluqlarını, hər iki istiqamətdə mutasiya sürətlərini (A-dan a-ya və a-dan A-ya) və ilkin gen tezliyini göstərərək sizinlə eyni vaxtda inkişaf edən populyasiyaları simulyasiya edir. Onlar həmçinin bütün populyasiyalar arasında miqrasiya nisbəti tələb edirlər ki, bu da onların gen tezliyini bir-birinə daha çox bənzədir. Çox vaxt (lakin həmişə deyil!) Siz bu miqrasiya nisbətini sıfıra təyin etmək istəyəcəksiniz. Əksər hallarda proqram özünü izah edir.

Əvvəlcə on əhali var. Siz eyni vaxtda inkişaf edən populyasiyaların sayını 0-dan 1000-ə qədər istənilən rəqəmə təyin edə bilərsiniz. Hər bir populyasiya üçün əhalinin sayı 1-dən 10000-ə qədər istənilən rəqəm ola bilər. Nəzərə alın ki, daha çox əhali, daha çox nəsillər və daha çox sayda populyasiyalar daha uzun qaçışlara səbəb ola bilər.

Proqramın işə salınmasına səbəb olan menyu seçimi etdikdə, pəncərədə populyasiyaların hər birində A allelinin gen tezliklərinin qrafiki çəkiləcək. İlkin gen tezliyi 0.2 və AA, Aa və aa uyğunluqları 1.08, 1.04 və 1-ə təyin edildikdə, bütün digər parametrlər standart dəyərlərində olanda qrafikin necə göründüyü budur. (Qeyd edək ki, bu qaçışı sınasanız, müxtəlif təsadüfi ədədlər olacaq, buna görə də nəticəniz bir qədər fərqli olacaq).

Nəzərə alın ki, pəncərənin ölçüsü dəyişdirilə bilər və qrafik buna uyğunlaşdırılmalıdır. Sonsuz populyasiyada (genetik sürüşmə olmayan) gen tezliklərinin nə olacağını göstərən mavi əyri də var. Əgər imitasiya edilən populyasiyaların sayı sıfıra təyin edilibsə, bu əyri yalnız görəcəksiniz. Qrafik Fayl menyusunun Çap seçimi ilə çap oluna və ya həmin menyuda Saxla seçimini istifadə edərək Postscript faylında saxlanıla bilər.

Qeyd edək ki, gen tezliyi əyrilərinin qrafiki qrafikin sağ tərəfinə çatdıqdan sonra proqram orada A alleli üçün müəyyən edilmiş populyasiyaların sayını (tezliyi 1,0 ilə başa çatdı) və bu alleli itirənlərin sayını çap edir. .

Təkliflər

  • Seçim olmamaq üçün heç bir mutasiya, miqrasiya və bütün fitnes 1.0 olmayan halları sınayın. 1000 böyüklükdə bir populyasiyada genetik sürüşmə 100 nəsildə 100 nəsildə genetik sürüşmə ilə eyni dəyişiklikləri həyata keçirirmi? Çox sayda populyasiyanı idarə etməklə, bir allelin genetik sürüşmə ilə sabitləşmə ehtimalının populyasiyalardakı ilkin tezliyinə bərabər olub olmadığını yoxlaya bilərsinizmi?
  • Təbii seçmənin üstünlük verdiyi A alleli (AA genotipinin uyğunluğu ən yüksək və aa genotipinin uyğunluğu ən aşağı olan) heç bir mutasiya və ya miqrasiya olmayan bir işi sınayın. Kiçik A tezliyi ilə başlayın. Həmişə düzəldilirmi? Əgər allelin tək nüsxəsi ilə başlayırsa, onda A-nın sabit olma ehtimalı heterozigotda ona üstünlük verən seçim əmsalı ilə necə müqayisə olunur? Aa genotip aa genotipinin uyğunluğu ilə müqayisədə daha yüksəkdir)? Bu fiksasiya ehtimalı eyni ilkin tezlikdə, lakin heç bir seçim olmadan əldə edəcəyiniz ehtimaldan böyükdürmü?
  • Həddindən artıq dominantlıq etməyə çalışın (Aa ən yüksək fitnessə malikdir). Gen tezliyi tarazlığa yaxınlaşırmı? Niyə bu tarazlıq tezliyindən fərqlənir? Gen tezliyinin uzun müddət fiksasiyadan və ya itkidən uzaq durmasına səbəb olmaq üçün seçim əmsalları nə qədər böyük olmalıdır?
  • Dominantlığı sınayın (Aa ən aşağı fitnessə malikdir). Bəzi populyasiyaların fiksasiyaya, digərlərinin isə itirilməsinə səbəb olacaq başlanğıc gen tezliyi varmı? Az miqdarda miqrasiya əlavə etsəniz, uzun müddətdə nə olacaq? Bunun əvəzinə hər iki istiqamətdə az miqdarda mutasiya əlavə etsəniz nə olacaq?
  • Miqrasiya ilə, lakin seçim və ya mutasiya olmadan, gen tezliyi əyrilərinin bir-birinə olduqca oxşar olması üçün nə qədər miqrasiya lazımdır? Onların hamısının uzun müddətdə eyni gen tezliyində bitməsi üçün nə qədər ehtiyac var? Bu miqrasiya nisbəti əhalinin sayına necə təsir edir?
  • Mutasiya ilə, lakin miqrasiya və ya seçim olmadan, gen tezliklərinin mutasiya tarazlıq gen tezliyinə yaxınlaşması üçün nə qədər mutasiya lazımdır? Bu dəyər əhalinin sayı ilə necə əlaqəlidir?
  • Əgər allel qarşı seçilərsə, populyasiyada onu aşağı tezlikdə saxlayacaq mutasiya nisbətlərini təyin edə bilərsinizmi?

Kreditlər

İlk Java versiyası olan PopG-nin 4.0 versiyası Ben Zawadzki tərəfindən yazılmışdır. Onun olduqca təsirli proqramlaşdırması laboratoriyamızın Java sehrbazı Cim McGill-in mentorluğundan və məsləhətindən yaxşı istifadə etdi.

PopG-nin orijinal versiyası 1970-ci illərdə FORTRAN-da Joe Felsenstein tərəfindən yazılmışdır. İnteraktiv versiya daha sonra Hisashi Horino, Sean Lamont, Bill Alford, Mark Wells, Mike Palczewski, Doug Buxton, Elizabeth Walkup, Ben Zawadzki və Cim McGill tərəfindən çox iş ilə C dilində yazılmışdır. Hisashi və Sean C versiyasını və IBM PC üçün ekran qrafikasını və Postscript çap sisteminin birinci hissəsini yazdılar. Bill Postscript çapını və X Windows qrafikasını xeyli təkmilləşdirdi və genişləndirdi. Mark Wells orijinal Macintosh versiyasını etdi. Mike Palczewski Windows, Macintosh və X Windows qrafik istifadəçi interfeysini əhəmiyyətli dərəcədə təkmilləşdirdi və Doug Buxton proqramı 3.0 versiyasına dəyişdirdi və müxtəlif əməliyyat sistemləri üçün icraedici faylları hazırladı. Elizabeth Walkup X windows ilə qarşılıqlı əlaqəni təkmilləşdirdi və 3.3 versiyasını hazırladı. 4.0 versiyasından sonra kiçik sənəd dəyişiklikləri mənim tərəfimdən edildi.


BEAST: Ağaclardan nümunə götürməklə Bayes təkamül analizi

Fon: Molekulyar ardıcıllığın dəyişməsinin təkamül təhlili statistik bir müəssisədir. Bu, filogenetik nəticə, çoxsaylı ardıcıl düzülmə və molekulyar populyasiya genetikası üçün ehtimal modellərinin artan istifadəsində əks olunur. Burada biz BEAST təqdim edirik: təkamül ağacı ilə əlaqəli molekulyar ardıcıllığın Bayes analizi üçün sürətli, çevik proqram arxitekturası. Ardıcıllığın təkamülünün çoxlu sayda məşhur stoxastik modelləri təqdim olunur və həm növ daxilində, həm də növlər arası ardıcıllıq məlumatları üçün uyğun olan ağac əsaslı modellər həyata keçirilir.

Nəticələr: BEAST 1.4.6 versiyası 81000 sətir Java mənbə kodundan, 779 sinifdən və 81 paketdən ibarətdir. O, DNT və zülal ardıcıllığının təkamülü, yüksək parametrik birləşmə analizi, rahat saat filogenetikası, müasir olmayan ardıcıllıq məlumatları, statistik uyğunlaşma və əvvəlki paylanmalar üçün geniş seçimlər üçün modellər təqdim edir. BEAST mənbə kodu obyekt yönümlüdür, dizaynda moduldur və GNU LGPL lisenziyası altında http://beast-mcmc.googlecode.com/ saytında sərbəst mövcuddur.

Nəticə: BEAST molekulyar ardıcıllığın dəyişməsi üçün güclü və çevik təkamül analizi paketidir. O, həmçinin təkamül analizinin yeni modellərinin və statistik metodlarının gələcək inkişafı üçün resurs təqdim edir.


Nəticələr və Müzakirə

Test 1: Tək başına əlavələr və ya tək silinmələr

İlk testimiz yalnız daxiletmə və yalnız silmə simulyasiyalarını işə salmaq idi. İndel uzunluqları 1, 2, 4 və 8 qalıq və ya əsaslarla sabitlənmişdir. Biz hər bir metodun performansını 1) daxil edilmiş saytların sayı düzləşdirmə uzunluğundan minus 1000-ə bərabər olan əlavələr üçün həqiqi çoxsaylı düzülmənin uzunluğu və 2) silinmə üçün çıxış ardıcıllığında qalan simvolların sayı ilə ölçdük.

Şəkil 5 və əlavə rəqəm S3, Əlavə material onlayn, test nəticələrini göstərir. Bələdçi ağacındakı daxili qovşaqların sayı SIMPROT, iSGv1.0, ROSE və MySSP performansına mənfi təsir göstərdi (yalnız əlavələr zamanı). İndellərin davamlı modelləşdirilməsinin yan təsiri olaraq silinmələrin həddən artıq qiymətləndirilməsi (şək. 5)AB ) və əlavələrin düzgün qiymətləndirilməməsi (şək. 5CD ) daha az sayda daxili qovşaq ilə aydın şəkildə göstərilir. Bu üsullar hadisə baş verdikdə ardıcıllığın uzunluğunu tənzimləmədən gözlənilən indel hadisələrinin sayını hesablayır. DAWG, iSGv2.0 və EvolveAGEne3 indel rəqəmlərində heç bir təsir göstərmir və ya çox cüzi təsir göstərir. DAWG və iSGv2.0 üçün bunun səbəbi ardıcıl uzunluqların filial boyunca dinamik şəkildə tənzimlənməsidir. EvolveAGEne3-dən təsirlənməmiş nəticələr çox güman ki, bu metodun budaq uzunluğuna budaq boyunca baş verən mutasiya-hadisə testlərinin sayı kimi baxması ilə bağlıdır. Məqsədimiz üçün filial uzunluğunu 8000 mutasiya-hadisə testinə təyin etdik (hər sayt səkkiz əvəzləmə ilə 1000 simvol ardıcıllığı). EvolveAGEne3 eyni zamanda üst-üstə düşən əlavələri və silinmələri qadağan edir, daha böyük silmələrlə silinmə nisbətlərini effektiv şəkildə azaldır. Bu effekti əlavə S3 (I), Əlavə Materialda görmək olar, burada daha böyük silinmə ölçüləri olan simulyasiyalardan sonra daha çox simvol qalır. EvolveAGEne3-də təyin edilmiş daimi daxiletmə və silmə ehtimalları və EvolveAGEne3-də kodon məhdudiyyətlərini aradan qaldırdığımız üçün düzülmələrin uzunluqları çox vaxt digər simulyasiya metodlarından daha qısa olur.

Yeddi metod arasında indel simulyasiya performansının (Test 1) müqayisəsi. Düzgün simulyasiyaların üfüqi xətti olan bir süjet yaratması gözlənilir. İstifadə olunan indel ölçüləri (A) ölçü-1 silinmələr, (B) ölçüsü-4 silinmə, (C) ölçü-1 daxiletmələr və (D) ölçü-4 daxiletmə. The y-oxlar yarpaq ardıcıllığında qalan simvolların sayını göstərir (A,B) və həqiqi hizalanma uzunluğu (C, D). 100 simulyasiyadan əldə edilən orta qiymətlər qrafikə salınır. Aşağıdakı cədvəl hər bir məlumat nöqtəsi üçün standart kənarlaşmaları ümumiləşdirir. Əlavə rəqəm S4, Əlavə material onlayn, bütün test nəticələrini rəngli göstərir.

Bu nəticələr göstərir ki, iSGv2.0 və DAWG müvafiq şəkildə yerinə yetirilərək daxili qovşaqların sayından asılı olmayaraq ardıcıl nəticələr verir. EvolveAGEne3 də öz indel modelinə uyğun davrandı. iSGv1.0, ROSE, SIMPROT və MySSP hamısı daxili qovşaqların sayından təsirlənir və müvafiq olaraq silinmə və ya əlavələr üçün süni yüksək və ya aşağı qiymətlər yaradır.

Test 2: Həm Daxiletmələr, həm də Müxtəlif Silinmələr Pins və Pdel

İndel modellərinin təsirini daha ətraflı araşdırmaq üçün biz Zipfian paylanmasından (Chang və Benner 2004) istifadə edərək beş üsulla həm əlavələri, həm də silmələri simulyasiya etdik: DAWG, ROSE, SIMPROT, iSGv1.0 və iSGv2.0. Üç ssenarini simulyasiya etdik: 1) Pins = 0,01 və Pdel = 0.03, 2) Pins = 0,02 və Pdel = 0,02 və 3) Pins = 0,03 və Pdel = 0,01, harada PinsPdel müvafiq olaraq hər bir əvəzetmə üçün əlavələrin və silinmələrin sayıdır. Zipfian paylanmasından istifadə etməyi seçdik, çünki bu, daxiletmə və silinmə hadisələri üçün empirik olaraq müəyyən edilmiş uzunluq paylanmasıdır. İstifadəçi tərəfindən verilən orta indel uzunluğuna əsasən normal şəkildə paylanan uzunluq paylanmasını həyata keçirən MySSP üçün biz 10 maksimum indeks ölçüsü ilə Zipfian paylanmasına əsaslanan gözlənilən 2.082 indel uzunluğundan istifadə etdik. EvolveAGEne3 xaric edildi. dəyişən çünki bu testdən PinsPdel EvolveAGEne3-də indel yaratma metodunu əsaslı şəkildə dəyişdirir. Bu testdə, hər bir metoda simulyasiya zamanı baş verən əlavələrin və silinmələrin sayını bildirən hadisə sayğacı əlavə edilmişdir. MySSP üçün mənbə kodunu əldə edə bilmədiyimiz üçün hadisələrin sayını aşağıdakı kimi hesabladıq: Həqiqi çoxlu düzülmədə kök ardıcıllığında hər bir boşluq nəsil ardıcıllıqlara əlavənin təsiridir və eynilə, hər bir boşluq uc ardıcıllığı əcdad ardıcıllığında silinmənin nəticəsidir. Daxil etmə və silmə hadisələrinin sayını əldə etmək üçün biz müvafiq olaraq kök və uc ardıcıllığında boşluqların ümumi sayını hesabladıq və bu rəqəmi orta indeks ölçüsünə böldük. Yaranan əlavələrin və silinmələrin sayını müqayisə edərək indel simulyasiyasının keyfiyyətini ölçdük. Dəyişmə əmsalını hesabladıq (σ 2 /μ), ölçüsüzdür və müxtəlif simulyasiya üsullarından nəticələri müqayisə edilə bilən edir. Əgər σ 2 /μ ≈ 0, bu o deməkdir ki, simulyasiya metodu bələdçi ağaclar arasında oxşar şəkildə davranır (müxtəlif sayda qovşaqların təsiri yoxdur). Daha böyük σ 2 /μ simulyasiya metodunun müxtəlif sayda qovşaqlara malik bələdçi ağaclar arasında fərqli şəkildə yerinə yetirildiyini göstərir.

Şəkil 6 və cədvəl 2 bu testin nəticələrini göstərir. Gözlənildiyi kimi, yaradılan əlavələrin və silinmələrin sayına daxiletmə və silinmə ehtimalları təsir edir. iSGv1.0 və ROSE üçün, nə vaxt PinsPdel, daxili qovşaqların sayı həm əlavələrin, həm də silinmələrin sayına təsir göstərir. SIMPROT, çoxsaylı vuruşların düzəldilməsi xüsusiyyətinin nəticəsi olaraq, daxiletmə sürəti silinmə sürətindən böyük olduqda, daxili qovşaq nömrələri ilə iSGv1.0 və ROSE ilə müqayisədə daha kəskin effektlər göstərir (Pins = 0,03 və Pdel = 0,01). Silinmə dərəcəsi daha böyük olduqda belə təsirlər göstərilmir (Pins = 0,01 və Pdel = 0,03). MySSP hər bir test üçün artan rəqəmləri göstərir, ən kəskin dəyişiklik nə zaman baş verir Pins = 0,03 və Pdel = 0,01. Bu davranışı Test 1-in nəticələrindən istifadə etməklə daha yaxşı başa düşmək olar, burada əlavələr halında daha çox daxili qovşaq əlavə olunduqca ardıcıllığın uzunluğu artır, lakin ardıcıllığın uzunluğu eyni şərtlər altında silinmələr üçün sabitdir.

Cədvəl 2

Metodlar arasında Dəyişən Daxiletmə və Silmə Tezlikləri ilə Daxili Node Nömrələrinin Təsiri

σ 2 /μ
MySSP SIMPROT DAWG iSGv1.0 iSGv2.0 GÜL
insdelinsdelinsdelinsdelinsdelinsdel
(A) Pins = 0.01, Pdel = 0.030.1450.4330.0030.0120.0150.0040.2160.7260.0210.0020.2260.734
(B) Pins = 0.02, Pdel = 0.020.5070.4170.3800.4350.0140.0020.0040.0010.0220.0070.0030.000
(C) Pins = 0.03, Pdel = 0.014.8711.6752.7360.7570.0060.0030.7340.2950.0050.0310.8160.265

Müxtəlif indel ehtimal nisbətləri ilə test 2 nəticəsi. Hər bir üsul üçün, müxtəlif sayda seqmentləri olan bələdçi ağaclardan istifadə edərək simulyasiya təcrübələri üçün yaradılan daxiletmələrin (qaranlıq çubuqlar) və silinmələrin (işıq çubuqları) ümumi sayı göstərilir (şək. 4-ə baxın). Qeyd edək ki, MySSP üçün biz nəticələri əldə etmək üçün Zipfian paylanmasının gözlənilən orta dəyərindən istifadə etdik. Bütün üsullar üçün 100 simulyasiyadan alınan orta qiymətlərdən istifadə olunur.

Cədvəl 2 variasiya dərəcəsini ümumiləşdirir (σ 2 /μ) Test 2 təcrübələri arasında daxiletmə və silinmə saylarında. iSGv1.0 və ROSE üçün qeyd edirik ki, daxiletmə və silinmə hadisələrinin sayındakı variasiya Şəkil 6-da göstərildiyi kimi dominant hadisə ehtimalına doğru daha yüksək tendensiyaya malikdir, halbuki MySSP bütün testlərdə yüksək dəyişkənlik nümayiş etdirir, baxmayaraq ki, bu, ən çox zaman tələffüz edilir. nisbi daxiletmə nisbəti yüksəkdir. SIMPROT həmçinin yüksək dəyişkənlik göstərir Pins = 0,03 və Pdel = 0,01 və ya Pins = Pdel, baxmayaraq ki, iSGv2.0 və DAWG ilə müqayisə oluna bilər Pins = 0,01 və Pdel = 0,03. Nə vaxt Pins = Pdel, iSGv1.0 və ROSE indel modellərinə daxili qovşaq nömrələri çox az təsir edir. Qeyd edək ki, nə vaxt Pins = Pdel, iSGv2.0 və DAWG bir qədər böyük göstərir σ 2 /μ iSGv1.0 və ROSE-dan fərqli dəyərlər. Bu, bu üsullarla həyata keçirilən indel hadisələri və ardıcıllıq uzunluğu qiymətləndirmələri ilə daha çox addımların nəticəsidir. Təsadüfi gediş kimi simulyasiya hər addımda ardıcıllığın uzunluğundakı fərqi artırır. DAWG və iSGv2.0 bütün digər simulyatorlar tərəfindən atılan ən çox səkkiz addımla müqayisədə daha çox sayda addım (müvafiq olaraq 600 və 1024) atır. Biz bu nəticəni iSGv2 tərəfindən atılan addımların sayını dəyişməklə təsdiq etdik (məlumatlar göstərilmir).

Protein Superfamily Simulyasiyası üçün Nümunə Tətbiq

Şəkil 7-də ROSE və iSGv2.0-dan əldə edilmiş “true alignment” çıxış nümunələri göstərilir (iSGv1.0 daxil olmaqla çıxış üçün əlavə şək. S5, Əlavə materiala baxın). Cədvəl 3-də göstərildiyi kimi, iSGv2.0 ardıcıl mövqelərin 80,98%-ni düzgün qoruyub, halbuki hər ikisi simvol dəstini qoruya bilməyən iSGv1.0 və ROSE mövqelərin yalnız 61,82%-ni və 61,88%-ni düzgün modelləşdirib. Müxtəlif motivlərdən iSGv2.0 SCR1-in bütün yerlərini mükəmməl şəkildə qoruyub saxlamışdır (bax. şək. 7). Bunun səbəbi, bu motivin kök düzülüşündə mövcud olması və lipokalin xətti boyunca simulyasiyanın əvvəlindən qorunub saxlanılmasıdır. Digər motivlər üçün motiv daha sonra ağacda təsirli olana qədər bütün əvəzləmələr qəbul edilirdi, bundan sonra yalnız mövqeyə aid məhdudiyyətlərə uyğun gələn əvəzləmələr qəbul edilirdi.

Cədvəl 3

Calycin Superfamily Simulation üçün iSGv1.0, ROSE və iSGv2.0 arasında Performans Müqayisəsi a

iSGv1.0GÜLiSGv2.0Giriş Alignment
Faiz ardıcıllığının eyniliyi19.7817.7214.6215.65
Motif mövqelərinin faizi qorunub saxlanılmışdır61.8261.8880.98
İndelləri pozan şablonların sayı b 13.1819.91 d 0
Rədd edilmiş indellərin sayı c NANA0.38

Dördüncü dəyişməyən və tətbiq etdiyi məhdudiyyətlər səbəbindən çoxlu yan təsirləri müşahidə etdik I + γ iSGv1.0 və ROSE massivləri, müvafiq olaraq. Şəkil 7 və əlavə S5, Əlavə Materialda göründüyü kimi, çoxsaylı düzülmədə qorunmuş motivlər indellərin olmadığı yerlərdə "cislands" kimi görünür. Bundan əlavə, SCR1-in GXW bölgəsi kimi dəyişməz sahələr, düzülmənin bütün sütunu üçün qorunub saxlanılmışdır, baxmayaraq ki, o, yalnız nüvə lipokalinləri və odorant bağlayan zülalların kənar lipokalin ailəsi arasında qorunmalıdır. iSGv1.0 həmçinin daha az indelləri simulyasiya etdi, bu, motiv mövqelərini ehtiva edən düzləşdirmə mövqelərinin sayının yan təsiridir və indellər üçün mövqelərin qəbul edilməsinin sayını azaldır. Göründüyü kimi, ROSE, indellər üçün qəbul edilməyən saytların sayından asılı olmayaraq, filial üçün bir indeksin ümumi ehtimalını hesablamaq üçün ardıcıllıqla qalıqların mütləq sayından istifadə edir. iSGv1.0 və ROSE ilə iSGv2.0 arasında indel yerləşdirmələrində fərqlər də aydındır. Şəkil 7-də göstərildiyi kimi, iSGv2.0 düzləşdirmənin N- və C-terminal bölgələri boyunca daha çox sayda indellərə malikdir. Bunun səbəbi, bu bölgələrin ölçüləri ilə bağlı yalnız zəif məhdudiyyətlərə malik olmasıdır: N-terminal 10-30 qalıq və C-terminal 10-30 qalıq ilə məhdudlaşdırılmışdır. Simulyasiya prosesi zamanı iSGv2.0 indeksin ölçüsünü təyin etdi və həm şablon, həm də motiv məhdudiyyətlərinə əsaslanaraq, indeksi qəbul edə biləcək bölgələri tapmaq üçün ardıcıllıqları axtardı. Daha böyük indellərin əksəriyyəti ən az məhdudiyyətli bölgələrdə düşməyə meyllidir. Nə iSGv1.0, nə də ROSE belə məhdudlaşdırıcı imkanlara malik olmadığından, indellər dördüncü dəyişkənliyin qadağan etmədiyi yerdə yerləşdirilir və I + γ massivlər. Bundan əlavə, superfamily qatı nə iSGv1.0, nə də ROSE ilə modelləşdirilə bilməz. Onlar müvafiq olaraq orta hesabla 13,18 və 19,91 şablon qıran indekslər yerləşdirdilər (cədvəl 3). iSGv2.0 şablon məhdudiyyətlərini dəstəklədi. Şablon məhdudiyyətlərinə görə indellər üçün məhdud məqbul mövqelər olduğu üçün orta hesabla, hər simulyasiya qaçışı üçün 0,35 indel iSGv2.0 istifadə edərək rədd edildi.

Giriş çoxlu düzülüşü (əlavə şəkil S1, Əlavə material onlayn) orta hesabla 15,65% cüt ardıcıllıq eyniliyinə malik idi (cədvəl 3). Ardıcıllığın eyniliyinin 20% və ya daha aşağı diapazonu, çox fərqli ailələrə aid zülallar arasında tez-tez görülən ardıcıllığın 'alanlıq zonası' adlanır (Rost 1999). iSGv1.0, ROSE və iSGv2.0 bu diapazonda simulyasiya edilmiş məlumat dəstləridir, 100-dən yuxarı ortalama dəyərlər müvafiq olaraq 19,78%, 17,72% və 14,62% ​​təşkil edir. iSGv1.0 və ROSE ilə iSGv2.0 arasında ardıcıllıq identikliklərindəki fərq, hətta nəsil-xüsusi motivləri olmayan ardıcıllıqlar üçün də dəyişməz saytların iSGv1.0 və ROSE tərəfindən qlobal mühafizəsi ilə izah olunur. iSGv1.0 və ROSE hər ikisi daha aşağı “%-də qorunan motiv mövqeləri göstərdi” (cədvəl 3), hətta müxtəlif zülal ailələri üçün qalıq məhdudiyyətlərinə uyğun gəlməsələr də, bəzi mövqelərin onlar tərəfindən qorunduğunu göstərir.


Materiallar

Bu laboratoriya üçün lazım olacaq bəzi karton parçaları üçün şablonlar.

  • Təxminən 6,5 sm enində karton zolaqlar (sümükləri təmsil edir)
  • Bu karton zolaqları hər bir laboratoriya qrupu üçün təyin olunmuş uzunluqlarda əvvəlcədən kəsin
    • 4x 20,5 sm
    • 4x12,5 sm
    • 4x7.5sm
    • 4x5 sm
    • 4x3,5 sm
    • 5,5 sm diametrli "X" dairəsi
    • 15 sm "W" diametrli dairə
    • Uzunluğu 5,5 sm "Y" olan kvadrat
    • Uzunluğu 2,5 sm "Z" olan kvadrat

    Mövcudluq və tələblər

    Layihənin adı:πBUSS Layihənin ana səhifəsi:http://www.rega.kuleuven.be/cev/ecv/software/pibuss Əməliyyat sistemləri): Platforma müstəqil Proqramlaşdırma dili: Java Digər tələblər: Java 1.5 və ya daha yüksək, BEAGLE kitabxanası Lisenziya: GNU Kiçik GPL Akademik olmayanlar tərəfindən istifadə üçün hər hansı məhdudiyyətlər: Heç biri.

    Ardıcıllığın simulyasiyası üçün paralel BEAST/BEAGLE yardım proqramının mənbə kodu BEAST Google Code repozitoriyasının bir hissəsi kimi sərbəst mövcuddur: http://www.code.google.com/p/beast-mcmc/.

    Geniş platformalı Təkamül Analizi Ümumi İhtimal Qiymətləndiricisi (BEAGLE) kitabxanasında http://www.code.google.com/p/beagle-lib saytından həm mənbə kodu, həm də binar quraşdırıcılar mövcuddur.

    Təqdim olunan simulyasiya tədqiqatının təkrarlanması üçün tələb olunan skriptlər və giriş faylları Tətbiq nümunəsi http://www.github.com/phylogeography/DeepRoot ünvanında yerləşdirilir.


    MEGA 10.0

    MEGA (Molekulyar Təkamül Genetika Analizi) ardıcıllığın avtomatik və əl ilə düzülməsi, filogenetik ağacları çıxarmaq, veb-əsaslı verilənlər bazalarını çıxarmaq, molekulyar təkamül sürətlərini təxmin etmək və təkamül fərziyyələrini sınaqdan keçirmək üçün inteqrasiya olunmuş bir vasitədir.

    :: EKRAN ŞOTLAR

    :: TƏLƏBLƏR

    :: ƏTRAFLI MƏLUMAT

    Mol Biol Evol. 2013 dekabr 30(12):2725-9. doi: 10.1093/molbev/mst197. Epub 2013 16 oktyabr.
    MEGA6: Molekulyar Təkamül Genetika Analizi 6.0 versiyası.
    Tamura K, Stecher G, Peterson D, Filipski A, Kumar S.

    Tamura K, Peterson D, Peterson N, Stecher G, Nei M və Kumar S (2011)
    MEGA5: Maksimum Ehtimal, Təkamül Məsafəsi və Maksimum Parsimoniya Metodlarından istifadə edərək Molekulyar Təkamül Genetika Analizi.
    Molecular Biology and Evolution (2011)doi: 10.1093/molbev/msr121 İlk dəfə onlayn nəşr: 4 may 2011-ci il

    Bir cavab buraxın Cavabı ləğv edin

    Bu sayt spamları azaltmaq üçün Akismet-dən istifadə edir. Şərh datanızın necə işləndiyini öyrənin.


    Ardıcıl təkamül simulyasiya aləti - Biologiya

    NGSphy: növbəti nəsil ardıcıllıq məlumatlarının filogenomik simulyasiyası

    © 2017 Merly Escalona ([email protected]), Sara Rocha, David Posada

    NGSphy, növlər üzrə çoxlu haploid və/və ya diploid fərdlərin olduğu, ümumi növ ağacı altında təkamül edən minlərlə gen ailəsindən əldə edilən NGS məlumatlarının (oxu sayları və ya Illumina tərəfindən oxunur) genom üzrə simulyasiyası üçün açıq mənbəli Python alətidir. əhatə dairəsi (dərinlik) heterojenliyi növlər, fərdlər və yerlər, o cümlədən hədəfdən kənar və tutulmamış yerlər arasında dəyişə bilər.

    NGSphy tək gen ağaclarından və ya gen ağacı paylamalarından (növlər-ağac paylamalarından yaranan) yaranan uyğunlaşmalardan oxunmaları (və ya oxunan sayları) simulyasiya edir. O, gen ağacı paylanması vəziyyətində birbaşa SimPhy-dən (gen ailəsinin təkamülünün simulyatoru) oxumaq üçün nəzərdə tutulmuşdur, lakin o, birbaşa gen ağacları ilə də qidalana bilər. Bu ağaclarda orfoloqlar, paraloqlar və ksenoloqlar ola bilər. Düzəlişlər INDELible istifadə edərək simulyasiya edilir və hər növ üçün çoxlu haploid və/və ya diploid fərdləri təmsil edə bilər. Daha sonra, əhatə dairəsinin dərinliyinin növlər, fərdlər və yerlər arasında dəyişməsinə icazə verilməklə, ya Illumina oxuyur (ART istifadə edərək) və ya oxunma sayları hər bir fərd üçün simulyasiya edilir. Bu çeviklik həm hədəfdən kənar (tutulmuş, lakin hədəflənməmiş) həm də tutulmamış (hədəflənmiş, lakin tutulmamış) yerlərin simulyasiyasına imkan verir.

    Sizə NGSphy parametrləri faylı və seçilmiş daxiletmə rejiminə uyğun olaraq tələb olunan fayllar lazımdır (aşağıya baxın).


    Ardıcıl təkamül simulyasiya aləti - Biologiya

    Trevolver trinukleotid kontekstindən istifadə edərək sabit ikiləşən ağacda geri dönməyən DNT ardıcıllığının təkamülünü simulyasiya etmək üçün Perl proqramıdır. Heç bir xarici asılılığa güvənmir, maksimum daşınma qabiliyyətini asanlaşdırır. Sadəcə yükləyin və işə salın.

    Simulyasiyanı nümunə verilənlərlə yoxlamaq üçün proqramı Unix komanda xəttində və ya Mac Terminalında aşağıdakı kimi icra edin:

    Aşağıda bəzi real nümunələri tapın. bioRxiv-də əvvəlcədən çapımıza baxın.

    O cümlədən yeni mutasiya məlumatları de novo ata/ana-uşaq “üçlüyünün” bütün genom ardıcıllığında aşkar edilmiş mutasiyalar kontekstdən asılı mutasiya dərəcələrini empirik olaraq qiymətləndirmək üçün istifadə edilə bilər. Ən çox istifadə edilən kontekst trinukleotiddir, burada mövqenin hər iki tərəfindəki yan nukleotid nəzərə alınır (bir 5', bir 3'). Təəssüf ki, geri dönməyən (yəni., asimmetrik nisbətlər) sabit ikiləşən (ikili tam həll edilmiş) gen ağacında DNT təkamülü, məsələn, birləşmə simulyasiyaları ilə istehsal olunanlar. Trevolver bu boşluğu doldurmaq üçün yaradılmışdır. İstifadəçi ikiləşən ağac, toxum ardıcıllığı, 64 × 4 (trinukleotid × nukleotid) dərəcəsi matrisi və filial vahidi təqdim etməlidir (seçimlərə baxın). Trevolver bütün ağac ipuçları üçün Variant Zəng Formatını (VCF) SNP hesabatını (yarpaq taksonları), eləcə də hər bir nəsil üçün mutasiyaların və motivlərin tarixini çıxarır (çıxışa bax).

    Trevolver toxum ardıcıllığını ağacın kökünə yerləşdirməklə başlayır. Daha sonra sıralı ikili ağac quruluşu kimi ağacı kökdən uca rekursiv şəkildə keçməyə davam edir. Başqa sözlə, hər bir daxili qovşaqda o, sağ uşağı emal etməzdən əvvəl sol uşağı (və onun sol uşağı və s.) emal edir, burada sol (birinci) nəsil qovşağı əlifbadan istifadə edərək birinci gələn qovşaq hesab olunur. rəqəmli deyil) sort() funksiyası. Unikal node ID-ləri 'n' hərfi və ardınca tam ədəd (məs., n5), burada kök n=0 hesab olunur.

    Tək bir budaqla (klasterdən fərqli olaraq) qarşılaşdıqda, Trevolver budaq boyunca ardıcıllıqla təkamül etməyə başlayır. Budağın ana düyünü də kök olarsa, toxum (əcdad) ardıcıllığı başlanğıc nöqtəsi kimi istifadə olunur. Əks halda, toxum ardıcıllığının yeni və müvəqqəti nüsxəsi yaradılır və hər mutasiyaya uğramış ərazidə ən son allel daxil edilir. Bu, kompüter yaddaşına qənaət edir, çünki hər bir node öz sələfindən bütün ardıcıllığı deyil, yalnız mutasiya tarixini miras almalıdır.

    Budaqda yeni ardıcıllıq işə salındıqdan sonra o, istifadəçi girişi ilə müəyyən edilmiş trinukleotid kontekstindən asılı mutasiya dərəcələri altında təkamül etməyə başlayır. Mutasyon dərəcəsi matrisi Trevolver irəli vaxt simulyasiyasının formatını izləyir SLiM (Haller və Messer 2019): 4 3 = 64 cərgə əlifba sırası ilə sıralanmış 64 trinukleotidin ilkin vəziyyətlərinə, 4 sütun isə mərkəzi nukleotidin mümkün törəmə vəziyyətlərinə uyğundur. Məsələn, birinci sətrin üçüncü sütununda AAA➞AGA mutasiya sürəti olmalıdır. Şəxsiyyətlər üçün mutasiya dərəcələri (məs., AAA➞AAA) 0 olmalıdır.

    Budaqda təkamül başlayanda, Trevolver əvvəlcə uzunluq ardıcıllığının ümumi mutasiya sürətini hesablayır L hesablamaqla L - ardıcıllıqla 2 trinukleotid (yəni., trinukleotid konteksti olmayan birinci və sonuncu nukleotidlər nəzərə alınmır). Ardıcıllığın ümumi mutasiya dərəcəsi (u) növbəti mutasiyaya təsadüfi eksponensial paylanmış gözləmə müddətini hesablamaq üçün istifadə olunur gw = -(1 / u) × ln(x1) nəsillər, harada x 0 (daxil olmaqla) və 1 (eksklüziv) arasında təsadüfi bir ədəddir (Yang 2014). Əgər gözlənilən gözləmə müddəti (gw) budaq uzunluğundan azdır, mutasiya baş verir. Ardıcıllıq daha sonra ardıcıllıq üzrə məcmu mutasiya dərəcəsi 0 (daxil olmaqla) və u (eksklüziv).Daha sonra bu vəziyyətin mövcud olduğu və mutasiya dərəcəsi 0-dan çox olan birinci trinukleotidin mərkəzi mövqeyində mutasiya baş verir. Bu kontekstdən asılılıq səbəbindən yüksək dərəcədə dəyişkən trinukleotidlərin zamanla "eroziya" etməsi mümkündür və ardıcıllığın ümumi mutasiya dərəcəsi sürət matrisindən asılı olaraq ani (əvvəlcədən müəyyən edilmiş deyil) dəyərdir. Həqiqətən, tarazlıq triunkleotid tərkibinə çatana qədər ümumi mutasiya dərəcəsi azala (və ya arta bilər).

    Zəng edin Trevolver aşağıdakı seçimlərdən istifadə edərək:

    --ağac (TƏLƏB OLUNUR): budaq uzunluqları ilə newick formatında ikiləşən təkamül ağacı olan fayl. BU ZAMAN HEÇ BİR NODE ADI VƏ DƏSTƏK DƏYƏRLƏRİ YOXDUR. Yalnız ilk rast gəlinən ağacdan istifadə olunur, yəni., utandırıcı bir şəkildə paralel təhlillər bir səviyyə yuxarı aparılmalıdır.

    --toxum_ardıcıllığı (TƏLƏB OLUNUR): Ağac kökündə başlanğıc (toxum) ardıcıllığını ehtiva edən FASTA faylı, təkamül ediləcək. Yalnız rast gəlinən ilk ardıcıllıq istifadə olunur.

    --dərəcə_matrisası (TƏLƏB OLUNUR): sətir və sütunların əlifba sırası ilə olduğu 64 × 4 nişanı ilə ayrılmış trinukleotid dərəcəsi matrisini ehtiva edən fayl. Məsələn, birinci sətirdəki qiymətlər AAA➞AAA, AAA➞ACA, AAA➞AGA və AAA➞ATA-ya uyğundur.

    --filial_vahidi (TƏLƏB OLUNUR): miqyaslama əmsalı, 2-yə bərabərdirN0 və ya 4N0 əksər birləşən simulyasiyalarda (məs., Xanım Hudson 2002), nəsillər boyu nəsil uzunluğunu əldə etmək üçün budaq uzunluğuna vurula bilər. Budaq uzunluqları bu dəyərə vurulacaq və nəsillərin sayını müəyyən etmək üçün ən yaxın tam ədədə yuvarlaqlaşdırılacaq. Məsələn, 144740 dəyərini nəzərə alsaq, filogenetik ağacda 0,228826612 budaq uzunluğu 144740 × 0,228826612 = 33,120,364 nəsillərə uyğun olacaq.

    --təsadüfi_toxum (OPSİYONAL): təsadüfi ədədlər generatorunun toxumlanması üçün tam ədəd. Təchizat edilmədikdə, biri seçiləcək və məlumat veriləcək. Daha konkret desək, bizdə verilmiş yoxlama cəmi yanaşmasını həyata keçiririk Proqramlaşdırma Perl:

    --izlənən_motif (OPSİYONAL): hər mutasiyadan sonra izləmək üçün motiv. Məsələn, iş zamanı CpG saytlarının sayını bildirmək üçün CG-ni belə təyin edin: --tracked_motif=CG .

    --mutasiyaları izləmək (OPSİYONAL): mutasiya dərəcəsini bildirir və zamanla hesablanır.

    --xarici_taxa (OPSİYONAL): yolu takson adlarının siyahısını ehtiva edən fayl (vergüllə ayrılmış) kənar qruplar kimi qəbul edilməlidir, yəni., VCF faylından və konsensus ardıcıllıq(lar)ından xaric edilmişdir. Əgər az sayda takson daxili qrupdakı polimorfizm müqayisə edilən kənar qrupları təmsil edərsə, bu arzuolunan ola bilər.

    --xarici qruplar (OPSİYONAL): kənar qrupların sayı Qrupun ən son ortaq əcdadının (MRCA) identifikasiyası və VCF faylında qrup variantının tezliklərinin hesablanması üçün xaric edilməlidir. Xarici qruplar ən dərin budaqlanan terminal taksonları (xarici qovşaqlar) hesab olunur. Məsələn, --outgroups=2 göstərilibsə, sabit ağac kökdən başlayaraq naviqasiya edilir. Hər bir daxili qovşaqda ən az terminal taksonunu ehtiva edən filial kənar qrup(lar)ı ehtiva edir. İstifadəçi tərəfindən müəyyən edilmiş kənar qrupların sayı müəyyən edildikdən sonra, qalan (daxili) taksonların ən son ümumi əcdadı (MRCA) qovşağı müəyyən edilir və hesabat verilir. Əgər istifadəçinin müəyyən etdiyi nömrə üçün qeyri-ixtiyari qrup taksonları dəsti mövcud deyilsə (məs., əgər --outgroups=2 çağırılırsa, lakin iki ən dərin bölgü iki yox, üçü ehtiva edirsə), xəbərdarlıq çap olunur və heç bir qrupdan istifadə edilmir.

    --yandırmaq (OPSİYONAL): ağac kökündə təkamülə başlamazdan əvvəl təkamülü ardıcıllıqla "yandırmaq" üçün nəsillərin sayı. Qeyd edək ki, bu, mütləq nəsil sayı ilə ölçülür, yox filial bölmələrində. Standart təcrübə 10-durN və ya 20N nəsillər, harada N (effektiv) əhali ölçüsüdür.

    --vcf_output (OPSİYONAL): tam yol adı verilmədiyi halda, iş kataloqunda yaradılacaq VCF formatlı çıxış faylının adı. Göstərilməyibsə, ağac faylının adından prefiks kimi istifadə edilməklə, fayl .vcf uzantısı ilə işçi kataloqda çap olunacaq.

    --suppress_seed_seq (OPSİYONAL): çıxışda əcdad (toxum) ardıcıllığının çapını dayandırın. Toxum ardıcıllığı çox böyükdürsə və onun çıxışa daxil edilməsi diskdə çox yer sərf edirsə, bu arzuolunan ola bilər.

    --supress_MRCA_seq (OPSİYONAL): MRCA (qrupdaxili ən son ümumi əcdad) ardıcıllığının çap edilməsinin qarşısını alır.

    --suppress_consensus_seq (OPSİYONAL): konsensus ardıcıllığının (burada əsas allel kimi müəyyən edilən REF allelini ehtiva edən) çap edilməsinin qarşısını alır.

    --supress_MUTATION (OPSİYONAL): //MUTATION məlumatının çap olunmasının qarşısını alır.

    --müfəssəl (OPSİYONAL): Trevolverə deyin ki, baş verən HƏR ŞEY haqqında məlumat versin. İnkişaf və sazlama məqsədləri istisna olmaqla tövsiyə edilmir.

    Nümunə daxiletmə və çıxış faylları bu GitHub səhifəsində EXAMPLE_INPUT və EXAMPLE_OUTPUT kataloqlarında mövcuddur, burada təkrarlana bilən nümunələr nömrələnir (məs., output_example1.txt). Təsadüfi toxum müəyyən edilmədikdə, EXAMPLE_OUTPUT-da mövcud olan çıxış faylında bildirilmiş eyni təsadüfi nömrə toxumundan istifadə etməklə dəqiq nəticələr çıxarıla bilər. Qeyd edək ki, əgər sizin daxil etdiyiniz fayl(lar) (məs., tree_6taxa.txt) iş kataloqunda deyil (yəni., Terminalınızın hazırda işlədiyi yerdə) fayl adının tam yolunu göstərməlisiniz (məs., /Users/ohta/Desktop/trevolver_practice/tree_6taxa.txt). Onu da qeyd edək ki, aşağıdakı nümunələrdə sadəcə olaraq əvvəlki əmri sətirdə davam etdirmək üçün istifadə olunur.

    NÜMUNƏ 1: SADƏ SİMULYASİYA

    NÜMUNƏ 2: 1000 NƏSİL YANMA İLƏ SADƏ SİMULYASİYA

    NÜMUNƏ 3: TİPİK İSTİFADƏ (proqram təfərrüatlı deyil, təsadüfi toxuma qərar verir)

    NÜMUNƏ 4: İKİ HARİQ QRUPLA SİMULYASİYA

    NÜMUNƏ 5: 1 MİLYON NƏSİL ÜÇÜN TƏK TƏKLİF EDİN

    Tək ardıcıllığın təkamülünü simulyasiya etmək üçün yalnız bir takson və budaq uzunluğu olan bir ağacı təmin edin. Məsələn, 1 milyon nəsil üçün "mənim_məxluqum" adlı tək ardıcıllığın təkamülünü simulyasiya etmək üçün ağac faylı sadəcə olaraq, (my_creature:1000000) ehtiva edir. 1-lik miqyas amilini ( --branch_unit ) təmin edin və getməyə hazırsınız:

    NÜMUNƏ 6: İSTİFADƏ EDİLMİŞ BİR ÇOX VARİANTLAR

    NÜMUNƏ 7: EKRANA ÇIXIŞI OLAN MİNİMUM SEÇİMLƏR

    Bu avtomatik olaraq adlı VCF faylı yaradacaq tree_7taxa.vcf iş kataloqunda.

    Göstərilən variantlardan asılı olaraq, Trevolver aşağıdakı məlumatları çıxaracaq:

    Çıxışın başlanğıcı hesabat verəcək:

    • ƏMƏR: Trevolveri necə çağırdılar.
    • RANDOM_SEED : istifadə olunan təsadüfi toxum.
    • INPT_SEQUENCE : giriş kimi istifadə olunan nukleotid ardıcıllığı.
    • SEED_SEQUENCE : simulyasiyanı əkmək üçün istifadə olunan nukleotid ardıcıllığı. Yanma vaxtı yoxdursa, bu INPT_SEQUENCE ilə eynidir.
    • MRCA_SEQUENCE: MRCA daxili qrupunun nukleotid ardıcıllığı (ən son ümumi əcdad).
    • CONS_SEQUENCE: simulyasiyanın sonunda ingrupun konsensus nukleotid ardıcıllığı (yəni., ağac ipuçları).
    • AĞAC : ​​simulyasiyanın aparıldığı sabit ağac.
    • MRCA_GENERATION : qruplaşmanın ən son ortaq əcdadının (MRCA) yaşadığı nəsil (kökdə 0-dan etibarən).
    • MRCA_SUBTREE : MRCA-nın kök olduğu alt ağac.
    • HARİCİ Qruplar: əgər varsa, kənar qrupların adları.
    • MRCA_NODE_ID : MRCA-nın node ID.
    • VCF_OUTPUT_FILE : VCF çıxışının fayl adı.

    Bundan əlavə, qısa bir şəkildə NƏTİCƏLƏRİN XÜLASƏSİ, aşağıdakı bayraqlar daha ətraflı çıxışın ayrı-ayrı bölmələrini göstərir:

    • //MUTASİYA: aşağıdakı sətirlər üç sütunlu tam mutasiya tarixçəsini ehtiva edir: takson, yer və mutasiya. Mutasiya sütunu məlumatları [nəsil]-[əcdad alleli]>[gələn allel] formatındadır. Məsələn, 1988-ci nəsildə baş verən C>T mutasiyası 1988-C>T kimi siyahıya alınacaq.
    • //TRACKED : aşağıdakı sətirlərdə izlənilən mutasiya dərəcələri və/yaxud beş sütunlu motiv məlumatı var: nəsil, nəsil, mutasiya_dərəcəsi, mutasiya_sayı və motiv_hesabı.

    Variant Zəng Formatının (VCF) çıxışı bəzi nəzərə çarpan istisnalar istisna olmaqla, 1000 Genom Layihəsi GRCh38/hg38 buraxılışı tərəfindən istifadə edilən VCFv4.1 formatına uyğundur. Rahatlıq və təkrar istehsal üçün əlavə metadata başlıqları (## ilə başlayan sətirlər) kimi istifadə olunan arqumentləri göstərmək üçün istifadə olunur. Trevolver Standart Çıxışda təsvir olunanlar da daxil olmaqla, giriş, əsas nəticələr və təcrübə spesifikasiyaları, həmçinin:

    • burn_in_mutations : yanma dövründə mutasiyaların ümumi sayı.
    • total_mutations : bütün budaqlar üzrə mutasiyaların ümumi sayı (yanma istisna olmaqla).
    • ağac_uzunluğu : ümumi budaq uzunluğu (nəsillər).
    • təcrübə_uzunluğu: ağacın hündürlüyü, yəni., kökdən uca uzunluq (nəsillər). Hazırda nəsillərlə ölçülən bütün kökdən uca uzunluqların bərabər olması tələb olunur.
    • simulyasiya_zamanı : qaçış uzunluğu (saniyələr).

    Uyğun olmayan başlıqlar (məs., qeyri-nükleotid variant deskriptorları) silinmişdir. --suppress_input_seq , --suppress_seed_seq , --suppress_consensus_seq və ya --suppress_MRCA_seq adlandırılmadıqda, giriş, toxum, konsensus (daxili qrup) və MRCA (daxili qrup) ardıcıllıqları rahatlıq üçün başlıq metadatasında çap olunur. Bundan əlavə, INFO sütununa çoxsaylı məlumat növləri (real həyatdakı təkamül analizlərində bilinməyən bir çoxu) əlavə edilmişdir:

    • REF / REF_OG : AA (əcdad alleli) ilə uyğunlaşa və ya uyğun gəlməyən daxili qrup/xarici qrup(lar)ın konsensus (əsas) alleli.
    • AA : bütün ağacın əcdad alleli (toxum ardıcıllığının alleli).
    • MRCA : Inqrupa münasibətdə Ən Son Ümumi Ata (MRCA) alleli, əgər --outgroups istifadə olunursa.
    • MUTATIONS / MUTATIONS_OG : bu saytda baş vermiş bütün unikal mutasiyalar, məs., G>A. Çoxlu mutasiyalar vergüllə ayrılır (məs., G>A, A>G ) ilə xronoloji qaydada, aşağı axın təhlillərində rahatlıq üçün. Əgər kənar qruplar və ya xaric edilmiş taksonlar göstərilibsə, MUTATIONS yalnız daxili qrupa, MUTATIONS_OG isə yalnız qrup(lar)a aiddir.
    • GENERATIONS / GENERATIONS_OG : eyni ardıcıllıqla vergüllə ayrılmış unikal mutasiya(lar)ın baş verdiyi vaxt (nəsil)xronoloji). Əgər kənar qruplar və ya xaric edilmiş taksonlar göstərilibsə, GENERATIONS yalnız daxili qrupa, GENERATIONS_OG isə yalnız kənar qruplara istinad edir.
    • TAXA / TAXA_OG : eyni ardıcıllıqla vergüllə ayrılmış unikal mutasiya(ları) paylaşan taksonların sayı (xronoloji). Əgər kənar qruplar və ya xaric edilmiş taksonlar göstərilibsə, TAXA yalnız daxili qrupa, TAXA_OG isə yalnız qrup(lar)a aiddir.
    • ARBITRARY_REF : bu saytda əsas/konsensus/ən çox yayılmış allel üçün bərabərliyin olduğunu göstərən bayraq. Ən yüksək allel tezliyi iki allel tərəfindən paylaşılırsa, əlifba sırası ilə birinci gələn biri bildirilir.
    • MULTIHIT / MULTIH_OG : saytın qrup/xarici qrup(lar)da eyni və ya fərqli nəsildə birdən çox mutasiyaya məruz qaldığını göstərən bayraqlar.
    • MULTIALLELIC / MULTIA_OG : saytın çoxsaylı kiçik (istinadsız) allellərə malik olduğunu göstərən bayraqlar (yəni., >2 allelləri) daxili qrup/xarici qrup(lar). Bütün multiallelik saytlar multihitdir, lakin bunun əksi doğru deyil.
    • BACK_MUTATION / BACK_M_OG : saytın daxili qrup/xarici qrup(lar)da əvvəlki vəziyyətə/allelə qayıdan geri mutasiyaya məruz qaldığını göstərən bayraq. Arxa mutasiyaya malik olan bütün saytlar çoxlu hitlərə məruz qalıb, lakin bunun əksi doğru deyil.
    • RECURRENT_MUTATION / RECURRENT_M_OG : saytın təkrarlanan mutasiyaya məruz qaldığını, yəni eyni dəyişikliyin qrup/xarici qrup(lar)da bir neçə dəfə müstəqil olaraq baş verdiyini göstərən bayraq.
    • INVARIANT_ANCESTRAL : saytın qrup yarpaqlarında heç bir polimorfizmə malik olmadığını və sabit vəziyyətin əcdad allelinə (AA) uyğun olduğunu göstərən bayraq. Beləliklə, saytın tarixində bir mutasiya baş versə belə, əldə edilən allel arxa mutasiya ilə itirildi.
    • INVARIANT_DERIVED : saytın qrup yarpaqlarında heç bir polimorfizmə malik olmadığını və sabit vəziyyətin mutasiya nəticəsində yaranan törəmə allele uyğun olduğunu göstərən bayraq. Bu, bütün mövcud qrup ardıcıllığının mutasiyaya uğramış əcdaddan törədiyini nəzərdə tutur.
    • NO_ANCESTRAL : inqrupun mövcud fərdlərində heç bir əcdad (toxum) allelinin qalmadığını göstərən bayraq. Nəzərə alın ki, bu, polimorfizmin mövcudluğu ilə uyğun gəlir, o vaxta qədər ki, allellərin heç biri əcdad allelinə uyğun gəlmir.
    • REF_OG : AA-ya uyğun gələn və ya olmaya bilən kənar qrup(lar)ın konsensus (əsas) alleli.
    • REF_OG_COUNT : xarici qrup konsensusuna uyğun gələn xarici qrup allelinin sayı.
    • REF_OG_AF : xarici qrup konsensusuna uyğun gələn qrup allelinin tezliyi.
    • ALLELES_OG : kənar qrup(lar)da mövcud olan bütün allellərin vergüllə ayrılmış siyahısı.
    • ALLELE_COUNTS_OG : ALLELES_OG ilə eyni ardıcıllıqla xarici qrup(lar)da mövcud olan allellər üçün bütün allel saylarının vergüllə ayrılmış siyahısı.
    • OG_FIXED : saytın bir allel üçün sabitləndiyini göstərən bayraq (yəni., kənar qrup(lar)da heç bir dəyişiklik yoxdur). Yalnız kənar qrup varsa, bu, tərifə görə doğru olacaqdır. Nəzərə alın ki, xarici qrup allellərinin tezlikləri ALLELE_COUNTS_OG məlumatından əldə edilə bilər.
    • OG_DIVERGED : bir və ya bir neçə xarici qrup allelini göstərən bayraq -dən fərqlənir bir və ya daha çox qrup allelləri. Xarici qruplar daxili qrupdan ayrıla bilər, lakin sabit deyil.
    • OG_SHARE : bir və ya bir neçə xarici qrup allelini göstərən bayraq matçlar bir və ya daha çox qrup allelləri. Xarici qruplar allelləri daxili qrupla paylaşa bilər, lakin sabit deyil.

    Haqqında suallarınız varsa Trevolver, lütfən, bu səhifənin yuxarısındakı Problemlər sekmesine klikləyin və başqalarının müzakirədən faydalana bilməsi üçün yeni başlıq açın. Ümumi suallar bu bölmədə müzakirə olunacaq.

    Trevolver Amerika Təbiət Tarixi Muzeyindəki Gerstner Ailəsi Fondundan C.W.N.-yə Gerstner Alimləri Təqaüdünün dəstəyi ilə yazılmışdır. (2016-2019) və 中央研究院 Academia Sinica Postdoctoral Tədqiqat Təqaüd Proqramının (2019-2021) dəstəyi ilə qorunur. Loqo təsviri Mitch Lin (2019) tərəfindən Pixabay-dan əldə edilmiş müəllif hüququ olmayan DNT heliksi tərəfindən hazırlanmışdır. Müzakirə üçün Reed A. Cartwright, Michael Dean, Dan Graur, Ming-Hsueh Lin, Lisa Mirabello, Sergios Orestis-Kolokotronis, Michael Tessler və Meredith Yeager-ə təşəkkür edirik.

    Bu proqram təminatından istifadə edərkən lütfən müraciət edin və sitat gətirin:

    Nelson CW, Fu Y, Li W-H. Trevolver: bifurkasiya edən ağacda trinukleotid kontekstində geri dönməyən DNT ardıcıllığının təkamülünün simulyasiyası. bioRxiv doi: https://doi.org/10.1101/672717

    Haqqında suallarınız varsa Trevolver, lütfən, bu səhifənin yuxarısındakı Problemlər sekmesine klikləyin və başqalarının müzakirədən faydalana bilməsi üçün yeni başlıq açın.

    Digər yazışmalar Chase W. Nelsona ünvanlanmalıdır:

    • Haller BC, Messer PW. 2019. SLiM 3: Wright-Fisher modelindən kənara çıxan genetik simulyasiyalar. Molekulyar Biologiya və Təkamül36:632–637.
    • Hudson RR. 2002. Genetik dəyişkənliyin Wright-Fisher neytral modeli altında nümunələrin yaradılması. Bioinformatika18:337–338.
    • Yang Z. 2014. Molekulyar təkamül: statistik yanaşma. New York, NY: Oxford University Press.


    Videoya baxın: Denizin Derinliklerindeki En Korkunç 10 Yaratık (Oktyabr 2022).