Məlumat

ENA-da (Avropa Nukleotid Arxivi) bir genomda DNT ardıcıllığını necə axtarmaq olar?

ENA-da (Avropa Nukleotid Arxivi) bir genomda DNT ardıcıllığını necə axtarmaq olar?


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

ENA-da bir orqanizmin genomunda kiçik DNT sekansları üçün axtarış etməliyəm. Məndə qoşulma nömrəsi və layihə id var. Bununla belə, yükləmə ölçüsünə görə bütün genomu endirə bilmirəm və mümkünsə, bunu onlayn etməyə üstünlük verərdim. Genomun skan etmək istədiyim hissəsi haqqında təxmini fikrim var, bunun uyğun olub olmadığını bilmirəm.


Dəqiq axtarışı özünüz yükləmək və etmək daha yaxşı/asan olsa da, onlayn olaraq oxşar bir şey etmək mümkündür. Siz NCBI-BLAST-dan istifadə edə və söz uzunluğunu və uyğunsuzluq/boşluq cəzasını artıra bilərsiniz. O, həmçinin mövzu məkanını məhdudlaşdırmağa imkan verir; hətta iki ardıcıllığı uyğunlaşdıra bilərsiniz. ENA-dakı BLAST çox çevikliyə malik deyil (mövzu məhdudiyyəti/söz uzunluğu). Yəqin ki, NCBI-də dublikat ardıcıllığı axtara bilərsiniz.

Bu genom UCSC genom brauzerində mövcuddursa, BLAT-dan da istifadə edə bilərsiniz. Bununla belə, o, yalnız 19nt-dan böyük ardıcıllığı qəbul edir.


ENA-da (Avropa Nukleotid Arxivi) bir genomda DNT ardıcıllığını necə axtarmaq olar? - Biologiya

Yoluxucu agentlərin genomik və təkamül analizi üçün bioinformatika vasitələri

Vivek Dhar Dwivedi 1 , Shiv Bharadwaj 2 , Partha Sarathi Mohanty 1 , Umesh Datta Gupta 3
1 Epidemiologiya şöbəsi, ICMR-Milli JALMA Cüzam və Digər Mikobakteriya Xəstəlikləri İnstitutu, Aqra, Uttar Pradeş, Hindistan
2 Nanotexnologiya Araşdırma və Tətbiq Mərkəzi, Sabancı Universiteti, İstanbul, Türkiyə
3 Heyvan Təcrübələri Departamenti, ICMR-Milli JALMA Cüzam və Digər Mikobakteriya Xəstəlikləri İnstitutu, Aqra, Uttar Pradeş, Hindistan

Vebdə nəşr tarixi6 sentyabr 2018-ci il

Yazışma ünvanı:
Dr. Umesh Datta Gupta
Heyvan Təcrübələri Departamenti, ICMR-Milli Jalma Cüzam və Digər Mikobakteriyalar İnstitutu, Aqra, Uttar Pradeş
Hindistan

Dəstək mənbəyi: Heç biri, Maraqların toqquşması: Heç biri

DOI: 10.4103/bbrj.bbrj_74_18

Yoluxucu agentlərin (İA) genom ardıcıllığının təhlili onların həyat prosesləri və təkamül tarixi ilə bağlı bir çox sirləri açır. Müxtəlif ardıcıllıq layihələri vasitəsilə istehsal olunan müxtəlif bioloji ardıcıllıq verilənlər bazalarında müxtəlif IA-ların genomik ardıcıllığı məlumatlarının böyük miqdarının artırılması, genom tədqiqatçılarını IA-ların həyatı ilə bağlı sirləri açmaq üçün davamlı olaraq motivasiya edir. Bundan əlavə, bu məlumat IA-ların yaratdığı ciddi xəstəlik problemini müalicə etmək üçün faydalı ola bilər. Bununla belə, bütün genom təhlili işləri, genom tədqiqatçıları üçün IA-ların genom ardıcıllığı məlumatlarından mənalı və dəqiq məlumat çıxarmaq üçün faydalı ola biləcək bioinformatika alətləri haqqında yaxşı bilik tələb edir. Bu məqalədə, yoluxucu agentlərin genomik və təkamül təhlili üçün ən son bioinformatika vasitələri ətraflı müzakirə edilmiş və müqayisə edilmişdir ki, bu da genom tədqiqatçılarına İA-ların genomik və təkamül analizi üçün ən uyğun aləti seçməyə kömək edəcəkdir.

Açar sözlər: Bioinformatika vasitələri, təkamül, genom, yoluxucu agentlər


Bu məqaləyə necə istinad etmək olar:
Dwivedi VD, Bharadwaj S, Mohanty PS, Gupta UD. Yoluxucu agentlərin genomik və təkamül analizi üçün bioinformatika vasitələri. Biomed Biotechnol Res J 20182:163-7

Bu URL-ə necə istinad etmək olar:
Dwivedi VD, Bharadwaj S, Mohanty PS, Gupta UD. Yoluxucu agentlərin genomik və təkamül analizi üçün bioinformatika vasitələri. Biomed Biotechnol Res J [serial onlayn] 2018 [sitat 2021 İyun 27]2:163-7. Buradan əldə etmək olar: https://www.bmbtrj.org/text.asp?2018/2/3/163/240709

Bakteriyalar, göbələklər, protozoyanlar, helmintlər və viruslar kimi yoluxucu agentlər (İA) insanlarda çox ciddi sağlamlıq problemlərinə səbəb olur. Bütün İA-ların genomunda müəyyən bir sıra nukleotidlərə malik olan genetik material kimi DNTRNT var. Hər bir İA-nın genomunda olan nukleotidlərin xüsusi sırası onların şəxsiyyətini bir-birindən fərqləndirir. IA-ların mənşəyi, böyüməsi, yaşaması, virulentliyi və təkamülünün sirri onların genomlarının nukleotidlərinin xüsusi ardıcıllığında gizlənir. [1],[2] Beləliklə, IA-ların genomunun təhlili onların şəxsiyyətini, infeksiyanın molekulyar mexanizmini və onların pis təsirlərini müalicə etmək üçün yeni effektiv dərmanların işlənməsini başa düşmək üçün çox vacibdir. Dünyada müxtəlif ardıcıllıq layihələri vasitəsilə istehsal edilən və müxtəlif nukleotid ardıcıllığı verilənlər bazalarında saxlanılan IA-ların genom ardıcıllığı məlumatları müxtəlif tələblər tələb edir. silisiumda həyatlarının sirrini açmaq üçün alətlər. Təcrübə yolu ilə istehsal edilən nukleotid ardıcıllığı məlumatlarının böyük miqdarı EMBL-EBI (Avropa Bioinformatika İnstitutu, http: //www.ebi.ac.uk), DDBJ (Yaponiyanın DNT Məlumat Bankı, http://www.ddbj.nig.ac.jp) və GenBank (Milli Biotexnologiya Məlumat Mərkəzi, http://www.ncbi) .nlm.nih.gov). [4],[5],[6] Silikonda alətlər bioloji tədqiqatın tərkib hissəsi olmuşdur ki, onlar çox qısa müddət ərzində bioloji məlumatlardan mənalı məlumatı aşkar etmək üçün nəzərdə tutulmuşdur. Baxmayaraq ki silisiumda alətlər qədər etibarlı nəticələr ortaya qoya bilməzin vitro və yain vivo çox baha başa gələn və vaxt aparan tədqiqatlar, lakin bioinformatika analizləri hələ də bahalı tədqiqatların aparılması üçün məlumatlı qərar qəbul etməyi asanlaşdıra bilər. [7],[8] Lakin, bir çox hallarda, yalnız silisiumda alətlər bioloji tədqiqatın suallarına cavab vermək qabiliyyətinə malikdir. Bu vasitələrin inkişafı bioinformatika və hesablama biologiyası sahəsinin mühüm hissəsidir. Çoxlu sayda silisiumda IA-ların genomik və təkamül analizi üçün alətlər hazırlanmışdır, lakin genomik məlumatların təhlili üçün müvafiq alətin seçilməsi statistik və hesablama alqoritmləri haqqında güclü bilik tələb edir. Beləliklə, qeyri-hesablamalı biologiya tədqiqatçıları üçün uyğun olanı seçmək çox çətindir.

Yuxarıda göstərilən faktların işığında, IA-ların müxtəlif genomik və təkamül analizləri üçün müxtəlif bioinformatika vasitələrinin əhəmiyyətini və düzgünlüyünü araşdırmaq çox zəruridir. Bu icmalda IA-ların genomik və təkamül təhlili üçün müxtəlif bioinformatika vasitələri müzakirə edilmişdir ki, bu da qeyri-bioinformatika fonunun IA tədqiqatçılarına öz işləri üçün uyğun aləti seçməkdə faydalı olacaqdır.

Ardıcıllığın identifikasiyası və ya oxşarlıq axtarışı

DNT ardıcıllığının identifikasiyası və ya oxşarlıq axtarış vasitələri (SSTs) bioloji tədqiqatların ilk ən vacib proqramlarıdır və nəticədə yaxın qohum olan orqanizmlər haqqında məlumat verməklə, elm adamlarına növlərin eyniliyi və təsnifatı haqqında düzgün qərar qəbul etməyə kömək edir. Bu alətlər verilmiş sorğu DNT ardıcıllığı üçün verilənlər bazalarında oxşar DNT ardıcıllıqlarını axtarır. Hər bir nukleotid verilənlər bazası ardıcıllıqla oxşarlıq axtarışını həyata keçirmək üçün özünəməxsus SST ehtiva edir. BLAST, FASTA və ENA axtarışı ən populyar SST ardıcıllığıdır. [9],[10] Bu üç alət arasında BLAST ardıcıllıqla oxşarlıq axtarışı üçün bir çox variantları ehtiva edən çox səmərəli proqramdır. Burada yalnız BLAST-ın nukleotid ardıcıllığı oxşarlıq axtarış proqramları müzakirə edilmişdir. BLAST nukleotid və zülal ardıcıllığının oxşarlığının axtarışı üçün alətlər qrupu olan əsas yerli hizalama axtarış aləti deməkdir. Nukleotid BLAST (BLASTn) sorğu ardıcıllığı kimi nukleotid ardıcıllığını (genom ardıcıllığı) götürən və NCBI verilənlər bazasında oxşar DNT ardıcıllıqlarını axtaran vasitələrdən biridir. [11] Tədqiqatçıların meqablast, bitişik meqablast və BLASTn kimi optimallaşdırma proqramının növünü seçmək seçimləri var. Meqablast növlərin identifikasiyası və növlərarası müqayisə üçün çox faydalı olan çox oxşar ardıcıllıqlar axtarır. Bitişik meqablast seçiminin seçilməsi daha çox oxşar olmayan ardıcıllıqları axtarır və növlər arası müqayisə üçün istifadə edilə bilər. BLASTn seçimi NCBI verilənlər bazasında bir qədər oxşar ardıcıllıqların axtarışı üçün istifadə olunur. BLAST paketinin BLASTx proqramı nukleotid sorğusu ilə kodlanmış potensial protein məhsullarını müəyyən etmək üçün istifadə olunur. [12] Nukleotid ardıcıllığının təhlilinin tBLASTx proqramı kodlaşdırma potensialına əsasən sorğuya oxşar nukleotid ardıcıllıqlarını müəyyən etmək üçün istifadə edilə bilər. [12]

İA-ların genomlarında genlərin identifikasiyası onların ardıcıllıq layihələrinin əsas məqsədidir. Genlərin və onların mövqelərinin orijinal proqnozu İA-ların böyüməsinin, sağ qalmasının və virulentliyinin molekulyar mexanizmini başa düşmək üçün faydalı ola bilər. Bundan əlavə, bu məlumatlar molekulyar diaqnostika dəstləri və potensial dərmanlar hazırlamaq üçün istifadə edilə bilər.in vitro müvafiq olaraq IA-ların infeksiyalarının müəyyən edilməsi və müalicəsi. Açıq oxu çərçivəsi (ORF) orqanizmin genom ardıcıllığı məlumatlarında zülal kodlayan bölgənin proqnozlaşdırılması üçün ən yaxşı fərziyyədir. Başlanğıc kodonu ilə növbəti dayanacaq kodonu arasındakı genom ardıcıllığının bölgəsidir. [13] ORF-nin proqnozlaşdırılması üçün müxtəlif alətlər hazırlanmışdır, lakin Vikipediyaya görə, ORF tapıcı, ORF tədqiqatçısı və ORF proqnozlaşdırıcısı ORF-lərin effektiv proqnozlaşdırılması üçün ən güclü alətlərdir. [14],[15],[16] Open Reading Frame Finder (ORF Finder) verilmiş nukleotid ardıcıllığında bütün mümkün ORF-ləri proqnozlaşdırır. [17] ORF müstəntiqi, verilmiş DNT ardıcıllığında bütün ORF-ləri tapan və ardıcıllıqdakı müvafiq mövqelərini elan etməklə onları müvafiq zülal ardıcıllığına çevirən qrafik istifadəçi interfeysi proqramıdır. [17]

İA-ların genomlarının və ya gen ardıcıllığının uyğunlaşdırılması onların iki və ya ikidən çox növ arasında qohumluq faizi və variasiyaları haqqında maraqlı məlumat verir. İki ardıcıllıq arasında düzülmə (cüt-cüt ardıcıllıqla düzülmə) qorunan və dəyişən bölgələri proqnozlaşdırır və eyni zamanda faiz oxşarlığını təmin edir. İkidən çox ardıcıllıq arasında uyğunlaşma (çox ardıcıl düzülmə [MSA]) yalnız qorunan və dəyişən bölgələr haqqında məlumat vermir, həm də filogenetik analiz üçün məlumat yaradır. Emboss kiçik DNT sekanslarının cüt-cüt sıralanması (qlobal və yerli) üçün ən güclü proqramdır. Emboss http://www.ebi.ac.uk/Tools/emboss/ saytında mövcuddur. wgVISTA iki mikrob orqanizminin [18],[19] genom məlumatlarını (uzunluğu 10 meqabaza qədər) müqayisə etmək üçün istifadə edilən proqram paketidir və http://genome.lbl.gov/cgi-bin/WGVistaInput ünvanında mövcuddur. Eynilə digər proqram paketi mVISTA iki və ya daha çox orqanizmin iki və ya daha çox nukleotid ardıcıllığının müqayisəsi üçün istifadə olunur və http://genome.lbl.gov/cgi-bin/GenomeVista ünvanında mövcuddur. [18],[19] mVISTA, genom ardıcıllığının uyğunlaşdırılmasının əhəmiyyətli və təmiz nəticələrini təmin edən, uyğunlaşma nəticələrinin müxtəlif qətnamə səviyyələrində təmsil olunmasına imkan verən onlayn proqramdır. Qlobal ikili, çoxlu və qlobal (yenidən təşkil edilən qlobal) uyğunlaşdırma alətlərinə çıxış təklif edir. AVID (ixtiyari uzunluqlu DNT ardıcıllığının qlobal düzülməsi üçün), [21] LAGAN (cüt və MSA üçün), [22] və Shuffle-LAGAN (qlobal uyğunlaşma çərçivəsində yenidən təşkili tapmaq üçün) proqramı mVISTA-ya daxil edilmişdir. daha yaxşı nəticələr. [20] DNASTAR (https://www.dnastar.com/t-sub-solutions-molecular-biology-sequence-alignment.aspx) MUSCLE, Mauve, MAFFT, Clustal daxil olmaqla müxtəlif düzülmə alqoritmləri vasitəsilə DNT ardıcıllığını hizalayan proqramdır. Omega və ən yaxşı nəticələr əldə etmək üçün bir çox başqa proqramlar. Avropa Bioinformatika İnstitutu (EBI) http://www.ebi.ac.uk/Tools/ ünvanında mövcud olan Clustal Omega, Kalign, MAFFT, MUSCLE, MView, T-Coffee və MSA üçün WebPRANK kimi bir sıra proqramlar təklif edir. msa/. Clustal Omega, 4000-ə qədər ardıcıllığın və ya 4 MB ardıcıllıq məlumat faylının orta-böyük düzülmələrini yerinə yetirən MSA alətidir. [23] Kalign MSA aləti 2000-ə qədər ardıcıllığın və ya 2 MB ardıcıllıq məlumat faylının uyğunlaşdırılmasını həyata keçirə bilən çox sürətli alətdir. [24] 500 ardıcıllığı və ya maksimum fayl ölçüsünü 1 MB-a qədər uyğunlaşdırmaq imkanı olan orta-böyük düzülmələr üçün MAFT aləti. [25] Muscle MSA aləti orta düzülmələr və 4000-ə qədər ardıcıllıq və ya 4 MB-lıq ardıcıllıq məlumat faylı üçün uyğundur. [26] Əzələ zülal ardıcıllığının uyğunlaşdırılması üçün ən yaxşısıdır. MView aləti ardıcıllıqla oxşarlıq axtarış nəticəsini MSA-ya çevirir və ya MSA-nı yenidən formatlayır. [27] O, 4000-ə qədər ardıcıllığı və ya 4 MB ardıcıllıq məlumat faylını uyğunlaşdıra bilər. Kiçik hizalamalar üçün T-Coffee proqramı 500 ardıcıllığı və ya maksimum 1 MB fayl ölçüsünü uyğunlaşdıra bilən çox uyğundur. [28] WebPRANK əlavələr və silinmələri yerləşdirməyə kömək etmək üçün təkamül məlumatlarından istifadə edən yeni filogeniyadan xəbərdar MSA alətidir. [29] Yuxarıda təsvir edilən bütün MSA alətləri tələblərinə uyğun olaraq istifadə oluna bilən ən populyar alətlərdir.

DNT motivinin kəşfi və təhlili

DNT ardıcıllığı motivləri təkamül zamanı qorunub saxlanmış İA-ların funksional atributları haqqında çoxlu prestijli məlumatları ehtiva edən DNT-nin qısa seqmentidir. İA-ların DNT ardıcıllığının motivlərinin müəyyən edilməsi alimə müxtəlif növ IA infeksiyaları üçün yeni effektiv dərmanlar hazırlamaq və inkişaf etdirmək üçün əhəmiyyətli məlumat verə bilər. [30],[31],[32],[33] Motif Elicitation (MEME) üçün Çoxlu EM veb portalına uyğun gəlir (http://meme-suite.org/ ünvanında mövcuddur) motivin müəyyənləşdirilməsi və təhlili alətlərinin toplusudur. . [34],[35],[36] MEME, Boşluqlu Motiflərin Yerli Uyğunluğu (GLAM2), Diskriminativ Müntəzəm İfadə Motif Yaradılması (DREME) və MEME-ChIP motivlərin kəşfi üçün alətlərdir. [37],[38],[39],[40],[41] MEME bir-birinə bağlı DNT ardıcıllığı dəstində yeni, boşluqsuz motivlərin müəyyən edilməsi üçün çox güclü bir vasitədir. Defolt olaraq, o, təxminən 6󈞞-dən ibarət minimum üç motivi axtarır, halbuki istifadəçi motiv kəşfi üçün öz parametrlərini müəyyən edə bilər. GLAM2 bir qrup giriş DNT məlumatında boşluqlu motivləri tapır. GLAM2 təkrar analizi ilə bir neçə dəfə ən yaxşı potensial motivi kəşf etməyə çalışır. Beləliklə, GLAM2 MEME-dən daha yaxşıdır. DREME ChIP-seq təcrübəsindən əldə edilən böyük DNT ardıcıllığı məlumat dəstlərində motivləri axtarır. MEME-ChIP aləti ChIP-seq və CLIP-seq təcrübələrindən əldə edilən böyük nukleotid verilənlər bazasında motivləri aşkar edir və təhlil edir. [42] FIMO, GLAM2SCAN və MAST (Motif Alignment and Search Tool) ardıcıllıq verilənlər bazasında motivin mümkün baş vermələrini tapmaq üçün alətlərdir və buna görə də bunlar motiv axtarış alətləri adlanır. [41],[43],[44] SpaMo və CentriMo motiv zənginləşdirmə təhlili üçün alətlərdir. [45],[46],[47] MCAST (Motif Cluster Alignment and Search Tool) motivlər dəstinin üst-üstə düşməyən hadisələrinin statistik əhəmiyyətli klasterləri üçün ardıcıllıq verilənlər bazasında axtarış aparan motiv klasterinin təhlili alətidir. [48] ​​TOMTOM aləti məlum DNT ardıcıllığı motivləri məlumat bazasında DNT motivinin müqayisəsi üçün istifadə olunur. [34],[35],[49] GOMO (Motiflər üçün Gen Ontologiyası) proqramı DNT-ni bağlayan motivlərin funksional analizi üçün nəzərdə tutulmuşdur. [50]

Mərkəzi dogma hüceyrə transkripsiyasının (DNT-dən RNT-yə), tərcümənin (RNT-dən proteinə) və əks transkripsiyanın (RNT-dən DNT-yə) üç müxtəlif molekulyar prosesi ilə birbaşa əlaqəlidir. Beləliklə, DNT-ni RNT-yə, RNT-ni zülala, RNT-ni DNT-yə çevirə bilən hesablama vasitələrini mərkəzi dogma alətləri adlandırmaq olar. Bu məqsədlə bir çox proqramlar hazırlanmışdır ki, bunlardan biri də mərkəzi doqma ilə bağlı hesablamaları yerinə yetirə bilən bioloji məlumatların təhlili proqramıdır. [51]

Mutasiya və rekombinasiya analizi

İA-ların mutasiya analizi onların mənşəyini, virulentliyini və təkamülünü bilmək üçün çox faydalı olan genomlarında mümkün dəyişiklikləri yoxlamaq üçün fikir verir. O, həmçinin bir qrup IA arasında genetik müxtəlifliyi tapmağa kömək edir. Mutasiya və rekombinasiya analizi alətləri arasında Molekulyar Təkamül Genetika Analizi (MEGA5) və DNASP müvafiq olaraq mutasiya və rekombinasiya ilə bağlı hesablamalar üçün çox məşhur alətlərdir. [52],[53],[54],[55],[56],[57],[58],[59]

Təkamül təhlili

İA-ların genomik ardıcıllıqları onların mənşəyi və zülallar/fermentlər kimi makromolekullar üzərində funksional məhdudiyyətlər haqqında zəngin məlumatları ehtiva edir. [2] İA-ların genomik ardıcıllığında təkamül yeni ştammlar/növlər yarada bilər ki, bu da öz ana ştammlarından/növlərindən daha virulent ola bilər. [1],[60],[61],[62] Beləliklə, IA-ların filogenetik təhlili onların mənşəyini və təkamül tarixini anlamaq üçün vacibdir. Bu məqsədlə filogenetik analiz alətləri haqqında yaxşı bilik tələb olunur, buna görə də ən populyar alətlər və onların üstünlükləri və çatışmazlıqları müzakirə edilmişdir. Phylogeny Inference Package (PHYLIP) Vaşinqton, Seattle Universitetinin Genom Elmləri Departamentinin və Biologiya Departamentinin alimləri tərəfindən hazırlanmış təkamül analizi üçün ən populyar istifadə olunan proqram paketidir. Bu, boşalma və konsensus ağacları daxil olmaqla, parsimoniya, məsafə matrisi və ehtimal metodları daxil olmaqla müxtəlif üsullardan istifadə edərək molekulyar ardıcıllığı təhlil edən sərbəst mövcud proqram paketidir. [63],[64] Filogeniyalardan (HyPhy) istifadə edərək fərziyyə testi bioloji ardıcıllıqların filogenetik təhlili, xüsusən də ardıcıllıq məlumatlarından seçimin gücünə dair nəticə çıxarmaq üçün sərbəst paylanmış proqram paketidir. Bundan əlavə, HyPhy, filogenetik çərçivədə diskret dövlət Markov modellərini həyata keçirmək və fərdiləşdirmək üçün çevik toplu dilə malikdir. [65] MEGA molekulyar səviyyədə orqanizmlərin təkamül analizi üçün çox məşhur proqram paketidir. Bu paketin müxtəlif versiyaları akademiklər üçün sərbəstdir. O, təkamül biologiyası sahəsində ən çox alqoritm olan təkamül analizi məqsədilə bir neçə metod və proqram həyata keçirir. [59]

Yoluxucu agentlərin genomu və təkamül təhlili onların mənşəyi, böyüməsi, sağ qalması və virulentlik xarakterini anlamaq üçün çoxlu mənalı məlumatları ortaya qoyur. O, həmçinin potensial terapevtik hədəfləri seçmək və həmçinin onların infeksiyalarının müalicəsi üçün yeni dərmanların kəşfi üçün vacib biliklər verir. Yoluxucu agentlərin genomik və təkamül təhlili üçün bu məqalədə müzakirə edilən ən son bioinformatika vasitələri, genom tədqiqatçılarına həyat sirlərini açmaq üçün İA-ların genomik və təkamül analizinin ən uyğun alətini seçməkdə faydalı olacaqdır.

Bu məqalənin müəllifləri Aqra, Hindistan Milli JALMA Cüzam və Digər Mikobakteriya Xəstəlikləri İnstitutunu (ICMR) tanıyırlar.


Mücərrəd

Neandertalların qardaş qrupu olan Denisovalılar, barmaq falanksından nüvə genomu ardıcıllığı əsasında təsvir edilmişdir (Denisova 3) Altay dağlarında Denisova mağarasında tapılmışdır. Bu günə qədər təsvir edilən yeganə digər Denisovan nümunəsi molardır (Denisova 4) eyni saytda tapıldı. Bu dişinkinə bənzər bir mtDNT ardıcıllığı daşıyır Denisova 3. Burada nüvə DNT ardıcıllığını təqdim edirik Denisova 4 və morfoloji təsviri, həmçinin mitoxondrial və nüvə DNT ardıcıllığı məlumatları, başqa bir molyardan (Denisova 8) 2010-cu ildə Denisova mağarasında tapıldı. Bu yeni azı dişinə bənzəyir Denisova 4 çox böyük olması və neandertallara və müasir insanlara xas xüsusiyyətlərin olmaması. İki azı dişindən nüvə DNT ardıcıllığı ilə bir təbəqə meydana gətirir Denisova 3. mtDNT-si Denisova 8 daha çox fərqlidir və digər iki nümunənin mtDNT-lərinə nisbətən daha az əvəzetmə toplamışdır ki, bu da Denisovalıların uzun müddət ərzində regionda mövcud olduğunu göstərir. Üç Denisovalılar arasında nüvə DNT ardıcıllığı müxtəlifliyi altı Neandertal arasındakı fərqliliklə müqayisə edilə bilər, lakin indiki insanlardan daha aşağıdır.

2008-ci ildə bir uşaqdan barmaq falanksı (Denisova 3) Cənubi Sibirdə Altay dağlarında Denisova mağarasında tapılıb. Mitoxondrial genom, təxminən 1 milyon il əvvəl (1) və ya indiki insan və Neandertal mtDNA-larının ortaq əcdadından təxminən iki dəfə çox əvvəl indiki insan və Neandertal mtDNT-ləri ilə ortaq əcdadı paylaşırdı. Ancaq nüvə genomu bu fərdin neandertalların qardaş qrupuna aid olduğunu ortaya qoydu. Bu qrup sümüyün aşkar edildiyi yerə görə Denisovalılar adlandırılmışdır (2, 3). Denisovanın genomunun təhlili göstərdi ki, Denisovalılar DNT-nin 5%-i Okeaniyadakı müasir insanların genomlarına (2 ⇓ –4), təxminən 0,2%-i yerli Amerikalıların və materik asiyalıların genomlarına töhfə veriblər. 5).

2010-cu ildə Denisova mağarasında davam etdirilən arxeoloji işlər ayaq barmaq falanksının aşkarlanması ilə nəticələndi (Denisova 5), genom ardıcıllığı əsasında Neandertal olaraq təyin olundu. Genom ardıcıllığı Denisovalıların və Neandertalların bir-biri ilə və müasir insanlarla əlaqələrinin ətraflı təhlilinə imkan verdi. İnsan mutasiya sürəti ilə bağlı qeyri-müəyyənlik səbəbindən təqvim illəri baxımından fərqlilik vaxtları əmin olmasa da (6), sümük göstərdi ki, Denisovan və Neandertal populyasiyaları bir-birindən indiki dövrlər arasında ən dərin fərqlilikdən dörd dəfə daha geriyə ayrılıblar. -gündüz insan populyasiyaları indiki insanların əcdadlarından ayrılmış iki arxaik qrupun əcdadları indiki populyasiyalardan altı dəfə çox əvvəl meydana gəlmişdir (5). Bundan əlavə, genomun ən az 0,5%-i Denisova 3 fərd daha qərbdəki neandertallardan daha çox Denisova mağarasındakı Neandertallarla yaxın qohum olan Neandertal populyasiyasından törəmişdir (5).

Denisovanın qalıqları bu günə qədər yalnız Denisova mağarasında tanınsa da, Denisovalıların Asiya və Okeaniyadakı müasir populyasiyaların əcdadlarına DNT verməsi faktı onu deməyə əsas verir ki, Altay dağlarından başqa, onlar Altay dağlarının başqa yerlərində də yaşamış ola bilərlər. Asiya. Barmaq falanksına əlavə olaraq molar (Denisova 4) 2000-ci ildə mağarada tapılmışdır. Dişdəki DNT-nin 0,2%-dən az hissəsi hominin mənbəyindən qaynaqlansa da, mtDNT ardıcıllıqla tərtib edilmiş və barmaq falanksı mtDNA-dan yalnız iki mövqedə fərqlənmişdir ki, bu da onun Denisovalı ola biləcəyini göstərir. (2, 3). Bu molar həm son Neandertallardan, həm də müasir insanlardan fərqli bir neçə primitiv morfoloji xüsusiyyətlərə malikdir. 2010-cu ildə başqa molar (Denisova 8) Denisova mağarasında tapılmışdır. Burada morfologiyanı və mtDNT-ni təsvir edirik Denisova 8 və hər iki azı dişindən nüvə DNT ardıcıllığını təqdim edir.


Hesablama genomikası ilə R

2016-cı ilə qədər ardıcıllıqla 100 heyvan genomu. Bunlara əlavə olaraq, ChIP-seq, RNT-seq və s. kimi petabaytlarla köməkçi genomik məlumatlar istehsal edən fərdi laboratoriyalardan və ya konsorsiumlardan çoxlu tədqiqat layihələri var.

Genomları və onlarla əlaqəli məlumatları vizuallaşdırmaq üçün iki tələb var: 1) ardıcıl genomu olan bir növlə işləməyi bacarmalısınız və 2) bu genomda annotasiyaya sahib olmaq istəyirsiniz, yəni ən azı , genlərin harada olduğunu bilmək istəyirsən. Ardıcıllıqdan sonra əksər genomlar tez bir zamanda gen proqnozları ilə şərh olunur və ya məlum gen ardıcıllıqları onlara uyğunlaşdırılır və siz həmçinin funksional elementləri süzmək üçün digər növlərə konservasiya edə bilərsiniz. Əgər model orqanizm və ya insanla işləyirsinizsə, populyasiyada ümumi olan tənzimləyici bölgələr, ncRNA-lar və SNP-lər kimi funksional bölgələri ayırmağa kömək edəcək çoxlu köməkçi məlumatınız olacaq. Və ya xəstəliyə və ya toxumaya aid məlumatlarınız ola bilər. Orqanizm üzərində nə qədər çox işlənilsə, bir o qədər çox köməkçi məlumat əldə edəcəksiniz.

1.5.0.1 Genom brauzerləri vasitəsilə genom ardıcıllığına və annotasiyalara daxil olmaq

Genomika ilə işləmək niyyətində olan biri olaraq, bioloji nəticələr çıxarmaq və ya sadəcə olaraq genomla maraqlanan bölgələri vizual olaraq yoxlamaq üçün böyük miqdarda məlumatı vizuallaşdırmalı olacaqsınız. Bütün əlavə məlumat dəstləri ilə genom halına ayrı-ayrılıqda baxmaq bir fərziyyə hazırlamaq və məlumatları anlamaq üçün zəruri bir addımdır.

Bir çox genomlar və onlarla əlaqəli məlumatlar genom brauzerləri vasitəsilə mövcuddur. Genom brauzeri, genomu və onunla əlaqəli bütün mövcud məlumatları vizuallaşdırmağa kömək edən veb sayt və ya proqramdır. Genom brauzerləri vasitəsilə siz genlərin bir-birinə və digər funksional elementlərə münasibətdə harada olduğunu görə biləcəksiniz. Gen quruluşunu görə biləcəksiniz. Siz konservasiya, təkrar məzmun və SNP kimi köməkçi məlumatları görə biləcəksiniz. Burada bəzi məşhur brauzerləri nəzərdən keçiririk.

UCSC genom brauzeri: Bu, Kaliforniya Universiteti, Santa Cruz tərəfindən http://genome.ucsc.edu/ ünvanında yerləşən onlayn brauzerdir. Bu, bir çox növ üçün genomları və qeydləri ehtiva edən interaktiv veb saytdır. Siz maraqlandığınız növlər üçün genləri və ya genom koordinatlarını axtara bilərsiniz. O, adətən çox həssasdır və böyük həcmdə məlumatları vizuallaşdırmağa imkan verir. Bundan əlavə, brauzerlə əlaqəli olaraq istifadə edilə bilən bir çox digər vasitələrə malikdir. Ən faydalı vasitələrdən biri də UCSC Cədvəl Brauzeri, bu, brauzerdə gördüyünüz bütün məlumatları, o cümlədən ardıcıllıq məlumatlarını çoxsaylı formatlarda endirməyə imkan verir. İstifadəçilər verilənləri yükləyə və ya istifadəçiyə məxsus məlumatları vizuallaşdırmaq üçün məlumatlara keçidlər təqdim edə bilərlər.

Ansambl: Bu, Avropa Bioinformatika İnstitutu və Böyük Britaniyada Wellcome Trust Sanger İnstitutu tərəfindən idarə olunan digər onlayn brauzerdir, http://www.ensembl.org. UCSC brauzerinə bənzər olaraq, istifadəçilər bir çox növdən olan genləri və ya genomik koordinatları görüntüləyə bilərlər və o, həmçinin köməkçi məlumatlar ilə gəlir. Ansambl ilə əlaqələndirilir Biomart UCSC Cədvəl brauzerinə bənzəyən alətdir və bir çox formatda bütün köməkçi məlumatlar dəsti daxil olmaqla genom məlumatlarını yükləyə bilər.

IGV: İnteqrasiya edilmiş genomik görüntüləyici (IGV) Broad institutu (https://www.broadinstitute.org/igv/) tərəfindən hazırlanmış masaüstü proqramdır. O, onlayn brauzerlərdə görmək daha çətin olan böyük həcmdə yüksək məhsuldarlıqlı ardıcıllıqla məlumatların öhdəsindən gəlmək üçün hazırlanmışdır. IGV yerli ardıcıllıq nəticələrinizi masaüstü kompüterinizdə onlayn annotasiya ilə birləşdirə bilər. Bu, ardıcıllıq məlumatlarına, xüsusən də düzülmələrə baxarkən faydalıdır. Yuxarıda adı çəkilən digər brauzerlər də oxşar xüsusiyyətlərə malikdir, lakin siz böyük ardıcıllıq məlumatlarınızı brauzerlər tərəfindən baxılmadan əvvəl haradasa onlayn olaraq əlçatan etməli olacaqsınız.

1.5.0.2 Yüksək məhsuldarlıqlı analizlər üçün məlumat anbarları

Genom brauzerlərində çoxlu köməkçi yüksək ötürücülü məlumatlar var. Bununla belə, daha çox ictimai yüksək ötürücülü məlumat dəstləri mövcuddur və onlar, şübhəsiz ki, genom brauzerləri vasitəsilə mövcud deyil. Bir qayda olaraq, nəşrlə əlaqəli hər bir yüksək məhsuldarlığa malik verilənlər toplusu ictimai arxivlərdə saxlanılmalıdır. Məlumatları depozit etmək üçün istifadə etdiyimiz iki əsas ictimai arxiv var. Onlardan biri Gen İfadəsi Omnibus (GEO) http://www.ncbi.nlm.nih.gov/geo/ ünvanında, digəri isə Avropa Nukleotid Arxivi (ENA) http://www.ebi.ac.uk/ena ünvanında yerləşir. Bu repozitoriyalar yüksək məhsuldarlığa malik verilənlər dəstlərini qəbul edir və istifadəçilər bu ictimai məlumat dəstlərini sərbəst şəkildə yükləyə və öz tədqiqatları üçün istifadə edə bilərlər. Bu depolardakı bir çox məlumat dəsti öz xam formatındadır, məsələn, sekvenserin əsasən təmin etdiyi format. Bəzi məlumat dəstlərində də işlənmiş məlumatlar olacaq, lakin bu, norma deyil.

Bu depolardan başqa, müəyyən genom biologiyasına və ya xəstəliklə bağlı problemlərə həsr olunmuş çoxsaylı çoxmillətli konsorsiumlar var və onlar öz məlumat bazalarını saxlayır və işlənmiş və xam məlumatlara çıxışı təmin edirlər. Bu konsorsiumlardan bəziləri aşağıda qeyd edilmişdir.


Beynəlxalq nukleotid ardıcıllığı verilənlər bazası əməkdaşlığı

Beynəlxalq Nukleotid Ardıcıllığı Verilənlər Bazasının Əməkdaşlığı (INSDC http://www.insdc.org/) >30 il ərzində nukleotid ardıcıllığı məlumatlarının və metaməlumatların toplanması və təmin edilməsi üçün əsas infrastruktur olmuşdur. Üç tərəfdaş təşkilat, Yaponiyanın Mishima şəhərindəki Milli Genetika İnstitutunda DNT Məlumat Bankı (DDBJ), Hinxton, Böyük Britaniyada, Avropa Molekulyar Biologiya Laboratoriyasının Avropa Bioinformatika İnstitutunda (EMBL-EBI) Avropa Nukleotid Arxivi (ENA) və GenBank Milli Biotexnologiya İnformasiya Mərkəzində (NCBI), Milli Tibb Kitabxanasında, Bethesda, Merilend, ABŞ-da Milli Sağlamlıq İnstitutları INSDC-ni təkcə elmin deyil, bütün dünya ictimaiyyətinin rifahı üçün birgə saxlayırlar.

© Müəllif(lər) 2020. Nuclein Acids Research adından Oxford University Press tərəfindən nəşr edilmişdir.

Rəqəmlər

Xammalın 10 illik məcmu artımı…

Xam növbəti nəsil ardıcıllıq məlumatlarının məcmu 10 illik artımı: ümumi baytlar (xırdalanmış) və…


Elmi giriş

DNT ardıcıllığı orqanizmin unikal irsi məlumatının nukleotid turşusu ardıcıllığını müəyyən edir. Çıxış olaraq, tam DNT genomunun fraqmentləri olan yüzlərlə və ya minlərlə qısa, xətti mikrob DNT parçaları yaradır. Buna görə də, DNT ardıcıllığından sonrakı addım hesablama yanaşmalarından istifadə edərək, həmin fraqmentləri DNT-nin bitişik fraqmentlərinə (kontigs) birləşdirməyi (birləşdirməyi) əhatə edir.

Tək bir bakteriyanın genomunun yenidən qurulması

Tək bir bakteriyanın genomu ümumiyyətlə:

  • dairəvi
  • iki telli
  • dəyişən uzunluqdadır, lakin ümumiyyətlə ölçüsündə milyon baza cütünə bərabərdir

Tez-tez istifadə olunan DNT ardıcıllığı texnologiyaları (sözdə 2-ci nəsil ardıcıllığı tətbiq etməklə) DNT parçaları yaradır:

Buna görə də, genomun yenidən qurulması vəzifəsini bir qədər "çətin" tapmaca problemi kimi düşünə bilərsiniz: biz onun parçalarından bütöv bir təsviri yenidən qurmalıyıq.

Tək bir bakteriyanın genom ardıcıllığını yenidən qurmağı hədəfləyərkən bunu necə edə bilərik? Ən sadə halda, orqanizmimiz artıq ardıcıllıqla sıralanıb və onun genom ardıcıllığı ictimai bir anbarda saxlanılıb (məsələn, EMBL-EBI-nin Avropa Nukleotid Arxivi, ENA). Bu halda, tapmaca qutusunun qapağındakı şəklə baxaraq etdiyiniz kimi, biz “tamaşanı” yenidən qurmağa kömək etmək üçün bu ardıcıllıqdan istifadə edə bilərik. Bu yanaşma "xəritələmə" adlanır - müəyyən bir DNT parçasının haradan gəldiyini məlum bir istinadla müqayisə edərək müəyyən etmək.

Unutmayın ki, bu, açıq-aydın sadə bir yanaşmadır: onların çox yüksək mutasiya sürətinə görə, demək olar ki, heç vaxt ardıcıllaşdırılmış bir bakteriyanın genomu istinad genomunun genomu ilə tamamilə eyni deyil. Buna görə də, xəritələşdirmənin mükəmməl olmayacağını və uyğunsuzluqların özləri, kifayət qədər sübut olunarsa, genomun ən maraqlı nöqtələri ola biləcəyini qəbul etməyə hazır olmalıyıq.

Mürəkkəb mikrob icmalarının genomunun yenidən qurulması

Bağırsaq mikrobiomunuz kimi mürəkkəb bir mikrob icmasında genomları yenidən qurarkən əlavə çətinliklər hansılardır?

  1. Bir-birinə qarışan çoxlu genomlar var.
  2. Hansı ardıcıllığın hansı genoma aid olduğunu bilmirik.
  3. Cəmiyyətdəki hər bir bakteriyanın genomunu yenidən qurmağa kömək edəcək bir istinad genomumuz yoxdur.
  4. Ardıcıllıqların müəyyən bir “dərinliyi” olsa belə (yəni tapmacanın bir çox parçasını yığırıq), biz yəqin ki, bütün ardıcıllıqları toplamamışıq (yəni bütün təsvirin çatışmayan hissələri ilə qala bilərik).

Ətraf Mühit Ov Tüfənginin Sıralanması (ESS). (A) Yaşayış yerindən nümunə götürmə (B) süzgəcdən keçirən hissəciklər, adətən ölçüsü (C) DNT çıxarılması və lizisi (D) klonlaşdırma və kitabxana (E) klonların ardıcıllığı (F) ardıcıllığı.
John C. Wooley, Adam Godzik, Iddo Friedberg, CC BY 2.5, Wikimedia Commons vasitəsilə

Bu daha mürəkkəb problemi həll etmək üçün bir tapmaca ilə instinktiv olaraq nə edəcəyinizi xatırladan bir neçə strategiya var:

  • If there is some piece of the puzzle we have a reference for, we build that first.
  • If any of the pieces look “alike” (i.e. they are genetically similar, or, in the puzzle metaphor, they maybe have the same colour or pattern), we group them together.
  • If any of the pieces fit together very well (in the bioinformatics jargon, they can be “assembled” together), we assume they belong together.
  • If any of the pieces has a known function (in the puzzle metaphor, the corner or border pieces), we try to infer where they belong.

The problem of missing data

As mentioned, however, we might not have all the pieces we need to fully reconstruct the image. Since this image is the starting point to then investigate the bacterial composition in the sample (who is there) and subsequently their possible function (what they might be doing), take a second to think about the impact of the missing part of the data: aside from hampering a complete understanding of the microbial community, we must also understand that we can describe what we see, but we cannot claim any meaning from what we don’t see. Simply put, if I grab a few socks from my drawer and none of them is red, I cannot conclude that I have no red socks. Niyə? The overall complexity of the microbial community is too high for our sampling capacity therefore, we will end up with missing data.


ENAbling easy access to DNA sequence information

The European Nucleotide Archive (ENA) has been launched, consolidating three major sequence resources to become Europe's primary access point to globally comprehensive DNA and RNA sequence information. The ENA is freely available from the European Bioinformatics Institute (EMBL-EBI), a part of European Molecular Biology Laboratory.

Faster and cheaper DNA sequencing has led to previously unimaginable amounts of data being deposited in the public nucleotide sequence databases: today, ENA holds over 20 terabases of nucleotide sequence which, combined with associated information (annotation), occupies 230 terabytes of disk space. Carefully annotated and crosslinked sequence records from the EMBL Nucleotide Sequence Database (EMBL-Bank) form the backbone of the ENA. But importantly, ENA now also provides direct access to raw sequence data: the European Trace Archive contains raw data from electrophoresis-based sequencing machines and was previously maintained at the Wellcome Trust Sanger Institute the Sequence Read Archive (SRA) is a newly established repository for raw data from next-generation (array-based) sequencing platforms. Improved submission and data-access tools make it easier for ENA's users to share their sequence data.

"Large-scale DNA sequencing was previously the domain of a small number of specialist labs, but next-generation sequencing has made it accessible to the majority of molecular life scientists," explains Graham Cameron, the EMBL-EBI's Associate Director. "The launch of ENA reflects our continuing commitment to promoting scientific progress by providing global access to nucleotide sequence information. This has been central to EMBL's mission since the 1980s when we launched the EMBL Data Library."

Guy Cochrane, who leads the ENA team, stated that "ENA has been designed to provide our users with improved access both to annotated and to raw sequence data through the same user-friendly interface. It provides graphical browsing, web services, text search and a new rapid sequence similarity search. ENA also provides access to related information, with over 190 million cross references to external records, many of which are in other EMBL-EBI data resources."

The ENA team plans to launch many new features for the resource over the next twelve months, including enhancements to the user-friendly browser, improved interactive submissions tools and organism- and project-centred portals into ENA data.

Tim Hubbard, Head of Informatics at the Wellcome Trust Sanger Institute, said: "As major generators of DNA sequence data, it is important to us that the research community has ready access not only to annotated sequence information, but also to raw data. It's great to see the launch of ENA with new interfaces for users to this vast and rapidly growing body of information." Funding for the ENA is provided by EMBL, the Wellcome Trust and SLING, a Framework Programme 7 project coordinated by the EMBL-EBI and funded by the European Commission.


Enabling easy access to DNA sequence information

The European Nucleotide Archive (ENA) is launched today, consolidating three major sequence resources to become Europe's primary access point to globally comprehensive DNA and RNA sequence information. The ENA is freely available from the European Bioinformatics Institute (EMBL-EBI), a part of European Molecular Biology Laboratory.

Faster and cheaper DNA sequencing has led to previously unimaginable amounts of data being deposited in the public nucleotide sequence databases: today, ENA holds over 20 terabases of nucleotide sequence which, combined with associated information (annotation), occupies 230 terabytes of disk space. Carefully annotated and crosslinked sequence records from the EMBL Nucleotide Sequence Database (EMBL-Bank) form the backbone of the ENA. But importantly, ENA now also provides direct access to raw sequence data: the European Trace Archive contains raw data from electrophoresis-based sequencing machines and was previously maintained at the Wellcome Trust Sanger Institute the Sequence Read Archive (SRA) is a newly established repository for raw data from next-generation (array-based) sequencing platforms. Improved submission and data-access tools make it easier for ENA's users to share their sequence data.

"Large-scale DNA sequencing was previously the domain of a small number of specialist labs, but next-generation sequencing has made it accessible to the majority of molecular life scientists," explains Graham Cameron, the EMBL-EBI's Associate Director. "The launch of ENA reflects our continuing commitment to promoting scientific progress by providing global access to nucleotide sequence information. This has been central to EMBL's mission since the 1980s when we launched the EMBL Data Library."

Guy Cochrane, who leads the ENA team, stated that "ENA has been designed to provide our users with improved access both to annotated and to raw sequence data through the same user-friendly interface. It provides graphical browsing, web services, text search and a new rapid sequence similarity search. ENA also provides access to related information, with over 190 million cross references to external records, many of which are in other EMBL-EBI data resources."

The ENA team plans to launch many new features for the resource over the next twelve months, including enhancements to the user-friendly browser, improved interactive submissions tools and organism- and project-centred portals into ENA data.

Tim Hubbard, Head of Informatics at the Wellcome Trust Sanger Institute, said: "As major generators of DNA sequence data, it is important to us that the research community has ready access not only to annotated sequence information, but also to raw data. It's great to see the launch of ENA with new interfaces for users to this vast and rapidly growing body of information." Funding for the ENA is provided by EMBL, the Wellcome Trust and SLING, a Framework Programme 7 project coordinated by the EMBL-EBI and funded by the European Commission.


Nəticələr

We have shown that there is extensive variation in the level of nucleotide diversity across the genome of an avian species. This variation is seen in autosomal sequence and is thus unrelated to the well-known effects of sex linkage on genetic diversity (Hedrick 2007 Frankham 2012 ). Linked selection is likely to play a strong role in governing within-genome heterogeneity in diversity levels, with (variation in) recombination rate and density of targets of selection being primary determinants of the extent of linked selection. As far as we are aware, this study is the first to characterize genomewide nucleotide diversity through whole-genome resequencing of a large population sample and then use these real data to simulate how well genetic diversity would be captured by the use of genetic markers. We find that diversity estimation by sequencing a small number of amplicons is bound to be associated with large confidence intervals. Given the heterogeneity in diversity levels across the genome, gathering sequence data from many loci will increase the precision in diversity estimation. Naturally, one could ask whether molecular ecological studies will continue to be based on sequence data from a limited number of loci when genotyping-by-sequencing and whole-genome resequencing become increasingly feasible in many projects. However, even with the use of next-generation sequencing technologies, target capture approaches are cost-effective and can be used for a wide range of applications (Jones & Good 2016 ).

The ability to reliably estimate genetic diversity of different populations is critical for making conclusions about evolutionary processes. To end with an example (Gohli və b. 2013 ), recently reported an association between genetic diversity and female promiscuity in 18 passerine bird species based on sequence data from five introns (mean length ≈400 bp). One possible explanation to this would be that species with strong sexual selection for compatible genes (i.e. negative frequency-dependent selection for rare or dissimilar alleles) have relatively high levels of genetic diversity. The validity of this result was criticized by (Spurgin 2013 ) on several methodological grounds, including the precision of diversity estimates and the inference of species level diversity from sampling of individual populations (see also response to the criticism by (Lifjeld və b. 2013 ). Based on experiences from the present study, we note that more firm conclusions should have been possible to reach with more extensive sampling of genomic data, either confirming or disproving the idea of a relationship between genetic diversity and female promiscuity.


Müzakirə

BlobToolKit is a significant extension of the approach launched in BlobTools. In particular, by permitting user interaction with the rich data associated with each contig in the Viewer mode, BlobToolKit can enhance discovery of novel biology. The addition of real-time interaction addresses a criticism of the approach, relative to cluster-based methods such as Anvi’o (Eren və b. 2015), that it limits the amount of supporting data that can be included (Delmont and Eren 2016). We envisage three main uses for BlobToolKit. The first is in the research laboratory aiming to sequence for the first time the genome of a new species. BlobToolKit can be used during the assembly process, to filter contaminants and cobionts, and to explore issues such as haploid vs. diploid contigs, and patterns of coverage in different sequence read datasets (for example, comparing male and female read sets in heterogametic organisms). As part of an assembly workflow, BlobToolKit should ensure better quality assemblies with higher biological credibility.

The second use is in publication and visualization of published assemblies. The BlobToolKit Viewer generates publication quality images that are fully reproducible via the embedding of control parameters in the URL. These images should, we believe, become standard in reporting genome assemblies, and thus enhance the ease of assessment of assembly quality. We have worked to embed BlobToolKit views into the presentation of genome assemblies at the ENA for just this reason and believe that we have demonstrated that collaboration between tools developers and public databases is important in refining best practice in data publication. Journals may generate (or request that authors supply) BlobToolKit assessments of new assemblies submitted for publication, to aid review and speed publication of high quality data.

The third is in comparative and evolutionary genomics. With ongoing improvements in sequencing technologies and assembly software, genome assemblies are improving in quality and contiguity. Among other players, the Earth Biogenome Project (Lewin və b. 2018), 10K Vertebrate Genome Project (Genome 10K Community of Scientists 2009) and Tree of Life project (https://www.sanger.ac.uk/science/programmes/tree-of-life) collectively aim to generate chromosomally-contiguous reference genomes for (in the first instance) all known families of Eukaryota. BlobToolKit protocols can be used to explore these genomes for evidence of past horizontal gene transfer, for the presence of symbionts and parasites, and to explore chromosomal patterns of gene expression.

The difficulty we experienced in associating raw sequence read sets with submitted assemblies has led ENA to include a more apparent and thorough explanation of the benefits of and process for referencing reads during eukaryotic genome assembly submission to the repository. We advocate the practice of assembly submission along with associated reads to INSDC to enable downstream analysis and assembly contamination detection.

We aim to complete analysis of all public genomes in INSDC and post them to the BlobToolKit Viewer website at https://blobtoolkit.genomehubs.org/view in the near future, and then maintain currency with the flow of new genomes. The toolkit is under active development (see https://github.com/blobtoolkit) and we welcome feature requests and collaborations to expand and improve its capabilities.


Videoya baxın: Biologiya 6-cı sinif 12. Bitkinin törədici, örtük və mexaniki toxumaları (Dekabr 2022).