Format Newick stablo

Source: http://evolution.genetics.washington.edu/phylip/newicktree.html

Uvod

U Newick standard za zastupanje drveća u kompjuterski čitljivom obliku koristi prepiske između drveća i ugnežđenih zagrade, primetio 1857. čuveni engleski matematičar Arthur Cayley. Ako imamo ukorijenjen drvo:

[Tree of form (B,(A,C,E),D)]

zatim u stablo datoteku je predstavljena sljedeće sekvence za ispis znakova:

(B,(A,C,E),D);

Stablo završava sa zarezom. Na najniži čvor u ovom stablu je unutrašnjost čvor, a ne vrh. Interijer čvorovi su predstavljene par podudaraju zagradama. Između njih su reprezentacije od čvorova koji su odmah potomci tog čvora, odvojene zarezima. U iznad drveća, u neposrednoj potomci su B, drugi unutrašnjost čvor, i D. drugi unutrašnjost čvor predstavlja par zagrada, okružuje reprezentacije u njegovoj neposrednoj potomaka, A, C, i E. U našem primjeru ovih dogoditi biti tips, ali generalno bi mogli biti i unutrašnjost čvorova, a rezultat će biti dalje Gnežđenje zagrada, na bilo kojem nivou.

Savjeti predstavljaju njihova imena. A ime može biti bilo koji niz od štampati znakova osim praznine, dvotočke, zarezom, zagrade, i uglastim zagradama.

Jer možda želite uključiti praznu u ime, pretpostavlja se da je donje crte ( “_”) označava praznu; bilo koji od ovih u ime će se pretvoriti u prazan kada je pročitao u bilo kojem ime može biti i prazan:. drvo kao

(,(,,),);

je dozvoljeno. Drveće se može multifurcating na bilo kojem nivou.

dužine grana se može ugraditi u stablo stavljanjem pravi broj, sa ili bez decimalne točke, nakon čvora i prethodi debelog crijeva. Ovo predstavlja dužinu grane odmah ispod tog čvora. Tako je iznad drveća možda dužine predstavljeni kao:

(B:6.0,(A:5.0,C:3.0,E:4.0):5.0,D:11.0);

Drvo počinje na prvoj liniji datoteke, a može i dalje naknadne linije. To je najbolje da se nastavi na novu liniju, ako uopće, odmah nakon zarezom. Blanks se može ugraditi u bilo kojem trenutku, osim u sredini ime vrste ili dužine grane.

Navedeni opis je zapravo od podskup Newick standarda. Na primjer, unutrašnjost čvorovi mogu imati imena u taj standard. Ova imena prate pravo zagrade za to unutrašnjosti čvor, kao u ovom primjeru:

(B:6.0,(A:5.0,C:3.0,E:4.0)Ancestor1:5.0,D:11.0);

Primjeri

Da bi vam pomoći da shvatite ovo drvo reprezentacije, evo nekoliko stabala u gore obliku:

((raccoon:19.19959,bear:6.80041):0.84600,((sea_lion:11.99700, seal:12.00300):7.52973,((monkey:100.85930,cat:47.14069):20.59201, weasel:18.87953):2.09460):3.87382,dog:25.46154);

(Bovine:0.69395,(Gibbon:0.36079,(Orang:0.33636,(Gorilla:0.17147,(Chimp:0.19268, Human:0.11927):0.08386):0.06124):0.15057):0.54939,Mouse:1.21460):0.10;

(Bovine:0.69395,(Hylobates:0.36079,(Pongo:0.33636,(G._Gorilla:0.17147, (P._paniscus:0.19268,H._sapiens:0.11927):0.08386):0.06124):0.15057):0.54939, Rodent:1.21460);

A;

((A,B),(C,D));

(Alpha,Beta,Gamma,Delta,,Epsilon,,,);

(Ne) Jedinstvenost

U Newick standard ne čine jedinstven prikaz stabla, iz dva razloga. Prvo, da bi lijevo-desno potomaka čvora utiče na predstavljanju, iako je biološki nezanimljiva. Tako, na biolog

(A,(B,C),D);

je isto drvo kao

(A,(C,B),D);

koji je u okrenuti istog drveta kao

(D,(C,B),A);

a to je isto drvo kao

(D,A,(C,B));

i

((C,B),A,D);

Ukorijenjeni i neukorijenjenim drveća

Osim toga, standard predstavlja ukorijenjena stablo. Za mnoge biološke svrhe možda nećemo biti u mogućnosti da zaključi položaj korijena. Željeli bismo imati predstavljanje jednog neukorijenjenim stabla kada decribing zaključke u takvim slučajevima. Evo konvencije je jednostavno proizvoljno root stablo i prijaviti rezultat ukorijenjen stablo. tako

(B,(A,D),C);

bi bilo isto neukorijenjenim drvo kao

(A,(B,C),D);

i kao

((A,D),(C,B));

Široku upotrebu

Uprkos ovom ograničenja nonuniqueness čitljivost rezultat reprezentacije (za drveće skromnih dimenzija) i lakoću pisanja programa koji je pročitao su držali ovaj standard u širokoj upotrebi.

Konkurentima uključuju NEXUS standard za drveće (dio više opštih NEXUS standard za skupove filogenije podataka). Međutim, NEXUS zastupljenost stabala se zasniva na Newick standard – unutar NEXUS STABALA Block ćete pronaći … Newick drveća.

A manje standard Newick zasnovan je standardni PhyloXML, što je XML reprezentacija koristeći gnijezde na <kladus> … </ klada> tag parova umjesto zagrada.

Porijeklo

U Newick Standard je usvojen 26 Jun 1986 by neformalnom sastanku odbora saziva mene tokom Društvo za proučavanje evolucije sastanaka u Durham, New Hampshire i sastoji se od James Archie, William Nj.E. Dan, Wayne Maddison, Christopher Meacham, F. James Rohlf, David Swaffort, i ja. (Komisija nije bila aktivnost SSE niti odobrio ga). Razlog za ime je da je drugi i završni sjednice Odbora sastali u restoranu Newick u Dover, New Hampshire, i mi smo uživali u obrok od jastoga. Predstavljanje stablo je generalizacija jednog razvio Christopher Meacham 1984. godine za programe crtanje drvo koje je napisao za PHYLIP paket prilikom obilaska Seattle. Njegova posjeta je bila odsustva iz University of Georgia, koji na taj način indirektno dijelom finansira taj posao.

Ostali opisi standardu Newick

Nije bilo formalnog objavljivanja standarda Newick.

  • Gary Olsen je proizveo formalni opis je koji je dostupan ovdje.
  • Tu je i Wikipedia stranice na Newick Standard dostupan ovdje.