[Bioperl-l] Phylo/Phylip/Consense

Jose . joseguillin at hotmail.com
Tue Mar 23 13:30:44 EDT 2010




Hello,

I'm trying to use Phylo/Phylip/Consense, but I get the following message:


------------- EXCEPTION: Bio::Root::Exception -------------
MSG: SeqBoot did not create files correctly (/var/folders/+s/+srMEKriEiWM+Q7Qleiti++++TI/-Tmp-/v3no1dYNqE/outfile)
STACK: Error::throw
STACK: Bio::Root::Root::throw /usr/local/lib/perl5/site_perl/5.10.0/Bio/Root/Root.pm:357
STACK: Bio::Tools::Run::Phylo::Phylip::SeqBoot::_run /usr/local/lib/perl5/site_perl/5.10.0/Bio/Tools/Run/Phylo/Phylip/SeqBoot.pm:389
STACK: Bio::Tools::Run::Phylo::Phylip::SeqBoot::run /usr/local/lib/perl5/site_perl/5.10.0/Bio/Tools/Run/Phylo/Phylip/SeqBoot.pm:339
STACK: INDELVOLUTION_5.1consensus.pl:492
-----------------------------------------------------------

My code is a modification of the code I found at http://search.cpan.org/~cjfields/BioPerl-run-1.6.1/Bio/Tools/Run/Phylo/Phylip/Consense.pm

use Bio::Tools::Run::Phylo::Phylip::Consense;
use Bio::Tools::Run::Phylo::Phylip::SeqBoot;
use Bio::Tools::Run::Phylo::Phylip::ProtDist;
use Bio::Tools::Run::Phylo::Phylip::Neighbor;
use Bio::Tools::Run::Phylo::Phylip::DrawTree;

my $aio = Bio::AlignIO->new(-file =>'yeah.clustalw', -format=> 'clustalw');
    my $aln = $aio->next_aln;
    my ($aln_safe, $ref_name)=$aln->set_displayname_safe();
    #next use seqboot to generate multiple aligments
    my @params = ('datatype'=>'SEQUENCE','replicates'=>10);
    my $seqboot_factory = Bio::Tools::Run::Phylo::Phylip::SeqBoot->new(@params);
    
    my $aln_ref= $seqboot_factory->run($aln);
    
    #my $aln_ref= $seqboot_factory->run($aln_safe);
    
    #next build distance matrices and construct trees
    my $pd_factory = Bio::Tools::Run::Phylo::Phylip::ProtDist->new();
    my $ne_factory = Bio::Tools::Run::Phylo::Phylip::Neighbor->new();

    my @tree;
    foreach my $a (@{$aln_ref}){
        my $mat = $pd_factory->create_distance_matrix($a);
        push @tree, $ne_factory->create_tree($mat);
    }
    
    #now use consense to get a final tree
    my $con_factory = Bio::Tools::Run::Phylo::Phylip::Consense->new();
    
    #you may set outgroup either by the number representing the order in
    #which species are entered or by the name of the species
    
    $con_factory->outgroup(1);
    
    my $tree = $con_factory->run(\@tree);
    
    # Restore original sequence names, after ALL phylip runs:
    my @nodes = $tree->get_nodes();
    foreach my $nd (@nodes){
        $nd->id($ref_name->{$nd->id_output}) if $nd->is_Leaf;
    }
    
    #now draw the tree
    my $draw_factory = Bio::Tools::Run::Phylo::Phylip::DrawTree->new();
    my $image_filename = $draw_factory->draw_tree($tree);

And my yeah.clustalw file is OK:

CLUSTAL W(1.81) multiple sequence alignment


A/1-474                G---CGGTGGGAGAGCAACATGAGGAACCCGAGGGAGTCC-----TATATC-CTA----C
B/1-452                G---CCGTGGGAGAGCAACATGAGGAACCCGAGGGAGTCC-----TATATC-CTA----C
C/1-466                G---CCGTGGGAGAGCAACATGAGGAACCCGAGGGAGTCC-----TATATC-CTA----C
D/1-476                G---CCGTGGGAGAGCAACATGAGGAACCCGAGGGA-------------TC-CTA----C
E/1-439                G---CCGTGGGAGA------TGAGGAACCTGAGGTAGTCC-----TATATCTCTAGCGGC
F/1-434                G---CCGTGGGAGA------TGAGGAACCCGAGG---TCC-----TATATCTCTAGCGGC
G/1-462                G---CCGTGGGAGAGCAACATGAGGAACCCGAGGTA---------------TCTAGCGGC
H/1-466                G---CCGTGGGAGAGCAACATGAGGAACCCGAGGTAGTCC--------ATCTCTAGCGGC
I/1-462                GCTGCCGTGGGAGAGCAACATGAGGAACCGGAGGTAGTCCGGTATTATATCTCTA----C
J/1-447                GCTGCCGTGGGAGAGCAACATGAGGAACCGGAGGTAGTCCGGTATTATATCTCTA----C
K/1-448                G---CCGTGGGAGAGCA-CATGAGGAACCCGAGGTAGTCCGGT---ATATCTCGA----C
L/1-431                G---CCGTGGGAGAGCA-CATGAGGAACCCGAGGTAGTCCGGT---ATATCTCTA----C
M/1-432                G---CCGTGGGAGAGCAACATGAGGAACCCGAGGTTGTCCGGTATTATATCTCTA----C
N/1-422                G---CC------GAGCAACATGAGGAAC---AGGTTGTC---TATTATATCTCTA----C
O/1-441                G---CAGTGGGAGAGCAACATGAGGAACCCGAGGTTGTCCG--------TCTCTA----C
P/1-446                G---CAGTGGGAGAGCAACATGAGGAACCCGAGGTTGTCCG--------TCTCTA----C
                       *   *       **      ********   ***                  * *    *


A/1-474                GCATCGCGGCCCTTGTC-GCTCCCACCCA--CCATC---GACGGC-ACA--TTTGCTTGT
B/1-452                GCAT----------GTC-GCTC---------CCATCGCTGACGGC-ACATCTTTG---GT
C/1-466                GCATCGCGGCCCTTGTC-GCTCCCACCCATCCCATCGCTGACGGC-ACA-----GCTTGT
D/1-476                GCATCGCGGCCCTTGTC-GCTCCCACCCATCCCATCGCTGACGGC-ACA-----GCTTG-
E/1-439                GCA-CGCGGCCCT--TC-GCTT---CCCATCCCATCGCTGACGGC-ACATCT----TTGT
F/1-434                GCA-CGCGGCCCT--TCCGCTT---CCCATCCCATCGCTTACGGC-ACATCTTTGCTTGT
G/1-462                GCATCGCGGCCCT--TC-GCTC---CCCATCCCATCGCTGACGTC-ACATCTTTG-TTGT
H/1-466                GCATCGCGGCCCT--TC-GCTC---CCCATCCCATCGCTGACGGC-ACATCTTTGCTTGT
I/1-462                GCAT-CCGGCCCTTGTC-GCTCCCA------CCATCGCTGACGGC-ACAT--TTGCTTGT
J/1-447                GC------GCCCTTGTC-GCTCCCA---------TCGCTGACGGC-ACATCTTTGCTTGT
K/1-448                GCATCC----CCTTGTC-GCTCCCA------CCATCGCTGACGGC----TCTTTGCTTGT
L/1-431                GCATCC----CCTTGTC-GCTCCCA------CCATCGCTGACGGC----TCTTTGCTTGT
M/1-432                GCATC---GCCCTTGTC-GCTCCCA------CCATCGCTGAC-GC-ACATC-TTGCTTGT
N/1-422                GCATC---GCCCTTGTC-GCTCCCA------CCATCGCTGACAGCAACATCTTTGCTTGT
O/1-441                GCATC---GCCCTTGTC-GCTCCCA------CCATCTCTGACGGC-ACATCTTTGCTTGT
P/1-446                GCATC---GCCCTTGTC-GCTCCCA------CCATCTCTGACGGC-ACATCTTTGCTTGT
                       **             ** ***             **    **  *             * 


A/1-474                ACGAGATTGCTTTCACACTA-TCTATTGTTCGGGTACCGAGAGTCGGCGGTGAATACATC
B/1-452                ACGAGATTGCGTTCACACTA-TCCATTGTTCGGGTACCGAGAGTC-GCGGTGAATACATC
C/1-466                ACGTG--TGCGTTCCCACTAATCCATTGTTCGGGTAACGAGAGTCGGCGGTGAATACATG
D/1-476                -CGTGATTGCGTTCCCACTAATCCATTGTTCGGGTAACGAGAGTCGGCGGTGAATACATC
E/1-439                ACGTGATTGCG----CA--AATCCATTGT---GGTACCGAGAGTCGGCGGTGAACT---C
F/1-434                ACGTGATTGCG----CA--AATCCATTGTTCGGGTACCGAGAGTCG-----GAACT---C
G/1-462                ACGT----GCGTTCCCA--AATCCATTGTTCGGGTACCGAGAGTCGGCGGTGAACT---C
H/1-466                ACGT-------TTCCCA--AATCCAT---TCGGGTACCGAGAGTCGGCGGTGAACT---C
I/1-462                ACGTGATTGC--TCCCACCAATCCAT-GTTCGGGTACCGAGAGTCGGCGGTGAACTCATC
J/1-447                ACGTGATTGC--TCCCACTAATCCAT-GTTCGGGTACCGA-----------GAACTCATC
K/1-448                ACGTGATTGC--TCCCACTAATCCACTG--------CCGAGAGTCGGCGGTG---CCATC
L/1-431                ACGTGATTGC--TC------ATC--TTGTTCGGGTACCGA-----GGCGGTGAACTCATC
M/1-432                ACGTGATTGC--TCCCACTAATCC----TTCGGGTACCAAGAGTCGGCGGTGAACTCATC
N/1-422                ACGTGATTGC--TCCCACTAATCC----TTCGGGTACCAAGAGTCGGCGGTGAACTCATC
O/1-441                ACGTGATTGC--TCCCACTAATCCAT--TTCGGGTACCGAGAGTCGGCGGTGAACTCATC
P/1-446                ACGTGATTGC--TCCCACTAATCCATTG--CGGGTACCGAGAGTCGGCGGTGAACTCATC
                        **                  **              * *           *        


A/1-474                TCCGGAG--AAGTGTGCTAACCACAGTG--GAACGTATAATGCTGATCCCGCTTGTTT--
B/1-452                TCCGGAG--AA--GTGCTAACCACAGTG--GAACGTATAATGCTGAT-CCGCTT-TTT--
C/1-466                TCCGGAG--AAGTGTGCTAACCACAGTG--GAAAGTATAATGCT-----------TTT--
D/1-476                TCCGGAG--AAGTGT---AACCACAGTG--GAAAGTATAATGCTGATCCCGCTTGTTT--
E/1-439                TCCGG-----AGTGTGG-AACCACAGTG--GAACGTATAATGC--ATCTCGCGTGTTT--
F/1-434                TCCGG-----AGTGTGGTAACCACAGTG--GAACGTATAATGC--ATCCCGCGTGTTT--
G/1-462                TCCGGAG--AAGTGTGGTAACCACAGTG--GAACGTATAATGC--ATC--GCGTGTTT--
H/1-466                TCCGGAG--AAGTGTGGTAACCACAGT----AACGTAT-ATGC--ATCCCGCGTGTTT--
I/1-462                TCCGGAG--AAGTGTGGTAACCACAGTGCCGAAC--ATAATGC--ATCCCGCGTGTTTGC
J/1-447                TCGGGAG--AAGTGTGCTAACCACAGTGCCGAAC--ATAATGC--ATCCCGCGTGTTTGC
K/1-448                TCCGGAG--AAGTGTGGTAACCACAGTGCCGAAC--ATAATGC--ATCCCGCGTGTTTGC
L/1-431                TCCGGAG--AAGTGTG----CCACAGTGCCGAAC--ATAATGC--ATC--GCGTGTTTGC
M/1-432                TCCGGAGGAAAGTGTGGTAACCACAGTG--GAAC---------------CGC----TTCC
N/1-422                TCCGGAG--AAGTGTGGTAACCACAGTG--GAAC---------------CGC----TTCC
O/1-441                TCCGGAG--AAGTGTGGTAACCACAGTG--GAAC---------------CGCGTGTTTCC
P/1-446                TCCGGAG--AAGTGTGGTAACCACAGTG--GAAC---------------CGCGTGTTTCC
                       ** **     *  **     *******    **                       **  


A/1-474                --CTGTACCTAAAGTTCACCGGGTAGAGCC-----ATGTAC-CCGAGGACAACTAACAGT
B/1-452                --CTGTACCTAAAGTTCACCGGGTAGAGCC-----AGGTAC-CCGAGGACAACTAACAGT
C/1-466                --CTGTACCTAAAGTTCACCGGGTAGAGCCTCGTCATGTAC-CCG-----AACTAACAGT
D/1-476                --CTGTACCTAAAGTTCACCGGGTAGAGCC-----ATGTAC-CCGAGGACAACTAACAGT
E/1-439                --CCGTACCTAAAGTT------GTAGGGCC-----ATGTACACCGAGGACAACTAACAGT
F/1-434                --CCGTACCTAAAGTT-----GGTAGGGCC-----ATGTACACCGAGGACAACTAACAGT
G/1-462                --CCGTACCTAAAGTTCTCC--GTAGGGCC-----ATGTACACCGAGGACAACTAACAGT
H/1-466                --CCGTACCTAAAGTTCACCGGGTAGGGCC-----ATGTACACCGAGGACAACTAACAGT
I/1-462                GATCGTACCTAAAGTTCACC--------CC-----A-------CGAG----ACTAACAG-
J/1-447                GATCGTACCTAAAGTTCACCG-GTAGCGCC-----A-------CGAG----ACTAACAG-
K/1-448                GATCGTACCTAAAGTTCACCG-GTAGCGCC-----A-------CGAG----ACTAACAGT
L/1-431                GATCGTACCTAAAGTTCACCG-GTAGCGCC-----A-------CGAG----ACTAACAGT
M/1-432                GACCGTACCT-----T-ACCG-GTAGCGCC-----ATGTACACCGAGC---ACTA----T
N/1-422                GACCGTACCT-----TCACCG-GTAGTGCC-----ATGTACACCGAGC---ACTAACAGT
O/1-441                GACCGTACCT-----TCACCG-GTAGCGCC-----ATGTACACCGAGC---ACTAACAGT
P/1-446                GACCGTACCT-----TCACCG-GTAGCGCC-----ATG---ACCGAGC---ACTAACAGT
                           ******     *            **     *       **      ****     


A/1-474                GATCCTCA----TCTAAGCGCCGCTTCAGGAC----ATTGCCACGTCTACATCG------
B/1-452                GATCCTCA----TTTAAGCGCCGCTTCAGGCC----ATTGCCACGTCTACATCG------
C/1-466                GATCCTCA----TTTAAGCGCCGCTTCAGGAC----ATTACCACGTCTACATCGTTTCAT
D/1-476                GATCCTCA----TTTAAGCGCCGCTTCAGGAC----ATTACCACGTCTACATCGTTTCCT
E/1-439                GATCCTCA----TTTAAGCGCCGC---AGGAC----ATTGCCACGTCTACATCGTTTCAT
F/1-434                GATCCTCA----TTTAAGCGCCGC---AGGACTTTTATTGCCACGTCTACATCGTTTCAT
G/1-462                GATCCTCACAATTTTAAGCGCCGC---AGGAC----ATTGCCACGTCTACATCGTTTCAT
H/1-466                GATCCTC-CCATTTTAAGCGCCGC---AGGAC----ATTGCCACGTCTACATCGTTTCAT
I/1-462                ---CCTCA----TTTAAGCGCCGCTGCAGGAC----ATTGCCACGTCTACATC---TCAT
J/1-447                ---CCTCA----T-TAAGCGCCGCTGCAGGAC----ATTGCCACGTCTACATCGTTTCAT
K/1-448                GATCCTCA----TTTAAGCGCCGCTGCAGG-------TTGCCACGTCTACATCGTTTCAT
L/1-431                GATCCTCA----TTTAAGCGCCGCTGC----------TTGCCACGTCTACATCGTTTCAT
M/1-432                GATC--CA----TTTAAGCGCCGCTGCAGG--------TGCCACGTCTACATCGTTTCAT
N/1-422                GATC--CA----TTTAAGCGCCGCTGCAGGAA----ATTGCCACGTCTACATCGTTTCAT
O/1-441                GATCCTCA----TTTAAGCGCCGCTGCAGGAC----ATTGCC--GTCTACATCGTA----
P/1-446                GATCCTCA----TTTAAGCGCCGCTGCAGGAC----ATTGCC--GTCTACATCGTTTCA-
                          *  *     * **********              * **  *********       


A/1-474                -CATCTACTCTT--AGGCAGCAACAATTTGTCTCGTTCGACGTACAG--CGAAC--ATGT
B/1-452                -CATCTACTCTT--AGGCAGCAACAATT-GTCTCGTTCGATGTACAG--CGAAC--ATGT
C/1-466                TCATCTACTTTT--AGCCAGCAACAATTTGTCTCGTAGGATGTACAG--CGAACATA---
D/1-476                TCATCTACTTTT--AGCCAGCAACAATTTGTCTCGTAGGATGTACAG--CGAACATA---
E/1-439                TCATCTACTTTT--AGGCAGCAACA---TGTATCGTACGATGTACAG--CGAACATATGT
F/1-434                TCATCTACTTTT--AGGCAGCAACA---TGTATCGTACGATGTACAG--CGAA------T
G/1-462                TCATCTACTTTT--AGGC-GCAACAATCTGTATCG-ACGATGTAC-G--CGAACATATGT
H/1-466                TCATCTACTTTT--AGGC-GCAACAATCTGTATCG-ACGATGTAC-G--CGAACATATGT
I/1-462                TCACCTACTTTT--AGGGAGCAACAATCTGTATCC---G--GTACAGACCGAACATAGGA
J/1-447                TC----AC-TTT--AGGGAGCAACAATCTGTATCC---G--GTAC---CCGAACATAGGT
K/1-448                TCACCTACTTTT--AGGCAGCAACAATCT--ATCC---G--GTAC-GACCGAACATAGGT
L/1-431                TCACCTACTTTT--AGGCAGCAACAATCT--ATCC---G--GTAC-GACCGAACATAGGT
M/1-432                TCATTTACT-----AGGCAGCAACAATCTGTATC--------TATAGACCGAGCATATGT
N/1-422                TCATCTACT-----AGGCAGCAACAATCTGTATCC---G--GTATAGACCAAGCATATGT
O/1-441                ------ACTTTT--AGGCAGCAAC--TCTGTATCC---G--GTATAGACCGAACATATGT
P/1-446                ------ACTTTTTGAGGCAGCAAC--TCTGTATCC---G--GTATAGACCGAACATATGT
                             **      **   *****        **        **     * *        


A/1-474                GGGGCGTAAGACCAAAGTT--TATCGTTGGCCTTATTCGACCCAA-CAATTCGCGGATA-
B/1-452                GGGGCGTAAGACCAAAGTT--TATCGTTGGCCTTATTCGACCCAA-CAATTCGCGGATA-
C/1-466                TGGGCGTAAGACCAAAGTTGAT--CGTTGG---TATTCGACCCAATCAAGTCGCG-----
D/1-476                TGGGCGTAAGACCAAAGTTGAT--CGTGGGCCTTATTCGACCCAATCAATTCGCG---A-
E/1-439                T----GTAAGACCAAAGTT--TATCGTTGG---TATTTGACCCAGGCAATTCGCGGATA-
F/1-434                T----GTAAGACCAAAGTT--TATCGTTGG---TATTTGACCCAGGCAATTCGCGGATA-
G/1-462                T--GCGTAAGACCAAAGTT--TATCGTTGGCCTTATTTGACC----CAATTCGCGGGTA-
H/1-466                T--GAGTAAGACCAAAGTT--TATCGTTGGCCTTATTTGACC----CAATTCGCGGGTA-
I/1-462                TGTGCTTAAGACCAAAGTT--TATCGTT------ATATGACCCAAGCAATTCGCGGATA-
J/1-447                -GTGCTTAAGACCAAAGTT--TATCGTT------ACATGACCCAAGCAATTCGCGGATA-
K/1-448                TGGGCGCAAGACCAAAGTT--TATCGTT------ATTTGACCCAAGCAATTCGCGGATAC
L/1-431                TGGGCGCAAGACCAAAGTT--TATCGTT------ATTTGACCCAAGCAATTCGC-GATA-
M/1-432                TGGGCGTAAGACCAAAGTT--TATCGTTGGCTTT----GACCCAAGCAAT--GC------
N/1-422                TGGGGGTAAGACCAA-------------GGCTTT----GACCCAAGCAAT--GC------
O/1-441                TGGGCG-AAGACCAAAGTT--TATCGATGGCCTTATTTGACCCAAGCAAT--GCGGATA-
P/1-446                TGGGCG-AAGACCAAAGTT--TATCGATGGCCTTATTTGACCCAAGCAAT--GCGGATA-
                              ********                       ****    ***   **      


A/1-474                -A--AT-------TTATTCATTATTACCACTGATCAC--CCTG-CACCTATGCGGTTT--
B/1-452                -A--ATCCCGTCTTTATTC------ACCACTGATCAC--CCTG-CAC--ATGCGGTTT--
C/1-466                -----TCCCGTCTTTATTCATTATAACCACTGATCAC--CCTGGCAC--ATGCGCTTT--
D/1-476                -A--ATCCCGTCTTTATTCATTATAACCACTGATCACGACCTGGCAC--ATGCGCTAT--
E/1-439                -A---TCCCGTCTTTATT--TTTTTAGC-CTGATCTC--CCTGGCAC--AT---------
F/1-434                -A---TCCCGTCTTTATTCATTTTTACC-CTGATCTC--C---------AT---------
G/1-462                -A--ATCCCGTCTTTATTCATTATAACC-CTGATCTC--CCTGGCAC--ATGCGGTTA--
H/1-466                -A--ATCCCGTCTTTATTCATTATAACC-CTGATCTC--CCTGGCAC--ATGCGGTTA--
I/1-462                -AGGATCCTGT--TTATTCTTTATAACC-CTGATCAC--CCTGGCAT--ATGCGGTTTGC
J/1-447                -AGGATCCCGT--TTATTCTTTATAACC-CTGATCAC--CCTGGCAC--ATGCGGTTTGC
K/1-448                AAGGATCCCGT-----GTCATTATAACC-CTGATCAC--ACTGGCAC--ATGCGGTTTGC
L/1-431                -AGGATCCCGT-----TTCATTAT--CC-CTG-TCAC--CCTGGCAC--ATGCGGTTTGC
M/1-432                --GGATCCCGT--TTATTCATTAAAACC-CTGA---C--CCTGGCAC--ATGCGGTTTGC
N/1-422                --GGATCCCGT--TTATTCATTATAACC-CTGA---C--CCTGGCAC--ATGCGGTTTGC
O/1-441                -ATGATCCCGT--TTATTCATTATAACC-CT---CAC--CCTGGCAC--ATGCGGTTTGC
P/1-446                -AGGATCCCGT--TTATTCATTATAACC-CTGATCAC--CCTGGCAC--ATGCGGTTTGC
                            *           *         * **     *            **         


A/1-474                ACTTCGATGCC
B/1-452                ACTTCGATGCC
C/1-466                ACTTCGATG--
D/1-476                ACTTCGATGCC
E/1-439                -CTTCGATGCC
F/1-434                -CTTCGATGCC
G/1-462                ACTTCGATG--
H/1-466                ACTTCGATGCC
I/1-462                --TTCGATGCC
J/1-447                ACTTCGATGCC
K/1-448                ACTTCGATG--
L/1-431                ACTTCGATG--
M/1-432                ACTTCGATGCC
N/1-422                ACTTCGATGCC
O/1-441                ACTTCG-TGCC
P/1-446                ACTTCG-TGCC
                         **** **  

I have tried different things, but I don't really know why do I have this problem... Does anyone knows?

Thank you very much in advance,

Jose G.


 		 	   		  
_________________________________________________________________
¿Quieres saber qué PC eres? ¡Descúbrelo aquí!
http://www.quepceres.com/


More information about the Bioperl-l mailing list