From tomoakin ＠ kenroku.kanazawa-u.ac.jp Sun Apr 23 03:24:20 2006 From: tomoakin ＠ kenroku.kanazawa-u.ac.jp (Tomoaki NISHIYAMA) Date: Sun, 23 Apr 2006 16:24:20 +0900 Subject: [BioRuby-ja] number of white space before Score in format0.rb Message-ID: こんにちは format0として、blastの出力をparseしたときに、最後の方のヒットについて同じidが２度検出されるという現象にあたりまして，調べていくと、 >ref|NP_197965.1| kinase [Arabidopsis thaliana] gb|AAO42089.1| putative receptor protein kinase [Arabidopsis thaliana] gb|AAD40144.1| contains similarity to protein kinase domains (Pfam F00069, Score=162.6, E=6.8e-45, N=1) and leucien rich repeats (Pfam PF00560, Score=210.7, E=2.2e-59, N=10) [Arabidopsis thaliana] Length = 1005 Score = 367 bits (942), Expect = 2e-99 Identities = 298/985 (30%), Positives = 476/985 (48%), Gaps = 108/985 (10%) のようなエントリが検出されていない事がわかりました。想像される事は、エントリのdefinitionの後ろの方に Score=で始まる行が来ているせいだろうと思い、 format0.rbの/^\s+Score/と言うのを/^ Score/に直すと一応予定通り全てのidを一回ずつ得る事が出来るようでした。 "Score"の前のspaceの個数が一つじゃない事はあるのかもしれませんが、任意に変動する事も無いでしょうから、実際に取りうる個数に制限した方が良いのじゃないかと思います。あるいは、空行の直後である事を確認するか、、、 % diff -u ~/bioruby/lib/bio/appl/blast/format0.rb format0.rb --- /home/tomoaki/bioruby/lib/bio/appl/blast/format0.rb 2006-04-23 16:04:50.000000000 +0900 +++ format0.rb 2006-04-23 16:03:18.000000000 +0900 @@ -780,7 +780,7 @@ def initialize(data) @f0hitname = data.shift @hsps = [] - while r = data[0] and /^\s+Score/ =~ r + while r = data[0] and /^ Score/ =~ r @hsps << HSP.new(data) end @again = false -- 西山智明金沢大学学際科学実験センターゲノム機能解析分野 (920-0934 金沢市宝町１3－１) Tomoaki NISHIYAMA Advanced Science Research Center, Kanazawa University, 13-1 Takara-machi Kanazawa, 920-0934 Japan From ngoto ＠ gen-info.osaka-u.ac.jp Sun Apr 23 06:38:34 2006 From: ngoto ＠ gen-info.osaka-u.ac.jp (GOTO Naohisa) Date: Sun, 23 Apr 2006 19:38:34 +0900 Subject: [BioRuby-ja] number of white space before Score in format0.rb In-Reply-To: References: Message-ID: <20060423193834.42d6a0bd.ngoto@gen-info.osaka-u.ac.jp> 後藤です。 On Sun, 23 Apr 2006 16:24:20 +0900 Tomoaki NISHIYAMA wrote: > format0として、blastの出力をparseしたときに、最後の > 方のヒットについて > 同じidが２度検出されるという現象にあたりまして，調べていく > と、 > > >ref|NP_197965.1| kinase [Arabidopsis thaliana] > gb|AAO42089.1| putative receptor protein kinase [Arabidopsis thaliana] > gb|AAD40144.1| contains similarity to protein kinase domains (Pfam > F00069, > Score=162.6, E=6.8e-45, N=1) and leucien rich repeats > (Pfam PF00560, Score=210.7, E=2.2e-59, N=10) [Arabidopsis > thaliana] > Length = 1005 > > Score = 367 bits (942), Expect = 2e-99 > Identities = 298/985 (30%), Positives = 476/985 (48%), Gaps = 108/985 > (10%) > > のようなエントリが検出されていない事がわかりました。 > 想像される事は、エントリのdefinitionの後ろの方に > Score=で始まる行が来ているせいだろうと思い、気が付きませんでした。 2番目以降のヒットに上記のような文字列を含んだヒットが来ると、それをHSPの続きと誤認してしまう模様です。その結果、そのヒットは無かったことにされてしまいます。そして、「HSPアライメント出力に存在するヒットの数」と「BLAST結果の先頭にあるヒット一覧の数」に不一致が生じます。（HSPアライメント出力に存在するヒットの数が少なくなる。） BLASTはデフォルトでは250以上のHSPアライメントは出力しない (blastallの-bオプションで変更可能)ため、それに備えて、 format0.rbでは、HSPアライメント出力が無い場合であっても、 BLAST結果の先頭にあるヒット一覧だけを見てHitオブジェクトを作成するようになっていますが、それが発動し、「同じidが二度検出される」が起こるのだと思います。 > format0.rbの/^\s+Score/と言うのを/^ Score/に直すと一 > 応予定通り全てのidを一回ずつ > 得る事が出来るようでした。 > > "Score"の前のspaceの個数が一つじゃない事はあるのかもしれま > せんが、 > 任意に変動する事も無いでしょうから、実際に取りうる個数に制限した > 方が良いのじゃないかと思います。 > あるいは、空行の直後である事を確認するか、、、万一のことを考えると「空行の直後である事を確認」のほうが好ましいような気がします。format0.rb では、処理の最初のほうで「空行(スペースやタブだけを含む行も空行とみなす)でsplitする」をやっていて、その結果が data に入ってるので、 ^ (行の先頭)ではなく \A (文字列の先頭)にして、 @@ -783 +783 @@ - while r = data[0] and /^\s+Score/ =~ r + while r = data[0] and /\A\s+Score/ =~ r ではどうでしょうか？まだ、ちゃんとした動作確認はしていませんが… -- 後藤直久 ngoto ＠ gen-info.osaka-u.ac.jp 大阪大学微生物病研究所遺伝情報実験センターゲノム情報解析分野(安永研) From tomoakin ＠ kenroku.kanazawa-u.ac.jp Sun Apr 23 08:26:28 2006 From: tomoakin ＠ kenroku.kanazawa-u.ac.jp (Tomoaki NISHIYAMA) Date: Sun, 23 Apr 2006 21:26:28 +0900 Subject: [BioRuby-ja] number of white space before Score in format0.rb In-Reply-To: <20060423193834.42d6a0bd.ngoto@gen-info.osaka-u.ac.jp> References: <20060423193834.42d6a0bd.ngoto@gen-info.osaka-u.ac.jp> Message-ID: 後藤様早速の返事ありがとうございます。 On 2006/04/23, at 19:38, GOTO Naohisa wrote: > ^ (行の先頭)ではなく \A (文字列の先頭)にし > て、 > > @@ -783 +783 @@ > - while r = data[0] and /^\s+Score/ =~ r > + while r = data[0] and /\A\s+Score/ =~ r > > ではどうでしょうか？ \Aで今回の例では問題なく処理できるようです。この状態でしばらく様子を見たいと思います。 -- Tomoaki NISHIYAMA Advanced Science Research Center, Kanazawa University, 13-1 Takara-machi, Kanazawa, 920-0934, Japan From kawashima_38 ＠ hotmail.com Sat Apr 29 01:16:21 2006 From: kawashima_38 ＠ hotmail.com (=?iso-2022-jp?B?GyRCQG5FZxsoQiAbJEJJcDtOGyhC?=) Date: Sat, 29 Apr 2006 14:16:21 +0900 Subject: [BioRuby-ja] =?iso-2022-jp?b?YmlvcnVieSB2ZXJzaW9uIDEuMC4w?= =?iso-2022-jp?b?GyRCJEskRCQkJEYbKEI=?= Message-ID: biorubyメーリングリストの皆様カリフォルニア大学バークレー校の川島です。（アドレスを、変更しました。）　最近、v.1.0.0に変更したのですが、変更がいろいろあったようで、すこし戸惑っています。たとえば、なにかfastaのファイルを次のプログラムにわたすと #!/usr/local/bin/ruby require 'bio' include Bio ff = FlatFile.new(FastaFormat, ARGF) ff.each do |x| puts x end /usr/lib/ruby/site_ruby/1.8/bio/io/flatfile.rb:118:in `pos': no stream to tell (ArgumentError) from /usr/lib/ruby/site_ruby/1.8/bio/io/flatfile.rb:118:in `pos' from /usr/lib/ruby/site_ruby/1.8/bio/io/flatfile.rb:342:in `get_entry' from /usr/lib/ruby/site_ruby/1.8/bio/io/flatfile.rb:573:in `next_entry' from /usr/lib/ruby/site_ruby/1.8/bio/io/flatfile.rb:609:in `each' from hoge.rb:7 と、エラーがでてしまいます。どこを修正すればよろしいでしょうか？（bioruby-0.6.4にもどすと、エラーがでなくなります。）　よろしくお願いします。 _________________________________________________________________ 迷惑メールやウイルスへの対策も万全「MSN Hotmail」 http://promotion.msn.co.jp/hotmail/ From ngoto ＠ gen-info.osaka-u.ac.jp Sat Apr 29 23:12:52 2006 From: ngoto ＠ gen-info.osaka-u.ac.jp (GOTO Naohisa) Date: Sun, 30 Apr 2006 12:12:52 +0900 Subject: [BioRuby-ja] =?iso-2022-jp?b?YmlvcnVieSB2ZXJzaW9uIDEuMC4w?= =?iso-2022-jp?b?GyRCJEskRCQkJEYbKEI=?= In-Reply-To: References: Message-ID: <200604300312.k3U3CrqM003045@idns103.gen-info.osaka-u.ac.jp> > 　最近、v.1.0.0に変更したのですが、変更がいろいろあったようで、 > すこし戸惑っています。仕様を変えたところについては doc/Changes-0.7.rd に書いています。しかし、書いていないのに仕様や挙動が変わっているところもあると思いますので、ご指摘ください。ただし、↓は変更ではなく、バグです。 bioruby-1.0.1を近日中にリリースするはず、ですが、それまでの間は添付のパッチを当ててください。 (あるいは、CVS最新版を使ってください。) > たとえば、なにかfastaのファイルを次のプログラムにわたすと > > #!/usr/local/bin/ruby > > require 'bio' > include Bio > > ff = FlatFile.new(FastaFormat, ARGF) > ff.each do |x| > puts x > end > > /usr/lib/ruby/site_ruby/1.8/bio/io/flatfile.rb:118:in `pos': no stream to > tell (ArgumentError) > from /usr/lib/ruby/site_ruby/1.8/bio/io/flatfile.rb:118:in `pos' > from /usr/lib/ruby/site_ruby/1.8/bio/io/flatfile.rb:342:in > `get_entry' > from /usr/lib/ruby/site_ruby/1.8/bio/io/flatfile.rb:573:in > `next_entry' > from /usr/lib/ruby/site_ruby/1.8/bio/io/flatfile.rb:609:in `each' > from hoge.rb:7 > > と、エラーがでてしまいます。 > どこを修正すればよろしいでしょうか？ > （bioruby-0.6.4にもどすと、エラーがでなくなります。） > > 　よろしくお願いします。 -- 後藤直久 ngoto ＠ gen-info.osaka-u.ac.jp 大阪大学微生物病研究所遺伝情報実験センターゲノム情報解析分野(安永研) -------------- next part -------------- 文字コード指定の無い添付文書を保管しました... 名前: flatfile.diff URL: http://lists.open-bio.org/pipermail/bioruby-ja/attachments/20060430/8b521e3f/attachment.pl From kawashima_38 ＠ hotmail.com Sun Apr 30 15:45:55 2006 From: kawashima_38 ＠ hotmail.com (=?iso-2022-jp?B?GyRCQG5FZxsoQiAbJEJJcDtOGyhC?=) Date: Mon, 01 May 2006 04:45:55 +0900 Subject: [BioRuby-ja] =?iso-2022-jp?b?GyRCQCk4QjlaQUclNSUkJUgkWCROQlAbKEI=?= =?iso-2022-jp?b?GyRCMX4kSyREJCQkRhsoQg==?= Message-ID: biorubyメーリングリストの皆様バークレーの川島武士です。後藤様　ver1.0.0に関する対応ありがとうございました。　ところで、別の質問ですが、biorubyに制限酵素サイトを認識するメソッドはありますでしょうか？無ければ追加していただく事は可能でしょうか？　コンストラクト作りを手伝うようなときに、割とよく使うのです。デフォルトで、あると便利です。　制限酵素認識サイトは、シンメトリックですから簡単なプログラムですが、　自分で毎回書いていて、認識サイトの書き間違いが無いか心配なのです。　（なにか手伝える事があったら、お伝えください。よく使う制限酵素と認識サイトのテーブルとかなら作ります。）具体的には　nuc = "atggctgatGGATCCccctgtggtctagatttt" などのときに、　nuc.cut_by_restriction_enzyme(BamHI) => [["atggctgatg", "gatccccctgtggtctagatttt"]["G/GATCC"]] などのイメージです。 (いや、これだと使いにくいかもしれません。切り口の表現は難しいですね、実際は、 atggctgatg ctagcccctgtggtctagatttt taccgactacgatc ggggacaccatatctaaaa なので。）一番頻繁につかうのは、　nuc.cut_by_restriction_enzyme(BamHI, XhoI) 　 => [["atggctgatg"], ["gatccccctgtggt"], ["ctagatttt"]]["G/GATCC", "T/CTAGA"]] のような使い方だとおもうのですが。　（BamHIとXhoIに挟まれたサイト"gatccccctgtggt"を切り取ってくる。）それと、使える制限酵素処理を一覧できるような便利メソッドがあるとありがたいです。 frequent_base_cutter(6) =>[ ["ActII", "Acetobacter aceti", "GACGT/C"] , ["ApoI", "Arthobacter posteurianus", "GGGCC/C"] , ["BamHI", "Bacillys amyloliquefaciens", "G/GATCC"] . .....] frequent_base_cutter(4) =>[ ["AluI", "Arthobacter luteus", "AG/CT"] , .....] 　rare_base_cutter(6) => ["BstMI", "?", "AGT/ACT"] 　　川島武士@UCB&JGI _________________________________________________________________ パソコンでも携帯電話でも使える「MSN Hotmail」 http://promotion.msn.co.jp/hotmail/ From tomoakin ＠ kenroku.kanazawa-u.ac.jp Sun Apr 23 07:24:20 2006 From: tomoakin ＠ kenroku.kanazawa-u.ac.jp (Tomoaki NISHIYAMA) Date: Sun, 23 Apr 2006 16:24:20 +0900 Subject: [BioRuby-ja] number of white space before Score in format0.rb Message-ID: こんにちは format0として、blastの出力をparseしたときに、最後の方のヒットについて同じidが２度検出されるという現象にあたりまして，調べていくと、 >ref|NP_197965.1| kinase [Arabidopsis thaliana] gb|AAO42089.1| putative receptor protein kinase [Arabidopsis thaliana] gb|AAD40144.1| contains similarity to protein kinase domains (Pfam F00069, Score=162.6, E=6.8e-45, N=1) and leucien rich repeats (Pfam PF00560, Score=210.7, E=2.2e-59, N=10) [Arabidopsis thaliana] Length = 1005 Score = 367 bits (942), Expect = 2e-99 Identities = 298/985 (30%), Positives = 476/985 (48%), Gaps = 108/985 (10%) のようなエントリが検出されていない事がわかりました。想像される事は、エントリのdefinitionの後ろの方に Score=で始まる行が来ているせいだろうと思い、 format0.rbの/^\s+Score/と言うのを/^ Score/に直すと一応予定通り全てのidを一回ずつ得る事が出来るようでした。 "Score"の前のspaceの個数が一つじゃない事はあるのかもしれませんが、任意に変動する事も無いでしょうから、実際に取りうる個数に制限した方が良いのじゃないかと思います。あるいは、空行の直後である事を確認するか、、、 % diff -u ~/bioruby/lib/bio/appl/blast/format0.rb format0.rb --- /home/tomoaki/bioruby/lib/bio/appl/blast/format0.rb 2006-04-23 16:04:50.000000000 +0900 +++ format0.rb 2006-04-23 16:03:18.000000000 +0900 @@ -780,7 +780,7 @@ def initialize(data) @f0hitname = data.shift @hsps = [] - while r = data[0] and /^\s+Score/ =~ r + while r = data[0] and /^ Score/ =~ r @hsps << HSP.new(data) end @again = false -- 西山智明金沢大学学際科学実験センターゲノム機能解析分野 (920-0934 金沢市宝町１3－１) Tomoaki NISHIYAMA Advanced Science Research Center, Kanazawa University, 13-1 Takara-machi Kanazawa, 920-0934 Japan From ngoto ＠ gen-info.osaka-u.ac.jp Sun Apr 23 10:38:34 2006 From: ngoto ＠ gen-info.osaka-u.ac.jp (GOTO Naohisa) Date: Sun, 23 Apr 2006 19:38:34 +0900 Subject: [BioRuby-ja] number of white space before Score in format0.rb In-Reply-To: References: Message-ID: <20060423193834.42d6a0bd.ngoto@gen-info.osaka-u.ac.jp> 後藤です。 On Sun, 23 Apr 2006 16:24:20 +0900 Tomoaki NISHIYAMA wrote: > format0として、blastの出力をparseしたときに、最後の > 方のヒットについて > 同じidが２度検出されるという現象にあたりまして，調べていく > と、 > > >ref|NP_197965.1| kinase [Arabidopsis thaliana] > gb|AAO42089.1| putative receptor protein kinase [Arabidopsis thaliana] > gb|AAD40144.1| contains similarity to protein kinase domains (Pfam > F00069, > Score=162.6, E=6.8e-45, N=1) and leucien rich repeats > (Pfam PF00560, Score=210.7, E=2.2e-59, N=10) [Arabidopsis > thaliana] > Length = 1005 > > Score = 367 bits (942), Expect = 2e-99 > Identities = 298/985 (30%), Positives = 476/985 (48%), Gaps = 108/985 > (10%) > > のようなエントリが検出されていない事がわかりました。 > 想像される事は、エントリのdefinitionの後ろの方に > Score=で始まる行が来ているせいだろうと思い、気が付きませんでした。 2番目以降のヒットに上記のような文字列を含んだヒットが来ると、それをHSPの続きと誤認してしまう模様です。その結果、そのヒットは無かったことにされてしまいます。そして、「HSPアライメント出力に存在するヒットの数」と「BLAST結果の先頭にあるヒット一覧の数」に不一致が生じます。（HSPアライメント出力に存在するヒットの数が少なくなる。） BLASTはデフォルトでは250以上のHSPアライメントは出力しない (blastallの-bオプションで変更可能)ため、それに備えて、 format0.rbでは、HSPアライメント出力が無い場合であっても、 BLAST結果の先頭にあるヒット一覧だけを見てHitオブジェクトを作成するようになっていますが、それが発動し、「同じidが二度検出される」が起こるのだと思います。 > format0.rbの/^\s+Score/と言うのを/^ Score/に直すと一 > 応予定通り全てのidを一回ずつ > 得る事が出来るようでした。 > > "Score"の前のspaceの個数が一つじゃない事はあるのかもしれま > せんが、 > 任意に変動する事も無いでしょうから、実際に取りうる個数に制限した > 方が良いのじゃないかと思います。 > あるいは、空行の直後である事を確認するか、、、万一のことを考えると「空行の直後である事を確認」のほうが好ましいような気がします。format0.rb では、処理の最初のほうで「空行(スペースやタブだけを含む行も空行とみなす)でsplitする」をやっていて、その結果が data に入ってるので、 ^ (行の先頭)ではなく \A (文字列の先頭)にして、 @@ -783 +783 @@ - while r = data[0] and /^\s+Score/ =~ r + while r = data[0] and /\A\s+Score/ =~ r ではどうでしょうか？まだ、ちゃんとした動作確認はしていませんが… -- 後藤直久 ngoto ＠ gen-info.osaka-u.ac.jp 大阪大学微生物病研究所遺伝情報実験センターゲノム情報解析分野(安永研) From tomoakin ＠ kenroku.kanazawa-u.ac.jp Sun Apr 23 12:26:28 2006 From: tomoakin ＠ kenroku.kanazawa-u.ac.jp (Tomoaki NISHIYAMA) Date: Sun, 23 Apr 2006 21:26:28 +0900 Subject: [BioRuby-ja] number of white space before Score in format0.rb In-Reply-To: <20060423193834.42d6a0bd.ngoto@gen-info.osaka-u.ac.jp> References: <20060423193834.42d6a0bd.ngoto@gen-info.osaka-u.ac.jp> Message-ID: 後藤様早速の返事ありがとうございます。 On 2006/04/23, at 19:38, GOTO Naohisa wrote: > ^ (行の先頭)ではなく \A (文字列の先頭)にし > て、 > > @@ -783 +783 @@ > - while r = data[0] and /^\s+Score/ =~ r > + while r = data[0] and /\A\s+Score/ =~ r > > ではどうでしょうか？ \Aで今回の例では問題なく処理できるようです。この状態でしばらく様子を見たいと思います。 -- Tomoaki NISHIYAMA Advanced Science Research Center, Kanazawa University, 13-1 Takara-machi, Kanazawa, 920-0934, Japan From kawashima_38 ＠ hotmail.com Sat Apr 29 05:16:21 2006 From: kawashima_38 ＠ hotmail.com (=?iso-2022-jp?B?GyRCQG5FZxsoQiAbJEJJcDtOGyhC?=) Date: Sat, 29 Apr 2006 14:16:21 +0900 Subject: [BioRuby-ja] =?iso-2022-jp?b?YmlvcnVieSB2ZXJzaW9uIDEuMC4w?= =?iso-2022-jp?b?GyRCJEskRCQkJEYbKEI=?= Message-ID: biorubyメーリングリストの皆様カリフォルニア大学バークレー校の川島です。（アドレスを、変更しました。）　最近、v.1.0.0に変更したのですが、変更がいろいろあったようで、すこし戸惑っています。たとえば、なにかfastaのファイルを次のプログラムにわたすと #!/usr/local/bin/ruby require 'bio' include Bio ff = FlatFile.new(FastaFormat, ARGF) ff.each do |x| puts x end /usr/lib/ruby/site_ruby/1.8/bio/io/flatfile.rb:118:in `pos': no stream to tell (ArgumentError) from /usr/lib/ruby/site_ruby/1.8/bio/io/flatfile.rb:118:in `pos' from /usr/lib/ruby/site_ruby/1.8/bio/io/flatfile.rb:342:in `get_entry' from /usr/lib/ruby/site_ruby/1.8/bio/io/flatfile.rb:573:in `next_entry' from /usr/lib/ruby/site_ruby/1.8/bio/io/flatfile.rb:609:in `each' from hoge.rb:7 と、エラーがでてしまいます。どこを修正すればよろしいでしょうか？（bioruby-0.6.4にもどすと、エラーがでなくなります。）　よろしくお願いします。 _________________________________________________________________ 迷惑メールやウイルスへの対策も万全「MSN Hotmail」 http://promotion.msn.co.jp/hotmail/ From ngoto ＠ gen-info.osaka-u.ac.jp Sun Apr 30 03:12:52 2006 From: ngoto ＠ gen-info.osaka-u.ac.jp (GOTO Naohisa) Date: Sun, 30 Apr 2006 12:12:52 +0900 Subject: [BioRuby-ja] =?iso-2022-jp?b?YmlvcnVieSB2ZXJzaW9uIDEuMC4w?= =?iso-2022-jp?b?GyRCJEskRCQkJEYbKEI=?= In-Reply-To: References: Message-ID: <200604300312.k3U3CrqM003045@idns103.gen-info.osaka-u.ac.jp> > 　最近、v.1.0.0に変更したのですが、変更がいろいろあったようで、 > すこし戸惑っています。仕様を変えたところについては doc/Changes-0.7.rd に書いています。しかし、書いていないのに仕様や挙動が変わっているところもあると思いますので、ご指摘ください。ただし、↓は変更ではなく、バグです。 bioruby-1.0.1を近日中にリリースするはず、ですが、それまでの間は添付のパッチを当ててください。 (あるいは、CVS最新版を使ってください。) > たとえば、なにかfastaのファイルを次のプログラムにわたすと > > #!/usr/local/bin/ruby > > require 'bio' > include Bio > > ff = FlatFile.new(FastaFormat, ARGF) > ff.each do |x| > puts x > end > > /usr/lib/ruby/site_ruby/1.8/bio/io/flatfile.rb:118:in `pos': no stream to > tell (ArgumentError) > from /usr/lib/ruby/site_ruby/1.8/bio/io/flatfile.rb:118:in `pos' > from /usr/lib/ruby/site_ruby/1.8/bio/io/flatfile.rb:342:in > `get_entry' > from /usr/lib/ruby/site_ruby/1.8/bio/io/flatfile.rb:573:in > `next_entry' > from /usr/lib/ruby/site_ruby/1.8/bio/io/flatfile.rb:609:in `each' > from hoge.rb:7 > > と、エラーがでてしまいます。 > どこを修正すればよろしいでしょうか？ > （bioruby-0.6.4にもどすと、エラーがでなくなります。） > > 　よろしくお願いします。 -- 後藤直久 ngoto ＠ gen-info.osaka-u.ac.jp 大阪大学微生物病研究所遺伝情報実験センターゲノム情報解析分野(安永研) -------------- next part -------------- 文字コード指定の無い添付文書を保管しました... 名前: flatfile.diff URL: From kawashima_38 ＠ hotmail.com Sun Apr 30 19:45:55 2006 From: kawashima_38 ＠ hotmail.com (=?iso-2022-jp?B?GyRCQG5FZxsoQiAbJEJJcDtOGyhC?=) Date: Mon, 01 May 2006 04:45:55 +0900 Subject: [BioRuby-ja] =?iso-2022-jp?b?GyRCQCk4QjlaQUclNSUkJUgkWCROQlAbKEI=?= =?iso-2022-jp?b?GyRCMX4kSyREJCQkRhsoQg==?= Message-ID: biorubyメーリングリストの皆様バークレーの川島武士です。後藤様　ver1.0.0に関する対応ありがとうございました。　ところで、別の質問ですが、biorubyに制限酵素サイトを認識するメソッドはありますでしょうか？無ければ追加していただく事は可能でしょうか？　コンストラクト作りを手伝うようなときに、割とよく使うのです。デフォルトで、あると便利です。　制限酵素認識サイトは、シンメトリックですから簡単なプログラムですが、　自分で毎回書いていて、認識サイトの書き間違いが無いか心配なのです。　（なにか手伝える事があったら、お伝えください。よく使う制限酵素と認識サイトのテーブルとかなら作ります。）具体的には　nuc = "atggctgatGGATCCccctgtggtctagatttt" などのときに、　nuc.cut_by_restriction_enzyme(BamHI) => [["atggctgatg", "gatccccctgtggtctagatttt"]["G/GATCC"]] などのイメージです。 (いや、これだと使いにくいかもしれません。切り口の表現は難しいですね、実際は、 atggctgatg ctagcccctgtggtctagatttt taccgactacgatc ggggacaccatatctaaaa なので。）一番頻繁につかうのは、　nuc.cut_by_restriction_enzyme(BamHI, XhoI) 　 => [["atggctgatg"], ["gatccccctgtggt"], ["ctagatttt"]]["G/GATCC", "T/CTAGA"]] のような使い方だとおもうのですが。　（BamHIとXhoIに挟まれたサイト"gatccccctgtggt"を切り取ってくる。）それと、使える制限酵素処理を一覧できるような便利メソッドがあるとありがたいです。 frequent_base_cutter(6) =>[ ["ActII", "Acetobacter aceti", "GACGT/C"] , ["ApoI", "Arthobacter posteurianus", "GGGCC/C"] , ["BamHI", "Bacillys amyloliquefaciens", "G/GATCC"] . .....] frequent_base_cutter(4) =>[ ["AluI", "Arthobacter luteus", "AG/CT"] , .....] 　rare_base_cutter(6) => ["BstMI", "?", "AGT/ACT"] 　　川島武士@UCB&JGI _________________________________________________________________ パソコンでも携帯電話でも使える「MSN Hotmail」 http://promotion.msn.co.jp/hotmail/