パールを使ってテキストを少しいじってから解析しているのだが、ちょっと理由が分らず困っていた事があった。
プログラミングは慣れていないので本当に頭がいたい。
しかし、ちょっと調べてみたい。と言う時にバイオインフォマジシャンに頼むわけにもいかない部分も多い。
個々の問題は誰かに聞いて解決すると言うものでもないときもある。
たぶんプログラミングが本職の人だったらわけもなくやってしまうのだろうけど、
フォーマットが違うデーターベースを扱う時に時々つまづいてしまう。
今回、JGIのデーターを使って解析しようとしたら、フォーマットが異なっていた。
データーがタブではなく|で区切られていたのだ。
これのせいでうまく自分の調べたい名前が拾えない。
なんでだろ。
タブだとsplitとう命令で分割できるのに、|は分割できない。
しかし、UNIXのコマンドを使ってうまく処理できた。
と言うか無理やり処理した。
CUTと言うコマンド。
CUT -C 9- ファイル名 > アウトプット名
とやると各行の9文字目以降から書き出してくれる。
つまり、9文字より前をCUTしてくれる。
まあいまだに|のsplitの仕方は分らないのだが、CUTでいらないところを削って無理やり使いました。
プログラミングは慣れていないので本当に頭がいたい。
しかし、ちょっと調べてみたい。と言う時にバイオインフォマジシャンに頼むわけにもいかない部分も多い。
個々の問題は誰かに聞いて解決すると言うものでもないときもある。
たぶんプログラミングが本職の人だったらわけもなくやってしまうのだろうけど、
フォーマットが違うデーターベースを扱う時に時々つまづいてしまう。
今回、JGIのデーターを使って解析しようとしたら、フォーマットが異なっていた。
データーがタブではなく|で区切られていたのだ。
これのせいでうまく自分の調べたい名前が拾えない。
なんでだろ。
タブだとsplitとう命令で分割できるのに、|は分割できない。
しかし、UNIXのコマンドを使ってうまく処理できた。
と言うか無理やり処理した。
CUTと言うコマンド。
CUT -C 9- ファイル名 > アウトプット名
とやると各行の9文字目以降から書き出してくれる。
つまり、9文字より前をCUTしてくれる。
まあいまだに|のsplitの仕方は分らないのだが、CUTでいらないところを削って無理やり使いました。
PR
トラックバック
トラックバックURL:
コメント
あ,間違えました.
split(/¥/,str)
ではなくて正しくは
split(/¥|/,str)
ですね
split(/¥/,str)
ではなくて正しくは
split(/¥|/,str)
ですね
posted by 通りがかりのインフォマティシャンat 2008/02/04 22:09 [ コメントを修正する ]
コメントありがとうございます。
そうなんですよね。
自分で書いたプログラムを見返したんですが、その通り書いてありました。
でも、予想通り動きませんでした。
>jgi|Cioin2|217196|fgenesh3_pg.C_chr_03p000502
こんな感じの名前のfgenesh3_pg.C_chr_03p000502の部分を取り出したかったんですが。
うちの環境が特別だめだったんでしょうかね。
そうなんですよね。
自分で書いたプログラムを見返したんですが、その通り書いてありました。
でも、予想通り動きませんでした。
>jgi|Cioin2|217196|fgenesh3_pg.C_chr_03p000502
こんな感じの名前のfgenesh3_pg.C_chr_03p000502の部分を取り出したかったんですが。
うちの環境が特別だめだったんでしょうかね。
posted by MJさむらいat 2008/02/07 05:33 [ コメントを修正する ]
お返事遅れて済みません.
うーんなんでだろう.
コード見ないと分からないですね.
お力になれず,すみません
うーんなんでだろう.
コード見ないと分からないですね.
お力になれず,すみません
posted by 通りがかりのインフォマティシャンat 2008/02/11 21:23 [ コメントを修正する ]
ご親切にありがとうございます。
やり方は正当でないものの、目的は果たせているので大丈夫です。
ありがとうございました。
今、ubuntuという環境に変更中なので落ち着いたらもう一度試してみます。
やり方は正当でないものの、目的は果たせているので大丈夫です。
ありがとうございました。
今、ubuntuという環境に変更中なので落ち着いたらもう一度試してみます。
したがって,split(/¥/,str)とすればうまくいくはずです.
詳しくは
http://www.kent-web.com/perl/chap7.html
とか,perlの正規表現の項目を読んでください.