MJさむらいの実験室

[PR]

[PR]上記の広告は3ヶ月以上新規記事投稿のないブログに表示されています。新しい記事を書く事で広告が消えます。

2025/12/05 00:53 |

ブラストクラスとを使う時のメモ

DNA配列をクラスタリングする時の例
blastclust -i filename.txt -p F -S 95 -L 0.7 -o outfilename.txt -e F

-i filename.txt　入力ファイル名（ＦＡＳＴＡファイル）

-p F タンパク質かそうでないか。Ｔ＝タンパク質　Ｆ＝ＤＮＡ　（これは忘れがち。デフォルトでタンパク質になっている。）

-S thresholdのスコア。３以上だと％　３以下だとscore/length

-L thresholdの長さ。アライメントされる配列はどれくらいの長さが必要か。

-e フォーマットが必要か。これをＦにしないとうまくいかない？

2007/11/17 03:47 | Comments(1) | TrackBack() | パールプログラム(Perl)

FASTAの数を数える。

パールじゃないけど

ＵＮＩＸのコマンドでＦＡＳＴＡフォーマットのファイル中にあるシークエンスの数を数える
grep -c というコマンドを使うと数を数える事ができる。
ＦＡＳＴＡフォーマットは各シークエンスに＞で名前がついているので、
'＞'の数を数えればそのファイルの中にいくつ'＞'があるかわかる。

grep -c '>' filename

’　’の中身を変えれば別の言葉を数える事ができる。

たとえば’No hits found’とやるとblastの結果からヒットしなかった遺伝子の数を数える事ができる。

2007/11/17 02:15 | Comments(0) | TrackBack() | パールプログラム(Perl)

ファスタネームから遺伝子配列を抽出するプログラム

ファスタのデーターベースから
抽出したい遺伝子のファスタファイル（fasta file)を抽出するプログラム。

必要なもの、
抽出したい遺伝子名が一行に一遺伝子づつ書かれたファイル。
ファスタ形式のデーターベース（塩基配列は一行で書かれているもの。）

プログラムここから。
#------------------------------------------
#!/usr/bin/perl -w
use strict;
use warnings;
use POSIX;

# enter the fastafile to hash.
my ($fastafile) = @ARGV;
open FASTA, "<$fastafile";
my %hash=(); # initializes a hash
while (<FASTA>)
{
if ($_ =~ /^>/)
{
        my $header = $_;
        $header =~ s/\s//g;
        my $read_id = $_;

        $hash{$header}{name}=$read_id;
        my $line = <FASTA>;
        $hash{$header}{sequence}= $line;
}
}
close FASTA;
########################## extract by fasta_name
my $counter = 0;
my $name = <STDIN>;
open (FASTANAME, $name);
################################################
while (<FASTANAME>)
{
my $filename = $_;
$filename =~ s/\s//g;
my $header = $filename;
if (exists $hash{"$header"})
{
    $counter = $counter + 1;
            print "$hash{$header}{name}";
        print_sequence($hash{$header}{sequence}, 80);
}
}
close (FASTANAME);
print "$counter fasta sequences are here\n";

################# sub print_FASTA sequence #####

sub print_sequence
{
      my($sequence, $length) = @_;
# Print sequence in lines of $length
for ( my $pos = 0 ; $pos < length($sequence) ; $pos += $length )
   {
     print substr($sequence, $pos, $length), "\n";
   }
}

#--------------------------------------
ここまで

2007/08/16 03:57 | Comments(0) | TrackBack() | パールプログラム(Perl)

S	M	T	W	T	F	S
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30	31

<<前のページ | HOME | 次のページ>>

サンカラショッピングモール / ダイエット / ビューティー・美容 / 布団・寝具 / 日用品・雑貨 / 家電製品 / 健康・ヘルスケア / 食べ物 / 飲み物 / アクセサリー / 時計 / ファッション / ブランド / ペット用品 / コスプレ / もしもの人気商品100選 / 新着さんから100 / 送料無料ショップ / もちもちロール / 送料無料ショップ / emsダイエット / ホットシャワー３ /

忍者ブログ[PR]