忍者ブログ
[PR]
×

[PR]上記の広告は3ヶ月以上新規記事投稿のないブログに表示されています。新しい記事を書く事で広告が消えます。


2018/06/19 12:11 |
クラスタリングされたものの中から最も長い配列を抽出するプログラム
最もクラスター数の多い順にCLUTER_IDナンバーをつけて吐き出します。


#!/usr/bin/perl -w
use strict;
use warnings;
use POSIX;


#################################################
my ($fastafile) = @ARGV;
open FASTA, "<$fastafile";
my %hash=(); # initializes a hash

while (<FASTA>)
{
 if ($_ =~ /^>/)
 {

        my $header = $_;
        $header =~ s/\s//g;
        my $read_id = $_;
      
        $hash{$header}{name}=$read_id;
        my $line = <FASTA>; 
        $hash{$header}{sequence}= $line;
 }
}
close FASTA;
#################################################


my $counter = 0;

my $name = <STDIN>;

open (FASTANAME, $name);

while (my $name_cluster = <FASTANAME>)

{

$counter = $counter + 1;

if ($counter < 10)
{print "\nCLUSTER_ID_0000$counter\n"
}elsif ($counter < 100)
{print "\nCLUSTER_ID_000$counter\n"
}elsif ($counter < 1000)
{print "\nCLUSTER_ID_00$counter\n"
}elsif ($counter < 10000)
{print "\nCLUSTER_ID_0$counter\n"
}

my @filename = split (" ", $name_cluster);

my @count = @filename;
if (@count <= 1)
{
 exit;
}



my $header1 = ">$filename[0]";
  $header1 =~ s/\s//g;

if (exists $hash{"$header1"})
  {
            print "$hash{$header1}{name}";
        print "$hash{$header1}{sequence}";
 
 
}

}
close (FASTANAME);

PR

2007/11/27 02:45 | Comments(0) | TrackBack(0) | パールプログラム(Perl)

トラックバック

トラックバックURL:

コメント

コメントを投稿する






Vodafone絵文字 i-mode絵文字 Ezweb絵文字 (絵文字)



<<EST解析のツール集 | HOME | クラスタリングされた遺伝子を抽出するプログラム>>
サンカラショッピングモール / ダイエット / ビューティー・美容 / 布団・寝具 / 日用品・雑貨 / 家電製品 / 健康・ヘルスケア / 食べ物 / 飲み物 / アクセサリー / 時計 / ファッション / ブランド / ペット用品 / コスプレ / もしもの人気商品100選 / 新着さんから100 / 送料無料ショップ / もちもちロール / 送料無料ショップ / emsダイエット / ホットシャワー3 /
忍者ブログ[PR]