MJさむらいの実験室

[PR]

[PR]上記の広告は3ヶ月以上新規記事投稿のないブログに表示されています。新しい記事を書く事で広告が消えます。

2026/01/21 06:37 |

ＦＡＳＴＡシークエンスのいっぱい入ったファイルの中から、ある特定のＦＡＳＴＡシークエンスを抽出したい時につかえるプログラムを書いてみました。

ここまで書くには結構勉強した。

ＦＡＳＴＡフォーマット
＞１
ＡＴＧＡＴＡＴＧＡＧＧＡＴＧＣＧＴＡＧＴＡ
＞２
ＡＡＡＡＡＴＴＴＴＧＧＧＧＣＣＣＣＣ
＞３
ＴＴＴＴＴＣＣＣＧＴＧＴＡＧＴＧＡＴＧＴＧＴＣＧＴＧＣＴＧＡＴＣＧＴＡＣＧＴＣＧ

という遺伝子が入ったファイルがある。

その中から３のみを抽出したいときは、
＞３
と書かれたファイルを用意して下のプログラムを実行すると。

ＦＡＳＴＡフォーマットのファイルの中から
＞３
ＴＴＴＴＴＣＣＣＧＴＧＴＡＧＴＧＡＴＧＴＧＴＣＧＴＧＣＴＧＡＴＣＧＴＡＣＧＴＣＧ

だけを抽出してくれる。

今５万個とか扱っているのでこれを勉強して書く手間と５万個コピペする手間を考えたら
これを書くほうが楽チン。

プログラムの内容は何でもいいから目的が果たせたらいいという代物なので
褒められたものではないだろう。

ここから下がプログラム

#!/usr/bin/perl -w
use strict;
use warnings;
use POSIX;

# enter the fastafile to hash.
my ($fastafile) = @ARGV;
open FASTA, "<$fastafile";
my %hash=(); # initializes a hash

while (<FASTA>)
{
if ($_ =~ /^>/)
{

        my $header = $_;
        $header =~ s/\s//g;
        my $read_id = $_;

        $hash{$header}{name}=$read_id;
        my $line = <FASTA>;
        $hash{$header}{sequence}= $line;
}
}
close FASTA;

my $counter = 0;

my $name = <STDIN>;

open (FASTANAME, $name);

while (<FASTANAME>)
{

my $filename = $_;

$filename =~ s/\s//g;
my $header = $filename;
if (exists $hash{"$header"})
{
    $counter = $counter + 1;
            print "$hash{$header}{name}";
        print "$hash{$header}{sequence}";
}
}
close (FASTANAME);

print "$counter fasta sequences are here\n";

2007/11/23 06:22 | Comments(0) | TrackBack() | パールプログラム(Perl)

Yamanaka stem cells

Induction of Pluripotent Stem Cells from Adult Human Fibroblasts by Defined Factors
Kazutoshi Takahashi, Koji Tanabe, Mari Ohnuki, Megumi Narita, Tomoko Ichisaka, Kiichiro Tomoda, and Shinya Yamanaka.
Ｃｅｌｌ　２００７　
DOI 10.1016/j.cell.2007.11.019

今最も熱い論文はこの論文でしょうか。

なにやら、人間の幹細胞が皮膚から作れるそうです。
３６歳の女性の顔の皮膚からいろんな細胞になれる幹細胞がつくれた。

４つの転写因子を使うと皮膚の細胞から幹細胞がつくれるらしい。
５００００細胞培養すると、１０細胞の幹細胞がとれる。
わお。

この研究によって期待される事がたくさんあるためすごく注目されているようです。

幹細胞を得るのに人の胎児を使わなくて良くなった。

病気の人の皮膚から細胞を培養して何が原因なのか研究できる。

など。

2007/11/23 05:57 | Comments(0) | TrackBack() | 論文から

ブラストクラストを走らせると

ブラストクラストを走らせると問題がでてくる。

一回のランでは綺麗にクラスタリングされないのだ。

クラスタリングされなかったものを集めてきてもう一度ブラスとクラストをかけると、
クラスタリングされるものが出てくる。

この原因はおそらくシークエンスの長さによるものだと思うのだが、どうすればいいの？

やはりクラスタリングされなくなるまでクラスタリングするべきか。

2007/11/23 03:55 | Comments(0) | TrackBack() | パールプログラム(Perl)

S	M	T	W	T	F	S
				1	2	3
4	5	6	7	8	9	10
11	12	13	14	15	16	17
18	19	20	21	22	23	24
25	26	27	28	29	30	31