meineko’s blog

元つくばの某独立行政法人勤務の植物屋です。最近は、ほぼ、突発天体の話題です。

Excel

イネのmicroarrayのデータを解析しているのですが、最近、アレイにスポットされている遺伝子の数が、22000から44000に増えました。
イネの遺伝子の総数の推定が、32000くらいですから、ほぼ、全部を含んでいそうです。


で、スキャナの吐き出す解析ファイルは、基本的にスポットの番号+蛍光強度のテキストファイルですから、専用ソフトが無くても、いろいろ解析できます。
で、Excelに読み込ませたのですが、rowの数が、22000>44000と増えたので、重たくて大変です、


で、いろいろ加工している間に、もと50MBくらいのファイルだったのが、なぜか、データ数は増えていないので、250MBくらいにふくれてしまいました。
これを、元に戻そうと、奮闘中です。


まぁ、Excelで加工しようというのが、間違っている気がしてきました。
データ数が多いのは、最初だけで、いろいろ絞り込んで1000くらいに減らせば、Excelでも、何でも無いのですが。
そこへ行き着けてないです。
ファイルを開いては、閉じるだけを、すでに3時間くらいしていますorz