BamTools: BGZF ERROR: unable to open file
$ time bamtools sort -in SLABR0002.Lane2_1.bam -out SLABR0002.Lane2_1.sort.bam
BGZF ERROR: unable to open file SLABR0002.Lane2_1.sort.temp.1021
BGZF ERROR: unable to open file SLABR0002.Lane2_1.sort.bamreal 6m38.834s
user 5m4.711s
sys 0m7.704s
BamTools でソートしようとしたら,こんな問題が起きてしまった。
BamTools はソートをするときに大量の一時ファイルを吐き出すのだけれど,どうやらそれがあまりに多いとエラーになってしまうようです。
ソースコードをちょこっと見てみましたが,エラーの原因はちょこっと見てみただけだと,謎。
そもそも,ソースコードの問題なのか,ファイルサーバの問題なのか,という疑問もある。
原因究明はさておき,次のようにしたら解決しました。
$ time bamtools sort -in SLABR0002.Lane2_1.bam -out SLABR0002.Lane2_1.sort.bam -n 100000 -mem 10240
real 9m5.555s
user 8m21.655s
sys 0m7.056s
何をやったかと言うと,-n オプションで,1つのファイルあたりに書き出すリード(アラインメント)の本数を増やしてあげた。これで,吐き出すファイルの個数が少なくなって,エラーを回避できたようだ。