2017-01-01から1年間の記事一覧

Bowtie2で許容編集距離を設定する

Bowtie2のoptionは複雑で、とりあえずデフォルトで回してからSAMをパースしている人は多いかもしれない。 マニュアルを良く読むとスコアをきちんと設定すれば色々設定できる。Bowtie 2: Manual 特に以下の部分。 Scoring options --mp MX,MN Sets the maximu…

PythonのListとDictionaryの検索機能の速さ

"in"を使って要素の有無を判定する時、ListとDictionaryで速いのはどちらなのだろうと疑問に思ったので調べた。with Python 2.7.11 l = [1,2,3,4,5] for i in range(10000000): if 1 in l: pass real 0m1.017s user 0m0.853s sys 0m0.141s d = {1:"", 2:"", …

PythonのnetworkXを使ってpathway解析をする

ある遺伝子(機能)セットと代謝ネットワークデータを用いて、上流の化合物から下流の化合物に行くpathwayがあるか調べたい。 PythonのnetworkXを使って最短経路を出すドキュメントはたくさんあったが、エッジの有無によってFlow解析についてはあまりなかった…

cutadaptをlocal installする

アダプタープライマートリムツールであるcutadaptをローカルでインストールしたバージョンで動かしたいという場合の方法。 cutadaptはpipでインストールすることができるが、実行時に実際に直接叩いているのは以下のスクリプト。 #!/usr/bin/python import s…

MAFFTでアラインメントの距離行列を得る

MAFFTのTipsに "How to get a distance matrix, instead of alignment" の記述があるものの、まだドキュメントが作成されていないようだったので調査。mafftのドキュメントにはないが、binaryの中に"mafft-distance"(source)と言うものがあったので使ってみ…

Pythonで配列のJaccard距離を計算する(scipy.spatial.distance.jaccard)

Jaccard距離とは2配列間の距離(類似性の逆)をその要素の正誤によって求める指標である。 しかし、配列の要素がNaNかNaNでないか(または0か0より大きいか)を区別したい場合と、完全に値が一致しているかしていないかを区別したい場合などがある。 scipyにはsc…

Pandasで全て欠損値(NaN)の行を除く

特定のカラムを除いた後にすべて欠損値の行ができてしまうと後の解析でエラーを吐く可能性があるので取り除いておきたい場合がある。 frame.ix[frame.notnull().any(axis=1), :] を使う。 isnull(), notnull()の出力を、all(), any()をaxisとともに組み合わ…

PyMC3 pm.sample()でAttributeErrorが出る

Traceback (most recent call last): File "test_pymc.py", line 18, in <module> trace = pm.sample(niter, step, start) File "pymc3/sampling.py", line 224, in sample init = init.lower() AttributeError: 'dict' object has no attribute 'lower' pipでバージ</module>…

qsubでlocal installしたツールを叩く

qsubで計算クラスターにジョブを投げる際、ローカルインストールしたツールを叩きたい時がよくあります。 いままでは何も考えずにスクリプトに直接絶対PATHを書いていたのですが、 ツールによってはその内部でPATHに通っている別のプログラムを呼び出してい…

PyenvのAnacondaでインストールしたモジュールがインポートできない(解決)

$ pyenv install anaconda2-4.2.0 $ conda install foo $ python Python 2.7.12 |Anaconda 4.2.0 (x86_64)| (default, Jul 2 2016, 17:43:17) [GCC 4.2.1 (Based on Apple Inc. build 5658) (LLVM build 2336.11.00)] on darwin Type "help", "copyright", "…