2017-10-01から1ヶ月間の記事一覧

MAFFTでアラインメントの距離行列を得る

MAFFTのTipsに "How to get a distance matrix, instead of alignment" の記述があるものの、まだドキュメントが作成されていないようだったので調査。mafftのドキュメントにはないが、binaryの中に"mafft-distance"(source)と言うものがあったので使ってみ…

Pythonで配列のJaccard距離を計算する(scipy.spatial.distance.jaccard)

Jaccard距離とは2配列間の距離(類似性の逆)をその要素の正誤によって求める指標である。 しかし、配列の要素がNaNかNaNでないか(または0か0より大きいか)を区別したい場合と、完全に値が一致しているかしていないかを区別したい場合などがある。 scipyにはsc…

Pandasで全て欠損値(NaN)の行を除く

特定のカラムを除いた後にすべて欠損値の行ができてしまうと後の解析でエラーを吐く可能性があるので取り除いておきたい場合がある。 frame.ix[frame.notnull().any(axis=1), :] を使う。 isnull(), notnull()の出力を、all(), any()をaxisとともに組み合わ…

PyMC3 pm.sample()でAttributeErrorが出る

Traceback (most recent call last): File "test_pymc.py", line 18, in <module> trace = pm.sample(niter, step, start) File "pymc3/sampling.py", line 224, in sample init = init.lower() AttributeError: 'dict' object has no attribute 'lower' pipでバージ</module>…

qsubでlocal installしたツールを叩く

qsubで計算クラスターにジョブを投げる際、ローカルインストールしたツールを叩きたい時がよくあります。 いままでは何も考えずにスクリプトに直接絶対PATHを書いていたのですが、 ツールによってはその内部でPATHに通っている別のプログラムを呼び出してい…

PyenvのAnacondaでインストールしたモジュールがインポートできない(解決)

$ pyenv install anaconda2-4.2.0 $ conda install foo $ python Python 2.7.12 |Anaconda 4.2.0 (x86_64)| (default, Jul 2 2016, 17:43:17) [GCC 4.2.1 (Based on Apple Inc. build 5658) (LLVM build 2336.11.00)] on darwin Type "help", "copyright", "…