これからシーケンス解析をする人の覚え書き|その1|環境構築〜FastQCインストール

シーケンス解析をやってみようと思い立ったので
それに伴う所作についての覚え書き

基本的に二階堂先生の書かれたTips for NGS Data Analysisに沿ってセットアップを行った。

所々2018年8月には記載と違う点があるため、その辺りをアップデートしています

また、筆者はLinuxにまともに触れるのが今回が初めて。
そういった人が何処で躓くのかが分かれば良いなと思っています。

 

Ubuntuのインストール

環境:

Ubuntu 18.04 LTS 日本語Remix版

https://www.ubuntulinux.jp/home

1台のPCで解析と普段の作業がしたかったためWindows10とのデュアルブート環境
デュアルブート環境の構築についてはこちらの記事通りに進めました
qiita.com


(インストールメディア用のUSBを作る手間をケチりDVDに直接焼いたら
起動までに時間がかかったのでインストール用USBを作るほうが良かった)

パッケージのインストール

インストール後に下記のコマンドによりパッケージをインストールする記載があるが、

ubuntu環境ではインストールの仕方が異なります。

ターミナルの起動方法は[Ctrl]+[Alt]+[t]

$ sudo port install wget
$ sudo port install w3m
$ sudo port install git-core

実際にインストールして使うのは下記の通り

$ sudo apt install wget
$ sudo apt install w3m
$ sudo apt install git-core

補足

ちなみに間違えてパッケージをインストールしたとき

$ sudo apt autoremove (パッケージ名)

を使うことでパッケージをインストールするときに同時にダウンロードしたパッケージを一斉にアンインストールすることができる

FastQCのダウンロードとインストール

必要なコマンドのインストールが終わったので、今度はFastQCのインストールを行う

FastQCの最新版はBabrahamBioinformaticsからダウンロードすることができる。
ダウンロードしたらそのまま解凍し、ドライブ直下にあるoptディレクトリにコピーする。
optディレクトリへのコピーは管理者権限が必要なためターミナルから操作した。

$ sudo cp -r /home/'ユーザー名'/ダウンロード/FastQC /opt
$ sudo ln -s /opt/FastQC /opt/fastqc

(ファイルリンクが大文字小文字を区別するのかしないのか調べていなかったので
念の為小文字のリンクも登録を行った)

次に

$ emacs -nw ~/.zshenv
$ export PATH=$PATH:/opt/fastqc

に対応する部分を行う("パスを通す"と言われている作業)

これは、コマンドライン上でFastQCのコマンドを呼び出せるようにする作業になる。

この作業はまず

コンピュータ>home>usernameディレクトリに存在する.profileというファイルをテキストエディタで開く
(隠しファイル属性なのでメニューから隠しファイルを表示をしておかないと見つけられない)

開いたファイルの最終行に以下のテキストを挿入して保存する。

export PATH=$PATH:/opt/fastqc

保存した後、再びターミナルに戻り以下のコマンドで更新したファイルを再読込する。

$ source ~/.profile

そうしたら、コマンドラインでfastqcと入力すればFastQCが立ち上がるはず。

立ち上がりませんでした。

パーミッションの設定が間違っているみたいなので、chmodで変更する。

変更方法は下記の通り

$ sudo chmod 755 /opt/fastqc/fastqc

これで今度こそコマンドが通るはずと思いきやJavaが未インストールだったためインストール。
CentOSにJava(JRE)を手動インストール – 海と写真と本が好きなシステム屋のブログ