タンパク質間相互作用予測の話


この記事は創薬 Advent Calendar 2017 (http://adventar.org/calendars/2412) の14日目の記事です。
連載3日目は、化合物を選ぶバーチャルスクリーニングから少し離れて、タンパク質間相互作用という生命現象を予測する話をします。


タンパク質間相互作用と創薬
タンパク質間相互作用、Protein-Protein Interaction、略してPPIとよく呼ばれます。狭義にはタンパク質同士が結合して複合体を形成すること、広義にはタンパク質同士がなんらかの影響を及ぼし合っていることを指します。創薬としては、PPIするタンパク質同士をPPIさせなくするような薬=PPI阻害薬を開発できないかと、ここ10年以上[要出典]、試行錯誤がされています。
話題の抗体医薬品であるオプジーボニボルマブ)も、PD-L1とPD-1というタンパク質同士のPPIを阻害するので、PPI阻害薬と呼ぶことができます。が、一般に抗体医薬のことをわざわざPPI阻害薬と呼ぶことはほとんどありません[要出典]。抗体医薬が狙うのは細胞膜上に刺さっている膜タンパク質(オプジーボであればでT細胞のPD-1)であり、この膜タンパク質に覆いかぶさってはたらきを阻害します。しかし、2000年代から注目されている[要出典]PPI阻害薬の創薬は、細胞の中のPPIを標的として、細胞膜を通過できる低分子などで薬を作ろうというものですので、抗体医薬の創薬とは少し毛色が異なってきます。
なお、抗体医薬については中外製薬のウェブサイトがわかりやすいです。(たとえばこちら https://chugai-pharm.info/bio/antibody/antibodyp14.html

狭義のPPI、タンパク質の複合体には、いろいろな形が存在します。構造ベース創薬をやるなら複合体構造の形を知りたくなりますが、すでにたくさんの複合体構造が解かれてProtein Data Bankに登録されています。以下はその一例です。(Scott DE, et al. Nat Rev Drug Discov 15: 533, 2016 より引用)

この中で、たとえばインターロイキン2 (IL-2) については低分子の阻害剤の設計がいくつか論文等でも報告されています。(Scott DE, et al. Nat Rev Drug Discov 15: 533, 2016 より、一部改変)

細胞膜上のタンパク質は抗体医薬によって数多く狙われていますが、細胞の中のタンパク質にはまだまだ手付かずのものも多いです。PPI阻害薬は、創薬過程にたくさんの課題はありますが、新奇の標的が狙えるとして注目されているのです。


タンパク質間相互作用を予測する
タンパク質間相互作用の予測は、化合物の世界のバーチャルスクリーニングと様相がよく似ています。すでにPPIの相方が分かっているタンパク質同士を機械学習にぶち込んで未知のPPIを予測する機械学習ベースの方法と、ドッキングなどの方法で立体構造から相方を探す構造ベースの方法が存在します。

機械学習ベースの方法は、創薬 Advent Calendar 2017 (http://adventar.org/calendars/2412) 13日目の記事として紹介した薬剤標的相互作用予測 (http://d.hatena.ne.jp/tonets/20171213/1513094866) の方法がほぼそのまま使えます。つまり、タンパク質Aとタンパク質Bのペア (A, B) をなんらかの方法で特徴ベクトルにし、Y2Hなどの実験によって得られた相互作用の有る無しを {+1, -1} としてラベル付けし、SVMや無敵のディープラーニング[要出典]に突っ込んであげればよいのです。
実際に2006〜2007年ごろから機械学習によるPPI予測が試みられて、おそらく現在までに50報くらいは論文があると思います。昔は"-1"のラベル、「相互作用しないよ」というラベル情報がほとんどなく、相互作用するペアの相方をランダムに入れ替えたものを便宜的に使っていたりしましたが、最近では「相互作用しない」という情報を集めたデータベースなんかもでてきています(http://mips.helmholtz-muenchen.de/proj/ppi/negatome/)。

構造ベースの方法は、タンパク質同士の複合体構造を予測し、そのときのエネルギースコアの値を使って相互作用するかしないかを判定します。タンパク質同士の複合体を予測すると言った論文もこれまた山ほどあります(ざっと数百報の規模)。実は計算機による複合体予測の歴史はずっと古く、はじまりは1972年と言われています。以下の図は、私が調べた中で世界初だと思う複合体予測(BPTIとα-chymotrypsin)の論文 (Blow DM, et al. J Mol Biol 69, 137-144, 1972) の図です。

今ではたくさんのフリーソフトウェアやサーバーが出てきて、とても気軽に複合体構造が予測できるようになりました。例えばClusPro (http://cluspro.bu.edu/) は、タンパク質複合体構造予測コンペのCAPRIでとても優秀な成績を収めているサーバーで、よく使われています。Glideで有名なSchrödinger社がPIPERという名前で販売しているものと中身はほぼ同じです。

1つのタンパク質ペアに着目して複合体構造を予測したり、数ペア程度のタンパク質のPPI有る無しを知りたいという場合には、ClusProを使うのが良いかもしれません。しかし、例えば調べたいタンパク質のペアが1,000とか10,000とか、百万通りとかある場合には、なかなか構造ベースの方法では計算が大変で追いつきません。



MEGADOCK

そんな要望に応える形で我々が開発したのがMEGADOCK (http://www.bi.cs.titech.ac.jp/megadock/) です。MEGADOCKは、ClusProほどの精度は無いものの、速くたくさんのタンパク質ペアのドッキングが計算ができる唯一のソフトウェアです。流行りのGPU計算やスパコンでの計算にも対応しており、たとえば1台に4基のGPUが刺さったワークステーションでもGPUをすべて使って計算することができます。

しかし、ご家庭にスパコンはありません。自分の知りたいタンパク質ペアがどういう予測結果になるのか、かんたんには計算ができない場合もあるでしょう。そんなときのために、MEGADOCKの計算を予めやっておいたデータベースも作っています (MEGADOCK-Web: http://www.bi.cs.titech.ac.jp/megadock-web/)。論文はopen access誌のBMC Bioinformaticsという論文誌に2018年にpublishされることが決まっておりますので、興味のある人はpublishされたら読んでみてください。中身としては、ヒトのタンパク質鎖約7500個の全対全、 (\mbox{}_{7500}C_2 + 7500 \simeq 28{,}000{,}000)ペアのPPI予測結果と複合体モデル構造が閲覧できるようになっており、JavaとPlay Frameworkを用いて構築されています。



まとめ
最後は脱線気味でしたが、新しいPPI標的を探して、PPI阻害薬を設計していくのは、創薬としてはかなり壮大な旅です。そんな旅を支えるツールとして、様々なソフトウェアが開発され、利用されていますので、興味がわきましたら是非調べてみてくださいね。