結晶構造データベースとデータサイエンスの架け橋に
CCDC CEO インタビュー
2020年8月掲載
The Cambridge Crystallographic Data Centre (CCDC)
Chief Executive Officer (CEO), Dr. Jürgen Harter
ケンブリッジ結晶構造データベース(CSD)は、英国にあるThe Cambridge Crystallographic Data Centre(CCDC)が提供している、結晶学や分子設計等の分野に広く応用できる世界最大の有機化合物/有機金属化合物の分子性結晶構造データベースです。CCDCのCEOであるDr. Jürgen Harterに、CCDCのストラテジーと将来のビジョンについてインタビューしました。
化学と情報工学分野の融合
——CCDCのCEOに着任する前の経歴やバックグラウンドについて教えてください。
Dr. Jürgen Harter:2018年7月にCCDCに着任する前は、バイオテクノロジー企業のIT部門と情報システム部門の部長として、情報システムの構築やゲノム編集などのビッグデータを取り扱う仕事をしていました。その前には、クラウドを使った治験管理システムの開発を行っていたこともあります。学生時代は化学を専攻し、ケンブリッジ大学でPh. D. を取得した後、分子インフォマティクス分野で博士研究員をしていました。これまでを通してみると、科学の中でも特に化学やバイオテクノロジーに関連したビッグデータとソフトウェアを繋ぐ仕事をしてきたといえますね。これまで培ってきた様々な分野での経験を活かすことができるので、CCDCのCEOに就任したことを嬉しく思っています。
——CCDCのミッションはどのようなものですか。
Dr. Jürgen Harter:CCDCのミッションとして一番に挙げられるのは、世界中の構造化学の発展を推進していくことです。CCDCは、国際的なデータ・レポジトリであり、同時にソフトウェアを提供しているほか、様々な研究機関と共同研究も行っています。私たちは、実験で得られた結晶構造や関連のデータを世界中から収集して、全世界の研究者に提供しています。その他にも、結晶構造データをより利用しやすくするためのソフトウェア開発にも力をいれています。データの検索や解析、可視化だけではなく、データ同士を相互にリンクさせることによって新たな情報を得ることを目指しています。
アジャイルなソフトウェア開発
——CCDCのCEOに就任して、どのような部分を変えていきたいと考えていますか。
Dr. Jürgen Harter:私が着任した時に、CCDCには既に60年間蓄積してきた高精度な結晶構造データベースがありました。21世紀の現在では人工知能や機械学習によってできることが増えており、結晶構造データベースをこれまで通り強化するだけでなく、さらに既に手元にあるデータから、もっと多様で価値のある情報を得られるようにしたいと考えました。それには結晶構造データと様々なソフトウェアをリンクさせていく必要がありますが、これまでの開発スピードには課題がありました。そこで重要になってくるのが、アジャイルな組織です。顧客の早期プロジェクト成功のために、顧客に密着し迅速にかつ能動的に行動できるソフトウェア開発チームを就任してからの2年間で作りました。具体的な開発としては、ソフトウェアのプラットフォームを統一したり、アクセスしやすくする取り組みを行っています。将来的に人間だけではなく、機械も直接データにアクセスできるようにする必要がありますので、Python APIもリリースしました。
次にデータについての考えを述べます。データにアクセスする際、どういったバックグラウンドをもつデータか、またどういった目的でデータを利用するのかを理解することが大切です。データの周辺情報であるメタデータも必要になりますので、それに伴うデータマネジメントの体系についても構築中です。このようなサービスを通して、これから先の10年に向けてデータサイエンスを推進していきたいと考えています。
Digital First というストラテジー
——CCDCのデータサイエンスとCSDに対するストラテジーについて詳しく聞かせてください。
Dr. Jürgen Harter:私たちはストラテジーの一つとして、実験や理論で導き出されたデータに基づき判断していく"Digital First"というコンセプトをみなさまに推奨したいと思います。例えば、私たちが提唱しているDigital Drug Design CentreやDigital Drug Discovery Centreの取り組みは、製薬会社のみなさんにとって高い利用価値があるはずです。"Digital First"を適用することで、実際に実験して行う開発に比べて時間と費用を大幅に削減でき、最終的に大きな利益を見込めるからです。
"Digital First"というコンセプトのベースには、化学とバイオテクノロジーは同じ土俵で議論することができる、という考え方があります。近年、バイオテクノロジー分野で大きな進歩があり、生体高分子の分野においても多くの発見がなされてきました。その中で低分子やリガンドからの情報も重要なことがわかってきました。それにともない、解析に使うデータベースのリンクも必要になってきます。蛋白質構造データバンク(PDB)など他のデータベースとCSDをリンクして運用することは、これからのバイオテクノロジーの進展に必要であり、私たちCCDCの強みにしていけると考えています。例えば、私たちには低分子の高分解能のデータがあるので、MogulというCSD由来のライブラリーを使い、PDBに収録されているリガンドのデータを強化・修正し、タンパク質のデータの精度を高めています。このような相互運用によって、お互いのデータを強化して研究者が利用しやすい形にしています。さらに材料科学の観点から、CSDと無機結晶構造データベース(ICSD)についても同様に相互運用を進めているところです。
その他に新しい試みとして学術界や産業界の専門家によるScience Advisory Boardを組織し、製品開発の方向性の検討を行っています。バイオテクノロジーに限らず電池や触媒など幅広い分野でCCDCの科学分野のストラテジーについて議論しています。その情報を基に、それぞれの分野の要望に沿ったサービスを提供します。例えば、材料物性研究に適したParticle系のソフトウェアを現在開発中です。
日本の研究者へのメッセージ
——CCDCから日本の研究者の方に向けてのメッセージをお願いします。
Dr. Jürgen Harter:私たちCCDCは、様々な研究分野の皆さまにデータベースをご利用いただくために、それぞれの研究分野に沿ったサービスをお届けできるようにしています。皆さまからの提案やフィードバックを基にして、それぞれの研究がさらに便利に行えるようにサービスを強化する体制も整えています。私たちの組織には、サイエンティスト、ソフトウェアエンジニアやサポートスタッフがおりますので、ユーザーの皆さまや、これから利用を検討している皆さまからのご相談にきめ細かく対応しております。どうぞお気軽にご相談ください。
JAICI:本日はどうもありがとうございました。
CCDC紹介
The Cambridge Crystallographic Data Centre (CCDC)
12 Union Road
Cambridge, CB2 1EZ
United Kingdom
英国のケンブリッジ結晶学データセンター The Cambridge Crystallographic Data Centre (CCDC) は、世界でもっとも権威のある結晶構造データベースとして結晶学研究者、分子設計研究者に広く活用されている「ケンブリッジ結晶構造データベース (CSD) 」を提供している非営利機関です。ライフサイエンスや結晶学分野のソフト開発と販売にも業務を広げ、世界中の科学者の研究開発を支援しています。
Dr. Jürgen Harter
ケンブリッジ大学にて有機化学のPh. D. 取得。Horizon Discovery、Exco InTouch、PerkinElmer Informatics、CambridgeSoft、Abcam and Biowisdomを経て2018年7月にCCDCのCEOに就任。
化学情報協会では、CSDやICSDなどX線構造解析で決定された結晶構造のデータベースや物性データベースを扱っております。