検索戦略が違う!? タンパク質の文献検索
コラムでは、CAS SciFinder のユーザーの方を対象に、検索に関するお役立ち情報や、ちょっとした豆知識を提供します。今回はタンパク質の文献検索を行う際のポイントについてご紹介します。
タンパク質に関する文献を調べてみよう
近年、「免疫対策」が注目されています。「免疫ケア」「免疫サポート」を謳った様々な製品を目にする機会が増えました。
そこで本記事では、免疫系細胞から分泌される低分子のタンパク質であり、細胞間の情報伝達を担っているサイトカインの様々な機能について、CAS SciFinder を使って文献検索する際の方針を解説します。
タンパク質の文献検索の場合、検索のスタートが一番のポイントです。
「Substances 画面で目的の化学物質を探してから文献検索」という一般的な有機化合物の検索ルートとは異なる場合がありますので、生化学分野の研究者の方は、次の流れをしっかりと覚えておいてください。
タンパク質の文献検索は研究内容によって検索ルートが異なる
タンパク質はその出典となる文献の研究内容によって、次のように CAS SciFinder での収録が異なります。そのため、おすすめの検索ルートも違った経路になります。
-
「機能」「働き」が主題の文献を探したい場合:CAS Lexicon からスタート
上の図で水色のエリアに相当する場合です。
このようなケースでは、タンパク質の CAS 登録番号 (CAS RN®) ではなく、タンパク質の名称が統制語 (化合物クラス名) で文献レコードに収録されます。つまり、統制語を使った文献検索が必要です。
CAS SciFinder では、CAS Lexicon 機能を使って、統制語を調べ、階層語を含めて検索できますので、CAS Lexicon 画面から検索をスタートしてください。
例えば、サイトカインの一つであるインターロイキン12 (IL-12) の機能に関する文献を調べたいなら、CAS Lexicon 画面で Interleukin 12 を探し、下位の概念である Narrower Concepts も含めて Search するのがおすすめです。
検索した結果 66,000 件余りの文献情報を得ることができました。(2025 年 1 月 23 日時点)
CAS SciFinder には CAS が作成している文献データベース (CAplus) だけでなく、PubMed の由来の文献情報 (MEDLINE) も含まれています。回答リストのうち、Database:CAplus and MEDLINE と表示されるのが、両方のデータベースに収録されている論文・記事です。
CAS Lexicon から検索をスタートしていますので、この結果は CAS の文献データベース (CAplus) を統制語 (CAS Lexicon) で検索した結果であり、MEDLINE のレコードを統制語 (MeSH) で検索したものではありません。
MEDLINE レコードを統制語で追加検索し、より包括的な回答を入手する方法を次の項目で説明します。
MEDLINE (PubMed) レコードの統制語検索
CAS SciFinder には CAS が作成している文献データベース (CAplus) だけでなく、PubMed の由来の文献情報 (MEDLINE) も含まれており、該当するレコードには索引情報 (統制語:MeSH) も収録されています。
統制語検索は、Advanced Search Field で Concept を選択して行います。CAplus、MEDLINE の双方で同じ統制語が用いられている場合は、1回の検索で両データベースを一括検索した結果を入手できます。
MEDLINE でしかヒットしなかった文献を確認するには、Filter を Exclude に変更して、Database で CAplus にチェックをすると、「CAplus を除いた回答=MEDLINE のみの回答」が即時に表示され、便利です。
それでは MEDLINE レコードの詳細を表示して、MEDLINE® Medical Subject Headings のエリアを見てみましょう。検索に使用した統制語 (MeSH) がハイライトされています。
また、下記の5つの MeSH は太字になっていることにお気づきだと思います。これら太字で表示される MeSH は、MeSH Major Topic (中心的主題) です。RTF 形式または PDF 形式でダウンロードするファイルにも Bold 体が反映されますが、それ以外の形式でダウンロードした場合は書式なしになります。
- Immunotherapy, Adoptive
- Interleukin-12
- Receptors, Chimeric Antigen
- Receptors, CCR5
- Tumor Microenvironment
CAS SciFinder では、同じ MeSH タームが複数回索引されている場合、サブヘディングが Qualifier 欄にまとまって表示されます。つまり、PubMed では Receptors, Chimeric Antigen についてサブヘディング毎に表示されますが
CAS SciFinder では、サブヘディングをまとめて次のように表示しています。
上記以外のタンパク質の文献を探したい場合:Substances 検索からスタート
最初の図で黄色、グリーン、白色のエリアに相当するタンパク質です。
これらのケースでは、タンパク質は CAS 登録番号 (CAS RN®) で文献レコードに収録されます。つまり、目的のタンパク質の CAS 登録番号 (CAS RN®) を調べるのが先決です。
Substances 検索または Sequences 検索で、目的のタンパク質の物質レコードを探し、その後 References 検索を行います。
インターロイキン12 (IL-12) の名称検索例
タンパク質の名称には、起源種や鎖・領域、置換位置、遺伝子などの情報が括弧内に記載され、様々なパターンがありますので、CAS SciFinder で名称検索する場合はサジェスト機能によって提示される名称一覧から選択すると便利です。
回答画面で「Sequence Length」が表示されるのが、配列情報が収録されているレコードです。
下図には構造が収録されているレコードはありませんが、水素以外の構成元素が 252 までで構造が収録されているタンパク質であれば、構造検索もできます。
まとめ
Substances 検索画面でタンパク質を検索して文献数がとても少なかった、という経験がある方は、次回検索する際は本記事の検索方針に沿って行うと、タンパク質の文献を包括的に入手できます。
-
(酵素やホルモン以外の) タンパク質の働き・機能について研究している⽂献は、統制語で検索する
-
働き・機能以外のタンパク質の文献は、CAS RN® を探してから文献を検索する
-
MEDLINE (PubMed) の文献も検索したい場合は、Advanced Search の Concept で検索する
思うような検索結果が得られない場合は、ヘルプデスクにご相談ください。
・ ・ ・ ・ ・ ・
掲載日 2025 年 1 月 24 日