情報源を知ろう (化学物質編)
コラムでは、CAS SciFinder のユーザーの方を対象に、検索に関するお役立ち情報や、ちょっとした豆知識を提供します。本稿では CAS SciFinder の Substances に収録されている化学物質の出典についてご紹介します。
2億8千万の化学物質情報をどこから集めたのか
CAS SciFinder の文献から化学物質を収録
CAS SciFinder の Substances では、28,500 万件以上の化学物質を検索することができます (2023 年 10 月 12 日時点)。
これらの化学物質の多くは、References にある文献の原報から抽出された化学物質です。
CAS では 1907 年の創刊当時から、「アナリスト」と呼ばれる分析担当者がこの作業を担当しており、現在でも人間が化学物質を識別・抽出して、ルールに則って収録しています。
では、CAS SciFinder に登録された時の出典を知るには、どこを見ればよいのかご存知でしょうか?
化学物質の出典を確認するには
正解は Source of Registration です。Source of Registration は、化学物質の Additional Details という項目に含まれています。
したがって、出典を確認したい場合は、個々の化学物質の情報をスクロールし、一番下に折り畳まれている 「Additional Details」 をクリックして開きます。
この 85896-45-3 の例では、Source of Registration に「European Union」と記載されていますので、EU REACH 等の事由により公的機関の依頼に基づいて登録された化学物質だと分かります。
文献由来じゃない化学物質もたくさん登録されている
上の例で出てきた European Union のように CAS SciFinder の文献由来ではない化学物質も多数登録されています。ここでは CAS SciFinder に化学物質が最初に登録される際の、収録源をランキング順にご紹介します。
1位:CA (References)
CAS SciFinder の文献(References)から収録された化学物質の場合は「CA」と記載されます。Substances の化学物質の大半 (1.1 億) は、そのような由来で登録されたものです。(2023 年 10 月時点)
収録ルール
References に含まれる文献から化学物質から登録される場合は、以下のルールが適用されています。
- 原文献に記載されており科学的・技術的に新しい知見があった化学物質
- 特許実施例中またはクレーム (1981 年以降) に記載されており,新規性・改良点,重要な事項に関連する化学物質(Prophetic 物質の収録については、年代によって収録ルールの変遷があります。)
2位:Chemical Catalog、Chemical Library
いずれも化学品の供給業者が作成しているカタログから収録された物質です。原則として building block catalogs 由来の場合は Chemical Catalog、screening compound library catalogs 由来の場合は Chemical libraries になります。
カタログ由来で登録された物質は全体の約 43%を占めています。(2023 年 10 月時点)
3位:GenBank
文献以外の収録源として2番目に多いのは、GenBank 由来で収録された核酸やタンパク質の配列です。
GenBank 由来で登録された物質は約 17% です。(2023 年 10 月時点)
4位:Other Sources
CAS 以外の機関が製作した化学物質のデータベースから登録された物質です。全体に占める割合は1%未満です。(2023 年 10 月時点)
代表的なデータベースには次の通りです。
- ChemBank (The Broad Institute)
- HIV/OI/TB Therapeutics Database (National Institute of Allergy and Infectious Diseases)
- Integrated Spectral Data Base System of Organic Compounds (National Institute of Advanced Industrial Science and Technology in Japan)
- NCI 2D, NCI 3D (National Cancer Institute)
- NIST Mass Spectral Library (National Institute of Standards and Technology)
- Roadrunner (New Mexico Molecular Libraries Screening Center)
- Wiley Subscription Services, Inc
- UPCMLD Library (University of Pittsburgh Center for Chemical Methodologies and Library Development)
- ChemSpider (ChemZoo, Inc.)
5位:CAS EARLY REGISTRATIONS
CA と表示されるものと同じで、CAS SciFinder の文献から収録された化学物質です。1966 年以前の古い年代の文献についてCAS が化学物質の索引を遡及収録した際に追加登録された化学物質にこのコードが付けられています。件数は僅かで1%未満です。(2023 年 10 月時点)
6位:CA Index Guide or Ring Systems Handbook
新規登録物質中に含まれる環母核 (Ring Parent) が新規である場合には、CAS が使用している化学物質の命名法である「CAS 命名法」に基づき、環母核自体をデータベースに登録します。そのような経緯で登録されたレコードには、CA Index Guide or Ring Systems Handbook が付いています。
Ring Systems Handbook の冊子体は 2008 年に廃止されましたが、現在でも新しい物質由来の環母核にはこのコードがつけられています.件数は僅かで1%未満です。(2023 年 10 月時点)
Substance Classes とは一致しないことがある
環母核については、Substance Classes のフィルターで Ring Parent を使って絞り込むことができます。
ただし、Substance Classes が Ring Parent でも、収録源が CA Index Guide or Ring Systems Handbook ではない場合もあります。また、一見環母核に見えても、Substance Classes に Ring Parent が付与されていない物質もありますので、フィルターを用いる場合はご注意ください。
7位:CAS CLIENT SERVICES
CAS 登録番号 (CAS RN®) サービスにより、登録された化学物質です。特定の企業や機関からの依頼によって、CAS 登録番号 (CAS RN®) が付与されたものです。件数は僅かで1%未満です。(2023 年 10 月時点)
8位:Reaction Database
CAS SciFinder の Reactions に収録されている反応情報から登録された化学物質です。件数は僅かで1%未満です。(2023 年 10 月時点)
9位:公的機関のデータ
公的機関からの依頼や既存化学物質リストの掲載のために、CAS 登録番号 (CAS RN®) が付与されたものです。といっても、多くの機関名が収録されているわけではなく、現在収録されているのは次の機関名です。
- AMERICAN SOCIETY OF HOSPITAL PHARMACISTS
- ENVIRONMENT CANADA (EC)
- European Union
- US Adopted Names Council (USAN)
- World Health Organization (WHO)
まとめ
ここまで、CAS SciFinder (サイファインダー) の化学物質データである Substances (REGISTRY) の最初の収録源について説明しました。
まとめると、次のようになります。
-
化学物質が最初に登録された時の由来を知りたいときは、Additional Details の Source of Registration を見る。
-
Substances は、文献中の物質情報を集めたことがはじまり。だから多数の Source of Registration は CA。
-
後年になって、文献以外のソースからも化学物質を追加。だから、文献以外の経由で登録された物質もある。
-
Source of Registration で分かるのはあくまで最初に登録されたときのキッカケ。
Source of Registration の情報は CAS SciFinder では検索することはできませんが、化学物質が最初に収録された時の由来を知りたいことがありましたら、こちらの記事をご参考にしてください。
掲載日 2023 年 10 月 13 日