情報源を知ろう (文献編)
コラムでは、CAS SciFinder のユーザーの方を対象に、検索に関するお役立ち情報や、ちょっとした豆知識を提供します。本稿では CAS SciFinder の References のうち CAplus のデータセットについてご紹介します。
調査対象を言語化して定義する
「CAS SciFinder で調べた」ってどういうことか説明できますか?
春先~初夏にかけては CAS SciFinder を使い始める新ユーザーが増えるシーズン。使い方の説明会がアチコチの企業や大学で開催されます。そのような機会に「CAS SciFinde で欲しい文献がうまく探せなかった。」といった相談を受けることがあります。
「欲しい文献が見つからなかった」
そんな時、あなたは原因を深掘りしていますか?
原因を深堀りしてみよう
CAS SciFinder で目的の文献が検索結果として得られなかった原因を考えてみましょう。きっと、次の2つのパターンが思い浮かぶはずです。
目的の文献が CAS SciFinder に収録されていない
このケースは当然といえば当然です。「ない」ものを探しても、検索でヒットするはずがありませんから。
ただ、「ない/なかった」という結果も、ひとつの有用な「情報」であること。そして、「どのようなデータセットを検索した結果であるのか」を知っておくことはとても重要です。
目的の文献が CAS SciFinder に収録されているのに、検索結果に含まれていなかった
こちらのケースは、情報検索で言われる「検索漏れ」です。つまり、正確に表現すると「目的の文献レコードは CAS SciFinder に存在していた。しかし、検索したときの条件が CAS SciFinder のレコードにマッチしなかったので検索結果に含まれていなかった」という状況です。
このような検索漏れは、CAS SciFinder にどのような種類の情報がどのように収録されているのかをよく知ることで、回避できるようになります。
CAS SciFinder のデータセットを知ろう (学術論文編)
CAS SciFinder の収録情報は、ホーム > CAS SciFinder Discovery Platform > CAS SciFinder > 概要 > 収録内容 のページ (注1) に記載されているので、見てみましょう。
まず、文献情報の収録情報として挙げられている最初の項目です。
有機化学、無機化学、生化学、応用化学、物理化学、生物学、医学、工学、材料科学、農学等の分野の学術論文、学位論文、総説、書籍等
・・・
分かったような分からないような、モヤモヤした気分になりましたね。
ここは、「収録対象の分野」と「収録対象の文献種類」に分けて捉えてください。
-
有機化学、無機化学、生化学、応用化学、物理化学、生物学、医学、工学、材料科学、農学等の分野
-
学術論文、学位論文、総説、書籍等
そして、CAS References (CAplus) に収録される学術文献は A かつ B (A∩B)が必須条件です。
収録条件 A - 対象分野 (内容)
収録対象分野のベースは CA Section です。CAS では化学の学問分野を 80 のセクションに分類しており、文献の主題が 80 のセクションにいずれかに該当するものを収録します。
収録対象分野:主題が The Secrions of CA に該当する学術論文、記事
論文の主題が 80 のセクションのどれに該当するのか、または該当しないのかの判断は CAS の担当者が行っています。そして、主題が 80 のセクションのいずれにも該当しない場合は、収録されません。
現在のセクションの一覧は次のリンクのページで確認することができます。ただし、CA セクションの番号やセクション名 (例:4. Toxicology) は年代によって変更される場合があります。上記のサイトで確認できるのは、あくまでもその時点のセクションです。
追加の収録対象:(主題が The Secrions of CA に該当しなくても) Core Journal (主要雑誌) の記事はすべて収録する
前述の収録対象分野である 80 セクションについては、例外があります。CAS が定めた主要雑誌の記事は、主題が 80 セクションから外れていても、つまり化学関連分野の主題でない内容の記事でも 1994 年 10 月以降は収録対象としています。
そして、どの雑誌が主要雑誌 (Core Journal) なのかは、下記のサイトで調べることができます。
Core Journal Coverage List (注3)
しかし、追加の収録対象については、レコードの "重みづけ" が違います。この レコード作成の違いについては、機会があれば別のコラムで述べたいと思います。
収録条件 B - 収録対象誌
CAS では 100 ヶ国以上の定期刊行物をモニターしており、CAS SciFinder には学術雑誌に掲載されていた論文のほか、学位論文、総説、書籍、特許など ... さまざまな文献種類が収録されます。
収録対象誌を確認するなら - CAS Source Index (CASSI)
目的の雑誌が CAS SciFinder の収録対象になっているのかどうかを調べたい場合におすすめなのが、CAS Source Index (CASSI) です。CASSI は 2023 年時点では冊子体の提供を終了しましたが、その代わりどなたでもウェブ上で調べられるようになりました。CASSI へは以下のリンクからアクセスできます。
CAS Source Index (CASSI) Search Tool (注4)
CASSI Search Tool では、雑誌名や略名、CODEN、ISBN または ISSN から
- 何年から収録しているか
- 現在収録対象になっているか
- 以前の雑誌名 (雑誌名が変更になった場合)
等を知ることができます。次に BIO Clinica (バイオクリニカ)(出版社:北隆館) について調べる場合の例を示しました。画面はクリックすると大きく表示できます。
ここでは学術雑誌の確認サイトとして CASSI をご紹介しましたが、CASSI では単行本や特許など、雑誌以外の収録源についても調べることができます。
参考
学術雑誌の文献レコードは CA References (CAplus) の 62% を占めています。
これを CAS SciFinder で求めるには、以下のように検索してみてください。
References の Publication Year : to 2024 (86,964,333 Results)
Filter by Database : CAplus (60,923,147 Results)
Filter by Document Type: Journal (38,011,917 Results)
この結果から 38,011,917/60,923,147×100≒62% が分かります。(2023 年 6 月 14 日時点)
CAS SciFinder のデータセットを知ろう (特許編)
CAS SciFinder に収録されている CA References (CAplus) の約 31% は特許です。(2023 年 6 月 14 日時点)
では、特許の収録状況について、もう一度 CAS SciFinder の収録情報のページ、ホーム > CAS SciFinder Discovery Platform > CAS SciFinder > 概要 > 収録内容 を見てみましょう。(注1)
100 ヶ国以上の特許発行機関が発行する特許
・・・
まぁ、そんな感じなのですが、特許についても雑誌論文と同じく、「収録対象の分野」と「収録対象の文献種類」に分けて捉えてください。
-
有機化学、無機化学、生化学などの対象分野
-
特定の国・地域の特許
そして、CAS References (CAplus) に収録される特許は A かつ B (A∩B)が必須条件です。(注6, 注7)
収録条件 A - 対象分野 (内容)
特許の場合、収録対象分野の判断には国際特許分類 (IPC) と米国特許分類 (U.S. NPC) が用いられています。どのような特許分類を収録対象にしているのかは、CAS Coverage of Patent に次の3種類の特許番号リストを参照すると分かります。(注5)
IPC Reform I for Guaranteed Coverage (収録対象 IPC)
IPC Reform II for Selective Coverage (選択収録 IPC)
U.S. National Patent Classifications Codes for Selective Coverage (米国特許分類)
収録対象分野:IPC List I の国際特許分類が付与されている特許は収録する
IPC List I は「Guaranteed Coverage」。つまり、収録保証されていますので、レコードの基礎になるベーシック特許について、IPC List I の IPC が一つでも付与されている特許は必ず収録されます。
例えば、B82B、C01B、D06L が IPC List I に含まれています。
収録対象分野:IPC List II の国際特許分類しか付与されていなかったら、CAS スタッフが収録するかどうかを決める
IPC List I の国際特許分類が一つも付与されていなかった場合に、そのような特許を絶対に収録しないかといったら、そうではありません。IPC List I の国際特許分類が一つも付与されていなくても、IPC List II の国際特許分類が付与されている場合は、CAS のスタッフがその特許を収録するか否かを決めています。米国特許の選択には、米国特許分類も参考にしています。
例えば、A01P、B01B、H01L が IPC List II に含まれている代表的な分類です。
収録対象分野:主要 40 ヶ国の特許については IPC List I も IPC List II も結局同じ (完全収録)
ただし、IPC Reform List II - Selective Coverage に記載されている 40 の国と地域の特許については、「Patent documents with one or more of these IPC codes are automatically selected for coverage if they are issued by the following countries or patent offices:」と書いてあります。そう、結局 IPC List I と同じなんです!
下の表がこの 40 の国と地域。中には日本も含まれています。
ARIPO (アフリカ広域知的財産機関) |
オーストリア |
オーストラリア |
ブルガリア |
カナダ |
中国 |
チェコスロバキア |
チェコ |
ドイツ |
ユーラシア特許 |
エジプト |
欧州特許 |
フランス |
イギリス |
GGC (湾岸協力会議) |
ギリシャ |
香港 |
クロアチア |
ハンガリー |
アイルランド |
イスラエル |
インド |
日本 |
韓国 |
リトアニア |
ルクセンブルク |
ラトビア |
メキシコ |
マレーシア |
ニュージーランド |
フィリピン |
ルーマニア |
ロシア |
シンガポール |
スロベニア |
スロバキア |
台湾 |
米国 |
PCT 出願 |
南アフリカ |
この表から分かるように、ほとんど我々が日常的に検索対象とする特許国が含まれています。
ということで、結局のところ IPC List I も List II も (ほとんど) 分けて考える必要はありません。
対象の特許分類が一つでも付与されている特許は収録される
ぐらいに覚えておいてください。
収録条件 B - 収録対象特許国、特許種別
新規レコードのもとになるベーシック特許の収録対象国・特許種別および年代については、Coverage of CAS Basic Patents by Year の表に詳しくまとまっています。国によって特許公報の種類や対象年代が違うので、こちらをご覧ください。
Coverage of CAS Basic Patents by Year
表は国名のアルファベット順になっています。例えば、日本特許について知りたい場合は J の欄を見ます。日本の公開特許の場合は、Japan A 1971- とありますので、1971 年以降が収録対象になっていることがわかります。
参考:ベーシック特許とは
CAS SciFinder では同じ発明の特許情報を,一つのレコードにまとめて収録しています。そして、新しい発明内容の特許を入手した際,新規レコードを作成する元となった特許のことを便宜上「ベーシック特許」と呼んでいます。
ベーシック特許は常に特許ファミリー (Patent Family) の一行目に表示されます。したがって、下図のレコードの場合は EP2136431 がベーシック特許です。CAS が作成する抄録や索引は、すべてこのベーシック特許がもとになっています。
特許ファミリー情報の2行目以降の対応特許については番号類は収録されますが、対応特許をもとに抄録や索引情報が追加されたり、修正されたりすることはありません。
対応特許の収録基準は、ベーシック特許のそれとは異なります。つまり、ベーシック特許として収録されなくても、対応特許として収録される特許種別があります。国ごとにどのような特許種別が収録対象になっているかは、Patent Kind Codes for CAS Basic and Patent Family Members をご覧ください。
Patent Kind Codes for CAS Basic and Patent Family Members
例えば、CNB (CHINA, Examined Application) は対応特許として収録されますが、ベーシック特許として収録されることはありません。
また、対応特許については「収録条件 A - 対象分野 (内容)」 の条件もゆるく、IPC List I/II,U.S. National Patent Classifications Codes for Selective Coverage のうち、いずれかの分類コードが付与されている特許であれば収録されます。
まとめ
ここまで、CAS SciFinder (サイファインダー) の情報源についてまとめて説明しました。
まとめると、次のようになります。
結論:「CAS SciFinder で調べた」ということは、(下記) 1~5のデータセットの範囲内で検索した結果のことである
-
CAS Source Index (CASSI) に含まれている対象文献/年であり、かつ化学関連分野の内容について述べられている論文・記事 (下の 2 と合わせて約 3,800 万件)
-
Core Journal Coverage List のリストに含まれている主要雑誌の全記事 (1994 年 10 月以降)
-
CAS Coverage of Patents の収録基準に該当する特許 (約 1,900 万件 )
-
医学・生物学論文(データ由来 PubMed: 約 3,500 万件)
-
Chemisches Zentralblatt
上記の範囲外は検索できていませんので、追加調査をする場合はこの収録範囲を意識してください。
もちろん、検索条件やタイムラグも検索結果を左右する要因ですが、それはまた別の機会に。
(上記1~4の件数は 2023 年 6 月 19 日時点の値です)
参考文献と参考サイト
注1) 化学情報協会, 2023, ”CAS SciFinder の収録内容”, 化学情報協会ホームページ (2023年6月19日取得, https://www.jaici.or.jp/cas-scifinder-discovery-platform/cas-scifinder-n/about/contents/)
注2) CAS, 2023, ”The Sections of CA”, CAS:A division of the American Chemical Society, (2023年6月19日取得, https://www.cas.org/support/documentation/references/ca-sections)
注3) CAS, 2023, ”CAplus Core Journal Coverage List”, CAS:A division of the American Chemical Society, (2023年6月19日取得, https://www.cas.org/support/documentation/references/corejournals)
注4) CAS, 2023, ”CAS Source Index”, CAS:A division of the American Chemical Society, (2023年6月19日取得, https://cassi.cas.org/search.jsp)
注5) CAS, 2023, ”CAS Coverage of Patents”, CAS:A division of the American Chemical Society, (2023年6月19日取得, https://www.cas.org/support/documentation/references/patentcoverage)
注6) CAS, 2001, ”Patent Information from CAS”, CAS:A division of the American Chemical Society, (2023年6月19日取得, https://www.jaici.or.jp/application/files/7816/5355/0336/fiz_patinfo.pdf)
注7) 化学情報協会, 2019, ”CA 文献検索”, 化学情報協会ホームページ (2023年6月19日取得, https://www.jaici.or.jp/application/files/8116/6269/1595/text_ca.pdf)
・ ・ ・ ・ ・ ・
掲載日 2023 年 6 月 19 日