CAS 登録番号 (CAS RN®) の話
コラムでは、CAS SciFinder のユーザーの方を対象に、検索に関するお役立ち情報や、ちょっとした豆知識を提供します。本稿では CAS SciFinder に収録されている CAS 登録番号 (CAS RN®) についてご紹介します。
CAS 登録番号 (CAS RN®) とは
CAS 登録番号 (CAS RN®) は化学物質の「背番号」
弊会では、CAS 登録番号 (CAS RN®) のデータベースや、CAS 登録番号サービスを行っています。そのため、多数のお問い合わせをいただき、長年、説明を繰り返してきましたが、私自身が一番しっくりくるのは
「化学物質の背番号」
という表現です。
それぞれ物質に特有の番号が付くところが、スポーツのユニホームに付ける背番号のようだから、というのがその理由です。
知って欲しい!正式表記
CAS 登録番号 (CAS RN®) には、正式表記があります。
日常会話では「CAS No.」「CAS 番号」「キャス番号」と表現している方もおられると思いますが、貴機関の製品や論文などに記載したり、公的な場で発表する場面では、次のいずれかの表現を使ってください。
CAS Registry Number®
CAS RN®
CAS 登録番号 (CAS RN®)
CAS はシーエーエスと読みますので、上から順に
シーエーエス レジストリー ナンバー
シーエーエス アールエヌ
シーエーエス とうろくばんごう (シーエーエス アールエヌ)
と言います。CAS は、米国化学会の情報部門の組織で、CAS 登録番号 (CAS RN®) の付与・管理を行い、化学物質のデータベースである CAS Registry を製作しています。
ですから、CAS 登録番号 (CAS RN®) は 「CAS」 という機関が独自に付与している化学物質を識別するための「背番号」とお考えください。
CAS 登録番号 (CAS RN®) のルール
2023 年 12 月 22 日時点で一番新しい CAS RN® は 3022889-17-1 です。
では、ここで問題です。 次に登録される化学物質は何番でしょうか?
番号の規則性とチェックデジット
CAS 登録番号 (CAS Registry Number®: CAS RN®) は、化学物質のデータベース (CAS Registry) に新しい物質を登録する時に付与されます。つまり、時系列データです。しかし、単に連続した数字ではなく、番号には規則性があるのが特徴です。
CAS RN® はハイフンによって三つの部分に分かれていて、一番左の部分は 2~7 桁の数字、真中の部分は 2 桁の数字、一番右の部分は 1 桁の数字から成ります。
最後の 1 桁はチェックデジットです。上記の 3022889-17-1 の例でその数式をご説明しましょう。
1) 3022889-17-1 から、ハイフンとチェックデジット (この場合は 1) を除いた数字にする。
つまり、302288917 です。
2) 302288917 の各数字✕各桁の数と掛け合わせる。
(3*9)+(0*8)+(2*7)+(2*6)+(8*5)+(8*4)+(9*3)+(1*2)+(7*1)=161
3) 結果を Q+R/10 の数式に当てはめ、得られた R をチェックデジットにする。
161/10 = 16 + 1/10
ということで、チェックデジットは 1 になります。
答え
では、あらためて 3022889-17-1 の次に登録される化学物質は何番か考えてみてください。
302288917 の次の数字は、302288918 です。
(3*9)+(0*8)+(2*7)+(2*6)+(8*5)+(8*4)+(9*3)+(1*2)+(8*1)=162 となりチェックデジットは 2 と分かります。
つまり、次に化学物質が登録されるときの CAS 登録番号 ( CAS RN®) は 3022889-18-2 です。
CAS 登録番号 (CAS RN®) の歴史
CAS では、1965 年に CAS 登録システムを導入し、化学物質の構造を同定して、その物質に唯一の番号である CAS 登録番号 (CAS RN®) を付与する作業を始めました。この CAS RN® が CAS の出版物に載るようになったのは、1966 年からです。
CAS RN® が登場するまでの期間 (1907~1965 年) は、化学物質の索引に名称を用いていました。CA 索引名については、「化学物質の名称の話」をご覧ください。
つまり、
- 化学物質の命名は複雑で同定するのが難しい。
- 数字 (番号) なら視覚的に把握しやすく、同定するのも簡単!
という動機でスタートした CAS 登録システムですから、CAS が定めたルールに基づいて区別された化学物質について、立体情報、標識化合物、塩などには、それぞれ異なる番号が付与されます。
例えば、一番古い CAS 登録番号 (CAS RN®) は、ホルムアルデヒドの 50-00-0 です。今では、H2C=O の単純な構造を CAS SciFinder で作図して、構造検索を行いと単成分登録されているものだけで 93物質が回答として得られます (2023 年 12 月 25 日時点)。
上図の結果で分かるように、重水素が 1 つまたは 2 つ付いていたり、炭素が 13C や 14C、 16C だったり、イオンだったりと様々なバリエーションにそれぞれ異なる CAS 登録番号 (CAS RN®) が付与され、CAS Registry データベースに登録されています。
CAS 登録番号 (CAS RN®) の性質から考える調査のポイント
ここまで説明してきた通り、CAS では化学物質を区別し、個別の番号を付与しています。そして CAS が製作する CAS Registry 以外のデータベース中でも、化学物質を名称の代わりに CAS 登録番号 (CAS RN®) で表すことにより、化学物質関連の検索が精密に行えるよう設計されています。
そして、そのことが文献検索でも反応検索でもあらゆる場面でポイントになります。
自分にいま必要な情報 (=目的) をはっきりさせよう
CAS 登録番号 (CAS RN®) が表す化学物質はひとつ。しかし、目的によっては、それがすべてではありません。
ホルムアルデヒドの CAS 登録番号 (CAS RN®) を知りたい場合
ホルムアルデヒドの CAS 登録番号 (CAS RN®) を何かに記載する、ということでしたら 50-00-0 が唯一の回答です。
タンパク質や核酸でもない物質であれば、大抵構造検索が最良の検索手法です。イオン等を検討しないのであれば、分子式検索でもよいでしょう。
50-00-0 に関する文献を知りたい場合
CAS SciFinder で、CAS 登録番号 (CAS RN®) を用いて検索すれば 50-00-0 は Formaldehyde を表します。Formalin と呼ぶ人や、Methaldehyde と言う人がいたとしてもブレません。
ある化学物質に関する文献検索が目的で、50-00-0 に関する文献を調べたいなら References をクリックします。この時点では 273K (273,536 件) の文献が得られました。
H2C=O の化学物質についての文献を調りたい場合
H2C=O の構造を持つすべての単成分物質は、上述の通り 93 物質存在します。これら 50-00-0 と同等の分子についての文献も含めて、網羅的な関連文献調査を行いたいなら、References から All Results を選択して文献検索を行う必要があります。この時点では 290K (290,501 件) の文献が得られました。
まとめ
ここまで、CAS SciFinder (サイファインダー) の化学物質データベースである CAS Registry の CAS 登録番号 (CAS RN®) について説明しました。
まとめると、次のようになります。
- CAS 登録番号 (CAS RN®) は CAS が付けている化学物質の背番号
- CAS 登録番号 (CAS RN®) には正式表記がある
- CAS 登録番号 (CAS RN®) には規則性がある
CAS 登録番号 (CAS RN®) の調べ方の裏技や、あるあるもそのうちご紹介したいと思いますが、それはまた別の機会に。
・ ・ ・ ・ ・ ・
掲載日 2023 年 12 月 26 日