AI時代の矛盾：リスクを定義する者を誰が評価するのか

Just_Super/iStock

韓非子の「矛盾」の故事では、どんな盾でも貫く矛と、どんな矛でも防ぐ盾を売る商人がいた。

人々に矛盾を指摘されると、商人は答えられなくなった。

しかし、現代の商人はもっと巧妙である。

Anthropicは最近、将来的なAIリスクについて警告し、一定条件下でのAI開発減速の必要性に言及した。

だが私たちは、その判断の根拠となったモデルや評価過程の全体像を見ているわけではない。

見えているのは結論だけである。

危険かもしれない。

だから備えが必要だ。

もちろん、その警告自体が間違っているとは限らない。むしろ正しい可能性もある。

しかし今回問いたいのは、その結論の正しさではない。

その結論を誰が定義しているのかである。

減速論より先に問うべきこと

AI開発を減速すべきか。この問いは世界中で議論されている。

だが、多くの人が素朴な疑問を抱くだろう。

仮にAnthropicが減速しても、OpenAIは止まるのか。Googleは止まるのか。中国企業は止まるのか。

実際、Anthropic自身も単独での停止を主張しているわけではない。主要AI企業が共通の危険認識を持ち、検証可能な条件に合意した場合に限り、減速を検討するとしている。

つまり問題は、減速が正しいかどうかではない。

本当に重要なのは、誰が危険性を判断するのか、その条件を誰が定義するのかである。

AI時代の本当の権力は「定義権」である

AI時代における最大の権力は何か。

巨大なデータセンターだろうか。最先端のGPUだろうか。

私はそうは思わない。

本当の権力は「定義権」である。

何が危険なのか。
何が安全なのか。
どこからが規制対象なのか。
どの能力が社会的脅威なのか。

この境界線を決める主体が、実質的な支配力を持つ。

原子力時代の権力がエネルギーだったとすれば、AI時代の権力は定義そのものになる。なぜなら社会は、危険だと定義されたものを規制し、安全だと定義されたものを許容するからである。

定義権を持つ主体は、その定義を変更できる

Anthropicは、AIを開発する。AIを評価する。AIリスクを公表する。安全基準を提案する。政策議論に参加する。そして安全基準そのものを変更することもできる。

TIME誌の報道によれば、Anthropicは2026年にResponsible Scaling Policy（RSP）の内容を変更し、従来掲げていた「危険なAI開発を停止する」という方針を、より条件付きの表現へ改めた。

この変更が正しかったのかどうかは、本稿の論点ではない。

重要なのは別の点である。

AIリスクを定義する主体は、その定義そのものを書き換える権限も持っているという事実だ。言い換えれば、盾の必要性を説明する主体が、盾の設計図も管理しているということである。

問題はAnthropicではない

ここで誤解してはならない。

問題はAnthropicだけではない。OpenAIでも起きる。Googleでも起きる。中国企業でも起きる。

AIリスクを定義する主体は、同時に競争主体であり、利益主体であり、政策提言主体でもある。

仮に善意であったとしても、その定義が市場構造や競争環境に影響を与えることは避けられない。

例えば、業界全体の協調的減速が実現すれば、既存大手の優位性は固定化される可能性がある。新規参入は難しくなる。

歴史的に見れば、規制は常に公益のためだけに存在したわけではない。既存企業が新規参入者を排除する障壁として機能した例も少なくない。

経済学では「規制の虜（Regulatory Capture）」と呼ばれる現象である。

安全性の議論は公益の議論である。しかし同時に、競争環境の議論でもある。だからこそ、危険性を定義する主体の利益構造もまた、検証対象にならなければならない。

なぜ原発や製薬と同じ方法では解決しないのか

通常、高リスク産業では、事業者と評価者を分離する。利益相反を避けるためである。

原子力には規制機関がある。製薬には審査機関がある。金融にも監督機関がある。しかしAIには特有の難しさがある。

原子炉は自分で規制文書を書かない。薬は自分で安全基準を提案しない。だがAIは違う。

AIはすでに、研究開発そのものに深く入り込み始めている。Anthropic自身も、AIによって研究開発生産性が大きく向上したと説明している。

つまりAIは単なる評価対象ではなくなりつつある。評価を支援する側にもなり始めているのである。

評価者もまた同じ技術体系の内部にいる

ここで奇妙な状況が生まれる。

AIを評価するために、研究者はAIを使う。企業はAIを使う。将来的には規制当局もAIを使うだろう。

つまり、評価者もまた、被評価対象と同じ技術体系の内部に存在する。これは過去の産業には存在しなかった構造である。

評価者と対象が完全に切り離されていない。その結果、誰が誰を評価しているのかという境界そのものが曖昧になっていく。

AIリスクを誰が発見するのか

さらに考えてみたい。

将来、人間だけでは把握できないほど複雑なAIシステムが登場したとする。その危険性を最初に発見するのは誰なのか。

研究者か。企業か。第三者機関か。

もし評価過程そのものがブラックボックス化したとき、定義権はどこに存在するのだろうか。

企業なのか。研究者なのか。

この問いに対して、私たちはまだ明確な答えを持っていない。

本当に必要なのは何か

必要なのは単純な規制強化ではない。

重要なのは、評価主体の多様化である。評価過程の透明化である。競争的な検証である。そして定義権の分散である。

例えば、企業自身による評価だけでなく、大学、独立研究機関、オープンソースコミュニティ、国際機関など、異なる主体が競争的に評価できる環境が必要になるだろう。

重要なのは単一の正解ではない。単一の定義権を避けることである。

さらに将来、AIリスクの発見や評価そのものにAIが深く関与するようになれば、この問題はさらに複雑になる。

人間が定義した危険性ではなく、AIが発見した危険性を人間が追認する構造が生まれるかもしれない。

そのとき定義権は、企業と研究者だけでなく、AIとの関係の中で再設計を迫られるだろう。

問題はAIの能力そのものではない。能力をどう認識するかなのである。

結論｜定義者を誰が評価するのか

Anthropicが正しいかどうかは分からない。AIが本当に危険かどうかも分からない。

しかし、確かなことがある。私たちはまだ、AIリスクを定義する主体を誰が評価するのかという問いに答えを持っていない。

楚の商人は、矛盾を指摘されて黙った。現代の商人は、矛を隠した。そして私たちは、その矛を見ないまま、盾の必要性だけを聞かされている。

AI時代の本当の問題は、AIそのものではない。

AIリスクを誰が定義し、その定義者を誰が評価するのかである。