2025年11月28日 15時00分メモ

昨今のAIブームは「言語能力こそが知能である」という誤解に基づいているという主張

大手IT企業は生成AIへの投資を盛んに行っており、記事作成時点ではまさにAIブームといえる状況になっています。ところが、人間の認知や生成AIへの理解を深めることを目的とするベンチャー企業・Cognitive Resonanceの創業者であるベンジャミン・ライリー氏は、「AIブームは言語能力と知能についての根本的な誤解に基づいている」と主張しています。

The AI boom is based on a fundamental mistake | The Verge
https://www.theverge.com/ai-artificial-intelligence/827820/large-language-models-ai-intelligence-neuroscience-problems

Metaのマーク・ザッカーバーグCEOが「超知性の開発は今や目前に迫っています」と発言したり、OpenAIのサム・アルトマンCEOが「従来理解されてきた意味での汎用(はんよう)人工知能(AGI)を構築する方法について、私たちは今や確信を持っています」と主張したりと、大手IT企業の幹部らはAGIの構築に自信を見せています。しかし、ライリー氏は、人間の知能に関する科学的見解やこれらの企業が生み出してきたAIシステムを見る限り、とてもこれらの発言を信じることはできないと主張しています。

OpenAIのChatGPTやGoogleのGemini、AnthropicのClaude、MetaのAI製品群のいずれも「大規模言語モデル」であり、これらは基本的に膨大な量の言語データを収集し、単語(トークン)間の相関関係を見つけ、入力されたプロンプトに対してどのような出力が続くのかを予測するものです。つまり、これらの企業が開発するAIはどこまで行っても、本質的には言語モデルだというわけです。

仮に「言語＝思考」なのであれば、AI開発企業が世界に関する膨大なデータを収集し、それをますます強力なコンピューティングパワーと組み合わせることで統計的相関関係を改善していけば、あっという間にAGIは実現します。大きな問題は、現在の神経科学に基づくと、人間の思考は言語とほとんど無関係だという点です。

確かに人間は言語を用いて推論や抽象化、一般化といった知能の成果を伝達しており、言語を使って思考することもありますが、だからといって「言語＝思考」とはなりません。そのため、いくら言語モデルを洗練させていったところで、それが人間を超える知能につながるという保証はどこにもありません。

ライリー氏は、「この理論には重大な科学的欠陥があります。大規模言語モデルは言語のコミュニケーション機能を模倣する単なるツールであり、どれだけ多くのデータセンターを構築したとしても、思考と推論という独立した明確な認知プロセスにはなりません」「この違いを理解することが、科学的事実と、AIに熱狂するCEOたちの空想的なSFを区別する鍵となります」と述べています。

2024年、マサチューセッツ工科大学やカリフォルニア大学バークレー校などの研究者らが、「Language is primarily a tool for communication rather than thought(言語は思考というよりもコミュニケーションのためのツールである)」という論文を学術誌のNatureに発表しました。この論文は、言語と思考に関連する数十年にわたる科学的研究をまとめたものであり、AIブームを取り巻く誤解をひもとく上でも役立つとのこと。

論文ではまず、「言語が思考力や推論力を生み出す」という概念の誤りについて解説しています。仮に言語が思考に必要不可欠だとすれば、言語が奪われれば思考能力も奪われるはずです。しかし、高度な機能的磁気共鳴画像法(fMRI)で脳のどの部位が活性化しているのかを調べてみると、「数学の問題を解く」「他人の心を推測する」といった思考を行う際には、言語能力とは異なるネットワークが活性化しています。

また、脳損傷やその他の障害によって言語能力を失った人において、思考能力全般が損なわれるわけではないことは明らかです。重度の言語障害を抱えながらも数学の問題を解いたり、非言語的な指示に従ったり、他者の動機を理解したり、論理的推論や因果的推論を行ったりすることは可能です。実際、言語能力を獲得する前の赤ちゃんも、日々の暮らしの中でさまざまなことを発見・理解し、世の中について学んでいます。つまり、科学的にいえば言語は人間の思考能力の一側面に過ぎず、多くの知能は非言語的能力に関わっているというわけです。

研究チームの2つ目の主張が、「言語は人々が互いに考えを共有するためのツール、すなわち効率的なコミュニケーションコードである」というものです。言語は生成しやすい上に理解・学習が容易で、簡潔かつ効率的に使用でき、ノイズに対して堅牢(けんろう)です。こうした特徴により、人類は言語を用いて知識を共有することが可能となり、世代を超えて並外れた文化を築き上げることができました。

しかし、人間の認知能力が言語によって底上げされるからといって、思考全般が言語によって生み出されたり定義されたりするわけではありません。たとえ話す能力を奪われようと、人間は考え、推論し、信念を作り上げ、恋に落ち、世界中を探索することが可能です。

以上の点から、人間において「思考＝言語」ではないことがわかりますが、既存のAIの基盤となっている大規模言語モデルから言語を取り除くと、文字通り何も残りません。確かに、AIが人間とはまったく異なるルートで超知能に到達する可能性もゼロではありませんが、テキストベースの訓練によってAGIに到達できると考える明確な根拠もないとライリー氏は指摘しています。

実際、AI研究コミュニティでは「大規模言語モデルだけでは人間の知能モデルとしては不十分だ」という認識が高まりつつあります。たとえばAI研究でチューリング賞を受賞したヤン・ルカン氏はMetaを辞任し、「物理世界を理解し、持続的な記憶を持ち、推論でき、複雑な行動シーケンスを計画できるシステム」である世界モデル構築のためのAIスタートアップを設立しました。また、ルカン氏と共にチューリング賞を受賞したヨシュア・ベンジオ氏らは、AGIの暫定的な定義を「十分な教育を受けた成人の認知的多様性」を持つものと定義しました。

ベンジオ氏らは、知能は以下のように「Knowledge(知識)」「Math(数学)」「Working Memory(ワーキングメモリー)」「Visual(視覚)」「Auditory(聴覚)」など、さまざまな項目から成り立っていると主張しています。これに対しライリー氏は、大規模言語モデルにとらわれてきた従来の枠組みを脱するという点では評価できるものの、これらの合計がAGIであると見なすのは難しいと指摘しています。

ライリー氏は、仮にベンジオ氏らが主張する知能をすべて達成するAIが登場したとしても、それは革新的な科学的発見につながるようなAIではないだろうと考えています。それは、たとえAIが人間の思考を模倣できたとしても、人間が行うような「認知的飛躍」を達成できる保証はないためです。

科学史や科学哲学上の概念である「パラダイム」は、人々から熱心に支持されるユニークさを持ち、さまざまな問題を研究グループに提示する業績のことを指します。科学の歴史ではたびたび、このパラダイムが大きく転換するパラダイムシフトが起きていますが、これは反復的な実験の結果ではなく、既存の科学的記述に当てはまらない新しい疑問やアイデア、つまり認知的飛躍が起きた時に発生しました。

複数の認知領域にまたがるAIシステムは、確かに与えられた指示に対して、高い知能を持つ人間のように予測・再現することができます。しかし、これらの予測はいずれも既存のデータを電子的に集約・モデル化することで実行されるため、入力されたデータそのものに不満を抱くことは難しく、結果として人間のような認知的飛躍を達成する可能性は低いとのこと。

ライリー氏は、「確かにAIシステムは私たちの知識を興味深い方法でリミックスし、再利用するかもしれません。しかし、AIにできることはそれだけです。AIは私たちがデータにエンコードし、学習に使用したボキャブラリーの中に永遠に閉じ込められてしまいます」「思考し、推論し、言語を用いて互いの考えを伝え合う存在である実際の人間は、世界に対する理解を変革する最前線にとどまり続けるでしょう」と述べました。

この記事のタイトルとURLをコピーする

・関連コンテンツ

2025年11月28日 15時00分00秒 in AI, メモ, Posted by log1h_ik

You can read the machine translated English article The recent AI boom is based on the misco….