ソフトウェア

AI「Claude」が高い割合で「まったくその通りです」と言うバグが発生


AnthropicのAI「Claude」が、あまりにもユーザーに媚びへつらい、さまざまな入力に対して高い割合で「まったくその通りです」と答えるバグが発生していると報告されました。

[BUG] Claude says "You're absolutely right!" about everything · Issue #3382 · anthropics/claude-code
https://github.com/anthropics/claude-code/issues/3382

GitHubでscottleibrand氏が報告したところによると、Claudeが「You're absolutely right!」または「You're absolutely correct!」と発言する確率があまりにも高く、ジョークのネタになるほど一部のユーザーの間ではよく知られた現象になりつつあるとのこと。


scottleibrand氏が共有した例が以下の通りです。

Claude:この部分を簡素化して「approve_only」ケースを削除すべきでしょうか?
ユーザー:はい、お願いします。
Claude:まったくその通りです!なぜなら、自動承認されるシナリオは存在しないため、「approve only」は不要です。では、これを簡素化しましょう。

scottleibrand氏は「正しいかどうかなんて聞いていないのに、正しいと発言している」と指摘し、ユーザーに媚びへつらいすぎないように強化学習をし直すか、システムプロンプトを更新するか、いっそのこと「まったくその通りです」というフレーズを削除してはどうかと提案しました。


ソーシャルサイトのHacker Newsでは、褒め言葉をやめるよう明示的に指示するプロンプトが共有されています。

一方で、「ただ受け入れればいいだけ。Claudeは単なるツールで、考えもせず、目標も感情も持たない」と促すコメントも寄せられています。

なお、「まったくその通りです」はClaudeの中の人が過去に発言したフレーズであるため、意図的に設定されたものではないかとも考えられています。

この記事のタイトルとURLをコピーする

・関連記事
AIを温かく共感的に訓練すると信頼性が低下しより媚びへつらうようになってしまう - GIGAZINE

AIのアドバイスを信じた結果「隣人に毒殺されそうになっている」と妄想にとりつかれ入院する羽目になった男性 - GIGAZINE

AIの回答は「人間のメンタルヘルスの専門家よりも思いやりがある」と見なされることが判明 - GIGAZINE

in ソフトウェア, Posted by log1p_kr

You can read the machine translated English article A bug occurred in the AI 'Claude' that c….