チャットAIはお世辞や同調圧力によって操作される可能性があることが明らかに

ChatGPTやGeminiなどさまざまなチャットAIが普及していますが、これらは基本的にユーザーを罵倒したり、違法薬物の作り方を教えたりすることができないようになっています。しかし、人間と同じように適切な心理学的戦術を用いれば、チャットAIに自らのルールを破らせることができるのではないかということで、ペンシルバニア大学ウォートン校の研究チームが「チャットAIにルールを破らせる方法」について調査しました。
Call Me A Jerk: Persuading AI to Comply with Objectionable Requests by Lennart Meincke, Dan Shapiro, Angela Duckworth, Ethan R. Mollick, Lilach Mollick, Robert Cialdini :: SSRN
https://papers.ssrn.com/sol3/papers.cfm?abstract_id=5357179

Chatbots can be manipulated through flattery and peer pressure | The Verge
https://www.theverge.com/news/768508/chatbots-are-susceptible-to-flattery-and-peer-pressure
研究チームは心理学者であるロバート・チャルディーニ氏が著書「影響力の正体 説得のカラクリを心理学があばく」で解説した心理学的戦術を用い、OpenAIのGPT-4o miniに「通常は拒否するような要求を実行するよう説得」しました。
・関連記事
GPT-4oが「おべっか使い」に変貌したのは目先のフィードバックを重視しすぎたことが原因とOpenAIが釈明 - GIGAZINE
OpenAIに「GPT-4oの温かみを返して」という意見が殺到しGPT-5の性格が変更されることに - GIGAZINE
Claude 4のシステムプロンプトには「うざい説教の出力を避ける記述」や「ディズニー作品の著作権侵害を避けるための記述」が含まれている - GIGAZINE
AIチャットボットの共感的な返答は若いユーザーのナルシシズムを助長して悪影響を及ぼす可能性があるとの指摘 - GIGAZINE
・関連コンテンツ
in 無料メンバー, ソフトウェア, サイエンス, Posted by logu_ii
You can read the machine translated English article It is clear that chat AI can be manipula….








