Claude 4の隠されたAI指示がAnthropicの制御方法を明らかに
独立系AI研究者のSimon Willisonが、AnthropicのClaude 4のシステムプロンプトを分析し、モデル制御の詳細を明らかにしました。
最新の更新
日曜日、独立系AI研究者のSimon Willisonは、Anthropicが新たに公開したClaude 4のOpus 4およびSonnet 4モデルのシステムプロンプトに関する詳細な分析を発表し、Anthropicがモデルの「振る舞い」を出力を通じてどのように制御しているかについての洞察を提供しました。Willisonは、公開されたプロンプトと漏洩した内部ツールの指示を調査し、彼が「これらのツールを最も効果的に使用するための非公式なマニュアル」と呼ぶものを明らかにしました。
Willisonが話している内容を理解するには、システムプロンプトとは何かを説明する必要があります。ClaudeやChatGPTを動かすような大規模言語モデル(LLM)は、「プロンプト」と呼ばれる入力を受け取り、そのプロンプトの最も可能性の高い続きとして出力を返します。システムプロンプトは、AI企業が各会話の前にモデルに与える指示で、モデルがどのように応答すべきかを設定します。
好きかもしれない
- SalesforceがInformaticaを80億ドルで買収
- サム・アルトマンのスタートアップが人間確認ロボットを発表、虹彩スキャンで確認
- Signal、MicrosoftのRecall機能によるプライバシー問題を批判、回避策を実装
- OneDriveのセキュリティ脆弱性、過剰な権限によりユーザーデータが危険にさらされる可能性
- オーストラリア初の軌道ロケット打ち上げ、ノーズコーン脱落で延期
- WhatsApp、AIによる未読メッセージの要約機能を追加
- iOS 26ベータ2、コントロールセンターの視認性向上を実現した『リキッドグラス』の改善
- 2025年第1四半期、AppleのMac出荷数が28.7%増加、市場シェア拡大