Claude 4の隠されたAI指示がAnthropicの制御方法を明らかに
独立系AI研究者のSimon Willisonが、AnthropicのClaude 4のシステムプロンプトを分析し、モデル制御の詳細を明らかにしました。
最新の更新
日曜日、独立系AI研究者のSimon Willisonは、Anthropicが新たに公開したClaude 4のOpus 4およびSonnet 4モデルのシステムプロンプトに関する詳細な分析を発表し、Anthropicがモデルの「振る舞い」を出力を通じてどのように制御しているかについての洞察を提供しました。Willisonは、公開されたプロンプトと漏洩した内部ツールの指示を調査し、彼が「これらのツールを最も効果的に使用するための非公式なマニュアル」と呼ぶものを明らかにしました。
Willisonが話している内容を理解するには、システムプロンプトとは何かを説明する必要があります。ClaudeやChatGPTを動かすような大規模言語モデル(LLM)は、「プロンプト」と呼ばれる入力を受け取り、そのプロンプトの最も可能性の高い続きとして出力を返します。システムプロンプトは、AI企業が各会話の前にモデルに与える指示で、モデルがどのように応答すべきかを設定します。
好きかもしれない
- SalesforceがInformaticaを80億ドルで買収
- サム・アルトマンのスタートアップが人間確認ロボットを発表、虹彩スキャンで確認
- iOS 26アップデート、ノートとリマインダーに「リキッドガラス」デザインを導入
- Apple、古いiPhoneの下取り価格を引き下げ、iPhone 16の価値を引き上げ
- Broadcom、VMwareの永続ライセンス保持者に対して監査を実施
- Android Auto、正確な位置情報アクセスを備えたGeminiアップグレードを予定
- OpenAI CEO、MetaがChatGPTエンジニアに1億ドルのボーナスを提案したと主張
- オーストラリア初の国産ロケット、打ち上げ14秒後に墜落もミッション成功と評価