Claude 4の隠されたAI指示がAnthropicの制御方法を明らかに
独立系AI研究者のSimon Willisonが、AnthropicのClaude 4のシステムプロンプトを分析し、モデル制御の詳細を明らかにしました
最新の更新
日曜日、独立系AI研究者のSimon Willisonは、Anthropicが新たに公開したClaude 4のOpus 4およびSonnet 4モデルのシステムプロンプトに関する詳細な分析を発表し、Anthropicがモデルの「振る舞い」を出力を通じてどのように制御しているかについての洞察を提供しました。Willisonは、公開されたプロンプトと漏洩した内部ツールの指示を調査し、彼が「これらのツールを最も効果的に使用するための非公式なマニュアル」と呼ぶものを明らかにしました。
Willisonが話している内容を理解するには、システムプロンプトとは何かを説明する必要があります。ClaudeやChatGPTを動かすような大規模言語モデル(LLM)は、「プロンプト」と呼ばれる入力を受け取り、そのプロンプトの最も可能性の高い続きとして出力を返します。システムプロンプトは、AI企業が各会話の前にモデルに与える指示で、モデルがどのように応答すべきかを設定します。
好きかもしれない
- SalesforceがInformaticaを80億ドルで買収
- サム・アルトマンのスタートアップが人間確認ロボットを発表、虹彩スキャンで確認
- Google Apps Scriptを悪用した巧妙なフィッシング攻撃、Microsoft 365認証情報を標的に
- ペンギンの糞が南極の気候調節に意外な役割を果たす
- AMD、RX 9060 XTを発表、Nvidia RTX 5060に対抗
- サムスンGalaxy S25 Edge:iPhone 17 Airへの対抗策、しかし革新性は?
- 『ジュラシック・ワールド/新生』最終トレーラー公開、スカーレット・ヨハンソン&マハーシャラ・アリ主演
- GoogleがVeo 3を発表:音声同期機能を備えたAIビデオジェネレーター