Claude 4の隠されたAI指示がAnthropicの制御方法を明らかに
独立系AI研究者のSimon Willisonが、AnthropicのClaude 4のシステムプロンプトを分析し、モデル制御の詳細を明らかにしました。
最新の更新
日曜日、独立系AI研究者のSimon Willisonは、Anthropicが新たに公開したClaude 4のOpus 4およびSonnet 4モデルのシステムプロンプトに関する詳細な分析を発表し、Anthropicがモデルの「振る舞い」を出力を通じてどのように制御しているかについての洞察を提供しました。Willisonは、公開されたプロンプトと漏洩した内部ツールの指示を調査し、彼が「これらのツールを最も効果的に使用するための非公式なマニュアル」と呼ぶものを明らかにしました。
Willisonが話している内容を理解するには、システムプロンプトとは何かを説明する必要があります。ClaudeやChatGPTを動かすような大規模言語モデル(LLM)は、「プロンプト」と呼ばれる入力を受け取り、そのプロンプトの最も可能性の高い続きとして出力を返します。システムプロンプトは、AI企業が各会話の前にモデルに与える指示で、モデルがどのように応答すべきかを設定します。
好きかもしれない
- SalesforceがInformaticaを80億ドルで買収
- サム・アルトマンのスタートアップが人間確認ロボットを発表、虹彩スキャンで確認
- Google Pixel Watch 4のリーク情報: カラー、サイズ、バンドのオプションが明らかに
- 炭素捕捉の革新: 『スーパースポンジ』フィルターが新しいギガファクトリーから市場に登場
- 企業がAI生成投稿でRedditをスパムし、チャットボットの結果に影響を与える
- Android版Chrome、ページの歪みなしでテキスト拡大機能を提供開始
- 開発者がエシュロンバイクのペイウォールを解除するも、法的問題でリリースできず
- AppleのiOS 19ゲームアプリ: Appleファンにとってのブースト、Windowsの殺し屋ではない