Anthropic、AIによる差別を軽減することに成功
Anthropicは、プロンプトエンジニアリング戦略を採用することで、AIによる差別を効果的に軽減することに成功しました。フレンドリーな対応を促すプロンプトを使用することで、顕著な効果が得られました。研究者たちは、プロンプトに「介入」を加えることでモデルに偏見を持たせないよう指示し、差別をほぼゼロにまで減少させることに成功しました。この戦略では、高リスクの意思決定においては、言語モデルを慎重に使用する必要性と、政府や社会全体が意思決定に影響を与えるべきであることが強調されています。AnthropicはGoogleと協力し、Google Cloud TPUv5eチップによる言語モデルClaudeの展開を計画しています。この研究は、AIによる差別を軽減するための新たな戦略を提供するものです。