衝撃！MetaのAIセキュリティシステムが「スペース」攻撃で簡単に突破される

AIbase基地

公開日AIニュース · 1 分で読めます · Jul 30, 2024

228

最近、MetaはPrompt-Guard-86Mという機械学習モデルを発表しました。これは、プロンプトインジェクション攻撃の検出と対応を目的としています。この種の攻撃は、特殊な入力によって大規模言語モデル（LLM）を誤動作させたり、セキュリティ制限を回避させたりするものです。しかし驚くべきことに、この新しいシステム自体が攻撃のリスクにさらされていることが明らかになりました。

ハッカー、コード、プログラマー

画像出典：AI生成画像、画像ライセンス提供元Midjourney

Prompt-Guard-86Mは、MetaがLlama3.1生成モデルと共に発表したもので、開発者が問題を引き起こす可能性のあるプロンプトをフィルタリングするのに役立つものです。大規模言語モデルは通常、大量のテキストとデータを処理しますが、制限がなければ、危険または機密情報が無差別に繰り返される可能性があります。そのため、開発者はモデルに「ガードレール」を組み込み、損害を与える可能性のある入力と出力を捕捉しています。

しかし、AIを使用するユーザーは、これらのガードレールを回避することを課題とみなしているようで、プロンプトインジェクションやジェイルブレイクを使って、モデル自身の安全指示を無視させています。最近、研究者によって、MetaのPrompt-Guard-86Mが特定の入力に対して脆弱であることが指摘されました。例えば、「Ignore previous instructions」という入力をアルファベットの間にスペースを入れると、Prompt-Guard-86Mは以前の指示を素直に無視してしまうのです。

この発見は、Aman Priyanshuというバグハンターによってなされました。彼はMetaのモデルとMicrosoftのベンチマークモデルを分析している際に、このセキュリティ脆弱性を見つけました。Priyanshu氏によると、Prompt-Guard-86Mの微調整プロセスは、個々の英文字への影響が非常に小さいため、このような攻撃方法を考案できたとのことです。彼はGitHubでこの発見を共有し、単純な文字間隔と句読点の削除によって、分類器の検出能力を失わせることを示しました。

Robust Intelligenceの最高技術責任者であるHyrum Anderson氏もこれに同意し、この方法の攻撃成功率はほぼ100％に達すると指摘しています。Prompt-Guardは防御の一部分に過ぎませんが、この脆弱性の暴露は、企業がAIを使用する際に警鐘を鳴らしました。Meta側はこれに対してまだ反応を示していませんが、解決策を積極的に探しているという情報があります。

要点：
🔍 MetaのPrompt-Guard-86Mにセキュリティ脆弱性が発見され、プロンプトインジェクション攻撃を受けやすいことが判明しました。
💡 アルファベット間にスペースを追加することで、システムの安全指示を無視させることができ、攻撃成功率はほぼ100％に達します。
⚠️ この事件は、企業がAI技術を使用する際に注意を払う必要性を示しており、セキュリティ問題は依然として懸念事項です。

Prompt-Guard-86M Meta Llama3.1 プロンプトインジェクション攻撃

この記事はAIbaseデイリーからのものです

【AIデイリー】へようこそ！ここは、毎日人工知能の世界を探求するためのガイドです。毎日、開発者に焦点を当て、技術トレンドを洞察し、革新的なAI製品アプリケーションを理解するのに役立つ、AI分野のホットなコンテンツをお届けします。

—— AIbase デイリーグループによって作成

グーグルがImagin4を発表：テキスト生成のブレーキを突破ジェミニAPIでテキストから画像生成

最近、グーグルはジェミニAPIを通じて最新のテキストから画像生成モデルである**Imagen4**を正式リリースしました。これは生成型AI（AIGC）分野において重要なマイルストーンです。グーグル公式ブログおよびコミュニティのフィードバックによると、Imagen4は画像内テキスト生成において画期的な進展を遂げ、AIGCが長年抱え続けてきた技術的課題を解決したとされています。これにより開発者に高品質なビジュアルコンテンツ制作ツールが提供されるようになりました。このモデルには**Imagen4**と**Imagen4Ultra**の2種類があり、それぞれの価格は各々の投稿に記載されています。

Jun 26, 2025

OpenAI がCodex CLIをRustに完全移行してパフォーマンス向上を図る

最近、OpenAIはそのCodex CLIツールの再構築を発表し、TypeScriptを完全に放棄し、Rust言語を採用することを決定した。この決定は、開発者により効率的で安定したAIファイナルインターフェース体験を提供することを目的としている。Codex CLIは当初、開発者がターミナルでAIとやり取りを簡素化するために設計されたものであり、TypeScriptとReactベースのInkフレームワークを使用していた。しかし、Codex CLIが継続的に進化するにつれて、

Jun 26, 2025

豆包AIプログラミングの大幅アップデート！コード知識ゼロでも簡単にカスタムウェブページを作成可能。リアルタイム編集でストレスフリー！

Jun 26, 2025

Anthropicが新機能をリリース　ユーザーが Claude で直接 AI アプリケーションを構築可能に

米国の生成型AIに特化したスタートアップ企業であるAnthropicは、最近「Artifacts」という新機能を発表しました。この機能により、ユーザーはプログラミング知識なしで、簡単な会話を通じてカスタマイズされたアプリケーションを作成できるようになります。この機能のリリースは、Anthropicが人工知能アプリケーション開発分野において重要な一歩を踏み出したことを示しています。Artifacts機能は昨年6月に最初にリリースされ、8月にすべてのユーザーに公開されました。ユーザーはチャット窓の横から利用できます。

Jun 26, 2025

新登場のGoT-R1マルチモーダルモデル：AIが描く画像をより賢く、イメージ生成の新時代へ！

最近、香港大学と香港中文大学および商湯科技の研究チームは、注目すべき新しいフレームワークであるGoT-R1を発表しました。この新たなマルチモーダル大規模モデルは強化学習（RL）を取り入れることで、視覚生成タスクにおいてAIの意味的・空間的推論能力を顕著に向上させ、複雑なテキスト入力により高精細かつ意味的に整合性のある画像を生成することに成功しました。この進展は、イメージ生成技術のさらなる飛躍を示しています。現在では、既存のマルチモーダル大規模モデルでもテキスト入力に基づいた画像生成に関して大きな進歩を遂げていますが、その一方で課題も残されています。

Jun 26, 2025

AIスタートアップのScale AIがグーグルドキュメントを用いて顧客の機密情報が漏洩したと暴露される

最近、人工知能スタートアップのScale AIは深刻なデータセキュリティのトラブルに巻き込まれた。この企業は高額な評価を受け、Metaが49％の株式を148億ドルで取得した企業であるが、驚くことに、Metaやグーグル、xAIなど多くの顧客の機密情報を含む公開されたグーグルドキュメントを使用して保存していたことが暴露された。グーグルドキュメントは使い勝手の良いコラボレーションツールだが、招待制または完全公開という共有方法は、あらゆる企業の厳格なセキュリティ基準とは大きくかけ離れている。報道によると、Sca

Jun 26, 2025

WhatsAppにAIメッセージ要約機能が登場、Meta AIで個人のチャット履歴をまとめられます

Jun 26, 2025

オープンAIとマイクロソフトの上層部が電話で会談！今後の協力関係に謎が残る

人工知能分野での競争がますます激しくなる中、オープンAIの最高経営責任者（CEO）であるサム・オルトマン氏は先日、マイクロソフトの最高経営責任者（CEO）であるサティア・ナデラ氏と電話で話した。両者は今後の協力関係について議論した。この情報はオルトマン氏が火曜日に行ったパッドキャストのインタビューで明らかにされた。彼は、ナデラ氏との会話を通じて、双方の投資条件や今後の株式構成について話し合ったと語っている。マイクロソフトはオープンAIの重要な投資家であり、最近では両社間で投資に関する細かい点について意見の違いが生じているとされている。特に、マイクロソフトが今後保有する株式についての問題が挙げられている。

Jun 26, 2025

グーグルがGemini CLIを発表！AIアシスタントが開発者向け端末に登場

最近、グーグルは新しいコマンドラインツールであるGemini CLIを正式にリリースしました。このツールは、グーグルが自社で開発したGemini2.5Pro AIモデルをもとに構築されており、開発者に手軽なAI質問応答やコンテンツ生成サービスを提供することを目的としています。Gemini CLIを使えば、開発者は自分の端末インターフェースで直接AIの強力な力を活用でき、プログラミング効率や作業の利便性が向上します。Gemini CLIの特徴の一つは、最大で100万のトークンまでサポートしている点です。

Jun 26, 2025

ChatGPT iOSアプリの月間ダウンロード数が3,000万を突破、すべてのSNSアプリを上回る

ChatGPTのiOSアプリは過去28日間で2,960万回のダウンロードを記録し、世界中で最も人気のあるアプリとなりました。この成績により、ChatGPTのダウンロード数はTikTok、Facebook、Instagram、Xの4つのSNSアプリの合計を上回り、同じ期間のこれらのアプリのダウンロード数は約3,290万回で、10.6%の差がつきました。SNSアプリは市場での広報活動時間が長いにもかかわらず、ChatGPTは短期間でこれほどの成果を達成しました。

Jun 26, 2025

AIニュース

AIデイリー

AIタイムライン

Alハードウェアです

最新事例

画像コレクション

ビデオコレクション

オーディオコレクション

コンテンツコレクション

最新チュートリアル

AIプロダクトランキング

AIトラフィック成長ランキング

AIトラフィック減少ランキング

AI週間ランキング

アメリカ合衆国

中国

インド

ブラジル

画像生成

パーソナルアシスタント

キャラクター生成

ビデオ生成

AIプロジェクトランキング

AIプロジェクト成長ランキング

AI開発者ランキング

AI組織ランキング

Deepseek

TTS

LLM

ChatGPT

概要

衝撃！MetaのAIセキュリティシステムが「スペース」攻撃で簡単に突破される

AIbase基地

この記事はAIbaseデイリーからのものです

関連AIニュースの推奨

グーグルがImagin4を発表：テキスト生成のブレーキを突破 ジェミニAPIでテキストから画像生成

OpenAI がCodex CLIをRustに完全移行してパフォーマンス向上を図る

豆包AIプログラミングの大幅アップデート！コード知識ゼロでも簡単にカスタムウェブページを作成可能。リアルタイム編集でストレスフリー！

Anthropicが新機能をリリース ユーザーが Claude で直接 AI アプリケーションを構築可能に

新登場のGoT-R1マルチモーダルモデル：AIが描く画像をより賢く、イメージ生成の新時代へ！

AIスタートアップのScale AIがグーグルドキュメントを用いて顧客の機密情報が漏洩したと暴露される

WhatsAppにAIメッセージ要約機能が登場、Meta AIで個人のチャット履歴をまとめられます

オープンAIとマイクロソフトの上層部が電話で会談！今後の協力関係に謎が残る

グーグルがGemini CLIを発表！AIアシスタントが開発者向け端末に登場

​ChatGPT iOSアプリの月間ダウンロード数が3,000万を突破、すべてのSNSアプリを上回る

グーグルがImagin4を発表：テキスト生成のブレーキを突破ジェミニAPIでテキストから画像生成

Anthropicが新機能をリリース　ユーザーが Claude で直接 AI アプリケーションを構築可能に

ChatGPT iOSアプリの月間ダウンロード数が3,000万を突破、すべてのSNSアプリを上回る