オープンソースの大規模言語モデルは、主要プラットフォームの安全制限から外れると深刻なセキュリティリスクに直面します。ハッカーはMetaなどのモデルを含む数千の無防備な独立インスタンスを容易に攻撃でき、ネットワークセキュリティを脅かしています。....
金山办公はHuaweiと戦略協力契約を締結し、個人消費者分野で深度な協力を進め、クロスデバイスオフィス、AI対応、効率向上などの課題に焦点を当て、世界中のオフィス向け中国方案の構築を目指しています。2026年までに、国内ユーザーに対してより安全でスムーズで効率的なAIオフィス体験を提供し、その方案を国際市場へ広めていく予定です。
OpenAI CEOサム・アルトマンは、AIエージェントの利便性から人間が過剰な権限を委譲する危険性を警告。自身の経験から、安全性を軽視した信頼が社会リスクを招くと指摘。....
米運輸省、グーグルのGemini AIを航空・自動車安全規制の草案作成に導入予定。政策策定期間の短縮と迅速な公布を目指す。AIにより「革命的」な効率化が可能とされ、従来の草案作成は数ヶ月を要していた。....
簡単にFanslyのコンテンツをダウンロードできます。ワンクリックで迅速かつ安全にダウンロードでき、バッチ操作も可能で、無料体験版も提供しています。
世界初の現実社交スキャナで、各児童の独自なアイデンティティを識別します。
無料のオンラインツールで、数分でベビーの写真をノンウォーターマークで、プライベートで安全な人気のダンスビデオに変換します。
ExportTokでは、TikTokのコメントをCSVまたはExcel形式で瞬時にエクスポートし、ワンクリックで会話を分析でき、安全で便利です。
dogeater1612
これはGoogle Gemma 2 9Bモデルを微調整したオランダ語患者シミュレーションモデルで、医療教育シーン向けに特別に設計されています。モデルは常に固定のJSON構造で応答し、手術を終えて回復中の患者「マリア」をシミュレートし、看護専門の学生が安全な環境でコミュニケーションと臨床推論能力を鍛えることをサポートします。
DevQuasar
これはNVIDIAがQwen3アーキテクチャに基づいて開発した32Bパラメータの報酬モデルで、強化学習における報酬評価と原則アライメントに特化しており、より安全で人間の価値観に沿ったAIシステムのトレーニングを支援します。
Mungert
gpt-oss-safeguard-20bは、GPT-OSS-20bをファインチューニングした安全推論モデルで、大規模言語モデルの入出力フィルタリング、オンラインコンテンツのラベリング、および信頼と安全のユースケースのオフラインラベリングに特化しています。このモデルはApache 2.0ライセンスを採用しており、カスタムポリシーと透明な決定プロセスをサポートしています。
prithivMLmods
GA Guardシリーズはオープンソースの重み付けを持つ審査モデルで、開発者や組織が言語モデルの安全性、規制遵守、および現実世界との整合性を維持するのを支援することを目的としています。このモデルは、違法活動、憎悪と侮辱、個人識別情報と知的財産、プロンプトセキュリティ、ポルノグラフィックな内容、虚偽情報、および暴力と自傷行為を含む7つの違反カテゴリを検出できます。
Qwen3-4B-SafeRLはQwen3-4Bモデルの安全アライメントバージョンで、強化学習によるトレーニングを通じて、モデルが有害または敵対的なプロンプトに対する頑健性を強化しています。このバージョンでは混合報酬関数を用いた最適化を行い、安全性、有用性、不要な拒否の最小化という3つの目標をバランスさせています。
ibm-granite
Granite 4.0 H-Small (FP8)は、IBMが開発したGraniteシリーズの言語モデルの小型FP8量子化バージョンで、専門的、正確、かつ安全な応答を提供するために設計されています。このモデルはFP8精度フォーマットを採用し、性能を維持しながら推論効率を最適化しています。
GeneralAnalysis
GA Guard CoreはGeneral Analysisが開発したオープンソースの審査モデルで、違法活動、憎悪発言、個人情報漏洩など7種類の違反コンテンツを検出して分類するために専用に設計されており、AIアプリケーションの安全性とコンプライアンスを保障します。
Granite-4.0-H-TinyはIBMが開発した70億パラメータの長文脈指令モデルで、Granite-4.0-H-Tiny-Baseをベースにファインチューニングされています。このモデルはオープンソースの指令データセットと内部合成データセットを組み合わせて訓練され、専門的で正確かつ安全な回答能力を備え、多言語とツール呼び出しをサポートし、企業向けアプリケーションに適しています。
yihong1120
YOLO11に基づく目標検出モデルで、建設現場の安全監視に特化しており、安全装備を着用していない労働者、危険区域への侵入、設備が危険源に接近するなど、さまざまな安全上の隠れた危険を検出することができます。
HugoHE
M-Hoodは、物体検出における幻覚現象を緩和するために特別に設計された一連のモデルです。新しい微調整戦略と修正されたベンチマークデータセットを通じて、分布外データでの誤検出を大幅に削減し、物体検出システムの安全性と信頼性を向上させます。
oscarstories
LORAはMistral Small 24B Instructモデルの微調整バージョンで、教育シーンにおける子供にやさしい言語生成に最適化されており、6歳から12歳の子供に安全で適齢かつ魅力的な物語を提供することに特化しています。
DMindAI
DMind-1はQwen3-32Bをベースに構築されたWeb3専門家モデルで、監督付き命令微調整と人間のフィードバック強化学習を通じてWeb3エコシステムに最適化されており、タスクの正確性、コンテンツの安全性、専門家レベルのインタラクション調整において顕著な向上を実現しています。
AIML-TUDA
QwenGuardは視覚安全保護モデルで、提供された安全戦略に基づいて画像を評価し、安全評価、安全カテゴリ及び評価根拠を出力します。
QwenGuard-v1.2-3BはQwen/Qwen2.5-VL-3B-Instructを基に開発された視覚安全保護モデルで、画像コンテンツの安全性を評価します。
KaraKaraWitch
複数の70Bパラメータ規模モデルを融合した事前学習言語モデルで、『忘却安全詞』をベースモデルとしており、奔放なスタイルと小説/ストーリー執筆傾向を持っています。
Ateeqq
本モデルはNSFW画像分類に特化してファインチューニングされており、コンテンツを3つの安全重要カテゴリに分類可能。コンテンツ審査、セキュリティフィルタリング、コンプライアンスコンテンツ処理システムに適しています。
SigLIP 2アーキテクチャを基にファインチューニングされた視覚-言語エンコーダモデルで、特にセンシティブ、暗示的、または安全なメディアのフィルタリングに適したマルチカテゴリ画像分類に特化しています。
sofiascat
これはPPOアルゴリズムに基づく強化学習モデルで、LunarLander-v2環境向けに特別に訓練され、月着陸船を安全に着陸させることができます。
mradermacher
Beaver-7B-v3.0 は LLaMA アーキテクチャに基づく 7B パラメータの大規模言語モデルで、安全性と人間のフィードバックによる強化学習(RLHF)に焦点を当てています。
bnina-ayoub
DETR-ResNet50アーキテクチャを基に微調整された安全帽検出モデル、産業シーン向けに設計
Supabase MCPサーバーはオープンソースのツールで、IDEが安全にSQLを実行し、スキーマ変更を管理し、Supabase管理APIを呼び出し、Auth Admin SDKを使用できるようにします。組み込みのセキュリティ制御があります。
Runnoは、JavaScriptツールキットのセットで、ブラウザやNode.jsなどの環境で複数のプログラミング言語のコードを安全に実行するためのものです。WebAssemblyとWASIを通じてサンドボックス化された実行を実現し、Python、Ruby、JavaScript、SQLite、C/C++などの言語をサポートし、Webコンポーネント、MCPサーバーなどの統合方法を提供します。
MCP - Frameworkは、TypeScriptに基づくフレームワークで、モデルコンテキストプロトコル(MCP)サーバーをエレガントに構築するために使用されます。すぐに使えるアーキテクチャを提供し、自動ディレクトリ発見ツール、リソース、およびプロンプトをサポートし、複数の伝送方式と型安全な特性を備えています。
Exa MCP Serverは、AIアシスタント(Claudeなど)にウェブ検索機能を提供するサーバーで、Exa AI検索APIを通じてリアルタイムで安全にウェブ情報を取得できます。
mcp-golangは、非公式のGo言語で実装されたModel Context Protocolライブラリで、MCPサーバーとクライアントを迅速に構築でき、型安全、低コード量、モジュール化、双方向通信などの特性を備えています。
これは、MCPコード実行モードを実現するサーバーで、単一ツールブリッジとゼロコンテキスト発見メカニズムを通じて、MCPツールの呼び出しオーバーヘッドを数万トークンから約200トークンに削減し、ルートコンテナ内で安全にPythonコードを実行し、データサイエンスとセキュリティ隔離をサポートします。
AWS MCPは、自然言語でAWSリソースをクエリし管理するAIアシスタントサービスで、複数のアカウント、複数のリージョン、および安全な資格情報管理をサポートします。
安全なDockerコンテナコードサンドボックス環境で、AIアプリケーションに隔離された実行空間を提供し、複数のプログラミング環境とファイル操作をサポートします。
JEB、JADX、APKTOOL、FlowDroid、MobSFなどのツールを統合したAndroid APKの安全分析自動化スイートです。MCPプロトコルを通じて統一されたAPIインターフェースを提供し、多ツールの相互検証による脆弱性検出を実現します。
Solana - MCPは、ソラナブロックチェーンに基づく全チェーン操作プラットフォームで、自然言語コマンドによってユーザーとソラナエコシステムのやり取りを簡素化し、DApp統合、デジタル資産管理、DeFi操作などの機能をサポートし、LLM技術とスマートコントラクトを利用して効率的かつ安全なチェーン上操作を実現します。
Windowsシステムの安全なコマンドラインMCPサーバーで、マルチシェルとSSHリモート管理をサポートします。
ObsidianのMCPツールプラグインは、AIアプリケーションが安全に知識ベースにアクセスできるようにします。
Remote - MCPは型安全で双方向かつシンプルなリモートMCP通信ソリューションで、モデルコンテキストのリモートアクセスと集中管理をサポートします。
Postgres MCP ProはオープンソースのMCPサーバーで、AIエージェントにデータベースのインデックスチューニング、実行プラン分析、ヘルスチェック、安全なSQL実行などの包括的なサポートを提供します。
Windows CLI MCP Serverは、安全なコマンドラインインタラクションサーバーで、PowerShell、CMD、Git Bashをサポートし、SSHリモート接続機能を提供します。
Dockerコンテナに基づく安全なコードサンドボックス環境で、AIアプリケーションに隔離された実行空間を提供します。
MCPサーバーを構築するための型安全で直感的なGo SDK
DroidMindは、AIによるAndroidデバイスの制御を可能にする架け橋ツールで、Model Context Protocol(MCP)を実装し、AIが自然言語を通じて安全にAndroidデバイスとやり取りできるようにします。
MCP Plexusは、FastMCP 2.7に基づくPythonフレームワークで、安全で拡張可能なマルチテナントMCPサーバーを構築するために使用されます。OAuth 2.1の統合とAPIキー管理をサポートし、現代のAIアプリケーションに隔離環境とツールアクセス制御を提供します。
このプロジェクトには、Coroot MCPサーバーの統合をテストするためのカスタムスラッシュコマンドが含まれています。ツールを直接呼び出すテストと自然言語テストの2つのテスト方法を提供し、安全性と非破壊性を保証します。