SpeechifyがChrome拡張機能に音声検出機能を追加。音声入力と音声アシスタントをサポートし、文書処理効率を向上。先進的音声認識技術でリアルタイム誤り訂正・不要語の自動削除を実現し、競争力強化。....
beehiivプラットフォームは全面的なアップグレードを行い、リアルタイム分析、AIによるサイト構築、ポッドキャストホスティング、デジタル製品販売機能が追加されました。クリエイターがコンテンツ制作から収益化までのサイクルを完結させることを支援します。CEOは所有権がコア競争力であると強調し、セグメント、チャネル、ブランド、収入の可能性を制御することが重要だと述べました。
科大訊飛が星火AIPCを発表、中国産AI PC時代を開幕。大規模モデルをクラウドから端末へ拡張し、AIネイティブPCを実現。業界をリードするサプライチェーン企業が参加した発表会は、同社の業界智能化における中核的役割を強調。....
10月29日、マジックリープとグーグルはリヤド未来投資イニシアチブ会議で再び提携することを発表し、ARメガネのプロトタイプを開発して拡張現実技術の進歩を推進する予定です。マジックリープのリーダーであるロス・ローゼンバーグ氏は、企業がARの先駆者からエコシステムパートナーへと変貌し、光学や表示などのイノベーション経験を活かしてビジョンの新たな段階を実現すると語っています。
2D画像を没入型の3Dモデルに変換し、ゲームアセットや電子商取引の商品に利用します。
世界変換モデルの最初の製品であり、リアルタイムで動画、ゲーム、またはカメラの映像をデジタルワールドに変換できます。
文化的観光やギャラリー向けのアート発見アプリ。
iPhoneでAR(拡張現実)技術を使用して屋外空間を測定?地図化しよう!
Mungert
PokeeResearch-7Bは、Pokee AIによって開発された70億パラメータの深度研究エージェントモデルです。AIフィードバック強化学習(RLAIF)と強力な推論フレームワークを組み合わせ、ツール強化型大規模言語モデルにおいて信頼性が高く、アライメントされ、拡張可能な研究レベルの推論を実現し、複雑な多段階研究ワークフローに適しています。
unsloth
Qwen3-Next-80B-A3B-Instructは、アリババの通義千問チームによって開発された最新世代の大規模言語モデルです。革新的な混合注意力機構と高疎なエキスパート混合アーキテクチャを採用し、総パラメータ数を80Bに保ちながら3Bのパラメータのみを活性化させ、効率的なコンテキストモデリングと推論の高速化を実現しています。ネイティブで262Kのコンテキスト長をサポートし、1Mトークンまで拡張可能です。
DeSTA-ntu
DeSTA2.5-Audioは汎用的な大型音声言語モデルで、自生成のクロスモーダルアライメント技術により、特定タスクの命令調整データを必要とせずに高い拡張性と効率を実現し、同時に言語能力を保持し、災害的忘却を回避します。
Salesforce
xGen-smallはエンタープライズ向けのコンパクトな言語モデルで、ドメイン特化型データキュレーション、スケーラブルな事前学習、長文脈拡張、強化学習による微調整を通じて、予測可能な低コストで長文脈性能を実現します。
microsoft
TRELLIS Text Largeは、構造化3D潜在空間に基づいて、拡張可能で多様な3Dコンテンツ生成を実現する大型のテキストから3D生成モデルです。
motexture
条件強化型テキスト動画生成モデル。時系列条件変換器で生成シーンを拡張しスムーズな遷移を実現、プロンプト補間機能をサポート
city96
これは元の120億パラメータFlux.1-devモデルを170億パラメータに拡張した自己融合バージョンで、グループ化された繰り返しとインターレースネットワーク層を通じてパラメータ拡張を実現し、現在は主に概念実証として使用されています。
EPFL-VILAB
4Mはトークン化とマスキング技術によりマルチモーダル拡張を実現する'任意から任意へ'の基盤モデルトレーニングフレームワーク
gradientai
Gradientが開発したLlama-3 8Bの長文コンテキスト拡張版で、100万トークンを超えるコンテキスト長をサポートし、RoPE thetaパラメータの最適化により効率的な長文処理能力を実現。
briaai
BRIA 2.3テキスト生成画像モデルを基に開発されたControlNet拡張機能で、テキストプロンプトとグレースケール画像ガイドにより画像の色リセットと多様なバリエーション生成を実現
prithivida
工業シーンに最適化されたSPLADE++モデルの実装で、検索品質と効率をバランスさせ、文書拡張と疎な表現学習をサポートします。
Doctor-Shotgun
TinyLlama-1.1Bベースの32k文脈ファインチューニング版、rope thetaの拡張により長文脈処理能力を実現
LanguageBind
LanguageBindは言語を中心としたマルチモーダル事前学習手法で、言語意味アラインメントによりビデオ-言語事前学習をNモーダルに拡張し、高性能なマルチモーダル理解とアラインメントを実現しています。
lllyasviel
ControlNet v1.1はStable Diffusionをベースとした拡張モデルで、Cannyエッジ検出により精密な画像生成制御を実現します。
google
Switch Transformersは混合専門家(MoE)アーキテクチャに基づく言語モデルで、マスク言語モデリングタスクでトレーニングされています。このモデルアーキテクチャはT5に似ていますが、フィードフォワード層を16個の専門家MLPを含む疎なMLP層に置き換えており、性能を維持しながらより速いトレーニング速度とより良い拡張性を実現しています。
X-CLIPはCLIPを拡張したもので、ビデオと言語の汎用的な理解のために、対照学習を通じてビデオ分類とビデオ-テキスト検索タスクを実現します。
胸部X線領域に最適化された言語モデル。語彙の改良、革新的な事前学習プロセス、テキスト拡張技術により優れた性能を実現
ParrotはT5ベースの言い換えフレームワークで、自然言語理解(NLU)モデルのトレーニング加速のために設計され、高品質な言い換えによるデータ拡張を実現します。
BrowserTools MCPは強力なブラウザ監視と相互作用ツールで、Chrome拡張機能とローカルサーバーを通じてAIによるブラウザのスマートな分析と操作を実現します。
Browser MCPはMCPサーバーとChrome拡張機能の組み合わせで、AIアプリケーション(VS Code、Claudeなど)を通じてブラウザの自動操作を実現し、高速、プライバシー保護、ログイン状態の維持、検出回避などの特徴を備えています。
Claude Debugs For Youは、MCPサーバーを介してLLM(Claudeなど)との対話型コードデバッグを実現するVS Code拡張機能です。
Figma MCPサーバープロジェクトは、Claudeなどのクライアントを通じてFigma APIとの統合を実現し、ファイルの読み取りとデザインシステム管理機能をサポートしています。拡張可能なアーキテクチャを備えていますが、APIの制限により現在は読み取り専用です。
このプロジェクトはMCPプロトコルを通じてClaude Codeに似た機能を実現し、コードの理解、修正、コマンド実行などのツールを提供し、複数のモデルとJupyterノートブック操作をサポートし、セキュリティ管理と開発拡張機能を備えています。
MCPMonkeyはViolentmonkeyに基づくブラウザ拡張で、MCPプロトコルサーバーを統合することでAI言語モデルとブラウザの対話機能を実現し、タブ管理、ページスタイル抽出などのツールを含みます。
openwrt - mcp - serverは、OpenWrt組み込みデバイス向けに設計された軽量で拡張可能なMCPプロトコルサーバーです。MQTTとHTTPの両方のプロトコルをサポートし、デバイスとAIシステムの双方向JSON - RPC通信を実現し、セキュリティ認証とモジュール化アーキテクチャを備えています。
このChrome拡張機能は、WebSocketを通じてウェブページとローカルのMCPサーバーを接続し、サーバーからウェブページのリソースを制御し、関数を実行する機能を実現します。
このプロジェクトは、LangGraphとMCPプロトコルに基づくリアルタイムのマルチツールエージェントアーキテクチャを示しています。エージェントの編成とツールの実行を分離することで、モジュール化された拡張可能なAIシステムを実現します。MCPサービスは複数の伝送プロトコル(SSE/STDIO)をサポートし、AIエージェントがリモートツールを動的に呼び出せるようにし、言語を超えたクラウドデプロイメントが可能です。
Tavily APIに基づいてウェブページ検索機能を実現するMCPプロトコルサーバーで、Claude拡張機能を通じてインストールして使用できます。
GooseTeamは、MCPプロトコルを通じてエージェント間のタスク割り当てとメッセージ管理を実現するAIエージェント共同作業プラットフォームです。自然言語とフローチャートの2つのプロトコル表現をサポートし、拡張ツールセットを提供します。
Calva MCP ServerはVS Codeの拡張機能で、Clojure/ClojureScript開発にAIプログラミングアシスタント機能を提供し、REPLを接続することで対話型プログラミングを実現し、AIがコードをリアルタイムで実行およびテストできるようにします。
VSCode/Cursor拡張機能で、MCPサーバを通じてConfluence Wikiとの統合を実現し、安全な設定画面とコンテンツ変換機能を提供します。
Cline Memory Bankは、AI支援開発用に設計された永続的なプロジェクトコンテキスト管理サーバーです。VSCodeのCline拡張機能と統合することで、セッション間でのプロジェクトの記憶機能を実現し、コンテキストの維持、進捗状況の追跡、技術的な決定事項の記録などを行います。
Isaac Sim MCP拡張機能は、自然言語でNVIDIA Isaac Simを制御し、ロボットシミュレーション、シーン作成、動的なインタラクションを実現し、MCPエコシステムと具現化されたインテリジェントアプリケーションを接続します。
ClaudeなどのAIアシスタントをGoogle Docsに接続し、ドキュメントの読み書き、書式設定、構造化操作を実現する拡張型MCPサーバーです。
AIエージェントプロジェクトはGoogle ADK開発キットを統合し、A2Aプロトコルをサポートしてエージェント間の通信を実現し、MCPプロトコルを通じて機能を拡張し、Docker化されたデプロイとPhoenix監視を提供します。
Chromeデバッグプロトコルに基づくMCPサーバーで、ブラウザの自動化操作に使用され、永続的なログインセッションをサポートし、拡張機能をインストールすることなく企業レベルのデプロイを実現します。
MCPプロトコルに基づくサーバープロジェクトで、Brave APIを統合することでネットワーク検索機能を実現し、Claude拡張機能として使用できます。
Archonは、AIエージェントを自律的に構築および最適化するインテリジェントシステムです。反復開発を通じて、エージェントの推論、ドメイン知識の統合、拡張可能なアーキテクチャなど、現代AIの重要な原則を示します。現在のバージョンV4は、包括的なStreamlitインターフェイスを提供し、Dockerデプロイをサポートし、AI IDEとのシームレスな接続を実現するためにMCPサービスと統合されています。