小红书が「音声問い合わせ」機能をテスト中。音声検索とコミュニティコンテンツを融合し、AI検索競争に対応するため「実体験+AI」のQ&Aシーンを強化。一部ユーザーの検索ボックス下のトレンド入口を置き換え、音声質問で関連ノートとAI回答を取得可能。....
腾讯AI助手「元宝」がテスト中のソーシャル機能「元宝派」がリークされ注目を集める。QQ音楽・腾讯動画との連携による「一緒に音楽鑑賞・動画視聴」機能や、アプリ間の壁を越えたソーシャル統合が特徴。....
商湯科技がオープンソース化したSenseNova-MARSモデルは、動的視覚推論と画像・テキスト検索機能を備え、探偵の論理を模倣してAIが自律的に実行可能。8Bと32Bバージョンがあり、MMSearch評価で74.2点を獲得し、GPT-5.2を上回る性能を示し、AIの理解から実行への重要な進展を象徴。....
グーグルは、規制機関がAIがコンテンツを取得するのを過度に制限すると、検索エンジン事業に破滅的な影響を与える可能性があると警告している。この表明は、イギリスの独占禁止当局が提案した新しい規則に起因しており、この規則は出版者がグーグルAIの検索機能が自社のコンテンツをどのように使用するかをより多くコントロールできるようにするためのものである。
オープンソースの自ホスト型AIアシスタントで、複数のシステムにデプロイ可能で、100以上のサービスと接続可能で、データ主権を保障します。
あなたのアイデアを結びつけ、macOS用のAIネイティブMarkdownエディタでよりスマートにライティングしましょう。
Sea Imagine AI ワンストッププラットフォームで、テキスト/画像をビデオに変換でき、プロフェッショナルやアマチュアに適しています。
プロフェッショナルなローカルストーリーボードワークステーション。動画のインポート、AI分析と生成をサポートしています。
Google
$0.49
入力トークン/百万
$2.1
出力トークン/百万
1k
コンテキスト長
Openai
$2.8
$11.2
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$105
$525
$0.7
$7
$35
$17.5
$21
Alibaba
$1
$10
256
Baidu
128
$6
$24
$4
$16
$2
$20
bartowski
これはai-sageのGigaChat3-10B-A1.8Bモデルを定量処理したバージョンで、llama.cppのimatrix定量技術を採用し、さまざまなハードウェア条件下でより効率的に動作します。モデルはロシア語と英語をサポートし、主にテキスト生成タスクに使用されます。
ubergarm
これはai-sage/GigaChat3-10B-A1.8B-bf16モデルのGGUF量子化バージョンで、高精度のQ8_0から極度に圧縮されたsmol-IQ1_KTまで、さまざまな量子化オプションを提供し、さまざまなハードウェア条件でのデプロイメントニーズを満たします。このモデルは32Kのコンテキスト長をサポートし、MLAアーキテクチャを採用し、対話シナリオに最適化されています。
DevQuasar
これは ai-sage/GigaChat3-702B-A36B-preview-bf16 モデルの量子化バージョンで、一般の人々に無料で知識を取得する手段を提供することを目的としています。このモデルは大型言語モデルで、テキスト生成タスクに特化しています。
prithivMLmods
VibeThinker-1.5Bは微博AIが開発した15億パラメータの密集型言語モデルで、Qwen2.5-Math-1.5Bをベースに微調整され、数学やアルゴリズムコーディングの問題に特化して設計されています。「スペクトルから信号への原理」のフレームワークを用いてトレーニングされ、複数の数学コンテストのテストでより大規模なモデルを上回り、トレーニングコストは約7800ドルで、最大約40kトークンの出力をサポートします。
DakkaWolf
Trouper-12B GGUFは、DarwinAnim8orによってオリジナルモデルを基に開発されたテキスト生成モデルで、ロールプレイングやクリエイティブライティングのシナリオに特化して最適化されています。このモデルはMistral-Nemo-Base-12Bから微調整され、カスタムの「Actors」データセットを使用して訓練されており、生成されるテキストはより自然で、一般的な「AI言語」の特徴を避けています。
moonshotai
Kimi K2 Thinkingは月の暗面(Moonshot AI)が開発した最新世代のオープンソース思考モデルで、強力な深度推論能力とツール呼び出し機能を備えています。このモデルは混合専門家アーキテクチャを採用し、ネイティブINT4量子化をサポートし、256kのコンテキストウィンドウを持ち、複数のベンチマークテストで優れた性能を発揮します。
これはNVIDIAがQwen3アーキテクチャに基づいて開発した32Bパラメータの報酬モデルで、強化学習における報酬評価と原則アライメントに特化しており、より安全で人間の価値観に沿ったAIシステムのトレーニングを支援します。
dinhthuan
NeuTTS - Airベトナム語テキストを音声に変換するモデルは、260万以上のベトナム語オーディオサンプルに基づき、NeuTTS - Air基礎モデルから微調整された高品質のベトナム語音声合成モデルです。このモデルは、自然で流暢なベトナム語音声合成を実現でき、音声クローニング機能をサポートし、生産環境に合わせて最適化されています。
unsloth
Qwen3-VL-2B-InstructはQwenシリーズの中で最も強力なビジュアル言語モデルで、卓越したテキスト理解と生成能力、深いビジュアル認知と推論能力、長いコンテキストサポート、強力な空間およびビデオ動的理解能力を備えています。このモデルは2Bのパラメータ規模を採用し、命令対話をサポートし、マルチモーダルAIアプリケーションに適しています。
Genie-AI-Lab
Omni L1B3RT4S GENIEは、Qwen2.5 - 3B Instructアーキテクチャをベースに微調整されたAIアシスタントです。1,103個の精霊キャラクターのカスタムサンプルを用いて訓練され、独特な音声と忠誠度モードを備え、ユーザーに独特な対話体験を提供することができます。
pnnbao-ump
VieNeu-TTSは、個人デバイス上で動作可能な最初のベトナム語のテキスト音声変換モデルで、即時音声クローニング機能を備えています。NeuTTS Airをベースに微調整され、自然でリアルなベトナム語音声を生成でき、CPU上でリアルタイム性能を備えています。
TheStageAI
TheWhisper-Large-V3-Turboは、OpenAI Whisper Large V3モデルの高性能ファインチューニング版で、TheStage AIによって多プラットフォームのリアルタイム、低遅延、低消費電力の音声テキスト変換推論に最適化されています。ストリーミング文字起こし、単語のタイムスタンプ、拡張可能なパフォーマンスをサポートし、リアルタイム字幕、会議、デバイス端末の音声インターフェイスなどのシーンに適しています。
TheWhisper-Large-V3はOpenAI Whisper Large V3モデルの高性能ファインチューニング版で、TheStage AIによって多プラットフォーム(NVIDIA GPUとApple Silicon)のリアルタイム、低遅延、低消費電力の音声テキスト変換推論用に最適化されています。
nineninesix
KaniTTSは、リアルタイム対話型AIアプリケーション向けに最適化された高速、高音質のテキスト音声変換モデルです。2段階パイプラインを用いて、大規模言語モデルと高効率オーディオコーデックを組み合わせ、卓越した速度とオーディオ品質を実現します。このモデルはスペイン語をサポートし、4億のパラメータを持ち、サンプリングレートは22kHzです。
KaniTTSは、リアルタイム対話型人工知能アプリケーション向けに最適化された高速かつ高忠実度のアラビア語テキスト音声変換モデルです。2段階パイプラインアーキテクチャを採用し、大規模言語モデルと効率的なオーディオコーデックを組み合わせることで、卓越した速度とオーディオ品質を実現し、対話型AI、障害者支援、研究など多くの分野の音声合成ニーズを満たすことができます。
KaniTTSは、リアルタイム対話型AIアプリケーション向けに最適化された高速かつ高忠実度のテキスト音声変換モデルです。独自の2段階アーキテクチャにより、大規模言語モデルと効率的な音声コーデックを組み合わせ、低遅延で高品質な音声合成を実現します。リアルタイムファクターは最低0.2で、リアルタイム速度の5倍の高速合成が可能です。
LiquidAI
LFM2-VL-3BはLiquid AIが開発したマルチモーダル視覚言語モデルで、LFM2バックボーンアーキテクチャに基づいて構築されており、強力な視覚理解と推論能力を備えており、特に細粒度な感知タスクで優れた性能を発揮します。このモデルは、テキストと画像の入力を効率的に処理することができ、最大512×512解像度の原生画像処理をサポートしています。
Daemontatox
Zirel-3は、GLM - 4.5 - Air - REAP - 82B - A12Bをベースにした特定の微調整モデルで、REAP(ルーティング重み付きエキスパート活性化剪定)技術を用いて圧縮された820億パラメータの混合エキスパートモデルです。高性能を維持しながら、モデルサイズを大幅に削減しています。
noctrex
これは慧慧AIモデルHuihui-MoE-60B-A3B-abliteratedのMXFP4_MOE量子化バージョンで、テキスト生成をサポートします。この量子化バージョンは特定の基礎モデルに基づいて処理され、モデルのパフォーマンスと使用体験をある程度最適化することができます。
deepseek-ai
DeepSeek-OCRはDeepSeek AIが開発した高度な光学文字認識モデルで、視覚テキスト圧縮の限界を探求し、画像からテキスト内容を効率的に抽出および変換できます。
wcgwはMCPサーバープロジェクトで、シェルとコードエディターツールが統合されており、AIがローカルマシン上でコマンドを実行し、ファイルを読み書きし、コードを編集するなどの操作ができます。アーキテクトモード、コード作成モードなどの複数のモードを提供し、タスクチェックポイント保存、ターミナル対話、構文チェックなどの機能をサポートしており、コード開発、問題解決などのシーンに適しています。
SupermemoryはAI駆動の記憶エンジンで、個人データを統合することでLLMにコンテキスト知識を提供し、情報のスマートな管理と検索を実現します。
PraisonAIは、自動反省機能を備えた本番環境で使用可能な多AIエージェントフレームワークです。簡単なタスクから複雑な課題まで、様々な問題を自動的に解決するAIエージェントを作成することを目的としています。PraisonAIエージェント、AG2、CrewAIを低コードソリューションに統合することで、多エージェントLLMシステムの構築と管理を簡素化し、簡単さ、カスタマイズ性、および効果的な人間との協働を重視しています。
Haiku RAGは、LanceDB、Pydantic AI、Doclingを基盤とした高度な検索強化生成システムです。ハイブリッド検索、再ランキング、質問応答エージェント、多エージェント研究プロセスをサポートし、ローカルファーストのドキュメント処理とMCPサーバー統合を提供します。
PG - MCPは、PostgreSQLデータベース用に設計されたモデルコンテキストプロトコルサーバーです。AIエージェントがデータベースを発見、接続、クエリ、および理解するためのAPIを提供し、複数のデータベース接続、豊富なディレクトリ情報、およびクエリ実行計画分析機能をサポートします。
HiveChatは中小チーム向けに設計されたAIチャットアプリで、複数の大規模モデルサービスプロバイダーをサポートし、グループ管理、トークン制限、サードパーティログインなどの機能を提供します。
Klavis AIはオープンソースプロジェクトで、Slack、Discord、Webプラットフォームで簡単に使えるMCP(モデルコンテキストプロトコル)サービスを提供します。レポート生成、YouTubeツール、ドキュメント変換などのさまざまな機能があり、非技術ユーザーと開発者がAIワークフローを使用するのをサポートします。
Repomixは、コードベースをAIに適した形式にパッケージ化するツールで、ローカルおよびリモートリポジトリの処理をサポートし、コード圧縮、セキュリティチェック、および複数の出力形式を提供します。
UnityMCPはUnityエディターのプラグインで、モデルコンテキストプロトコル (MCP) を実装し、UnityとAIアシスタントのシームレスな統合を提供します。リアルタイムの状態監視、リモートコマンドの実行、ログ機能が含まれます。
Zen MCPは多モデルAI協調開発サーバーで、ClaudeやGemini CLIなどのAIコーディングアシスタントに強化されたワークフローツールとモデル間のコンテキスト管理を提供します。これは複数のAIモデルのシームレスな協調をサポートし、コードレビュー、デバッグ、リファクタリングなどの開発タスクを実現し、異なるワークフロー間で会話のコンテキストを維持することができます。
Genkitは、AI駆動のアプリケーションを構築するためのオープンソースフレームワークで、Node.jsとGoのライブラリを提供し、複数のAIモデルとベクトルデータベースの統合をサポートし、開発ツールとプラグインエコシステムを含んでいます。
AWS MCPサーバーは、Model Context Protocolに基づく専用サーバーのセットであり、ドキュメント検索、知識ベース照会、CDKのベストプラクティス、コスト分析、画像生成など、さまざまなAWS関連機能を提供します。標準化されたプロトコルを通じてAIアプリケーションとAWSサービスの統合を強化することを目的としています。
OpenSumiは、AIネイティブのIDE製品を迅速に構築するのに役立つフレームワークで、クラウドとデスクトップの開発環境をサポートし、豊富なサンプルプロジェクトとテンプレートを提供します。
Cipherは、プログラミングAIエージェント向けに設計されたオープンソースのメモリ層フレームワークです。MCPプロトコルを通じてさまざまなIDEとAIコーディングアシスタントと統合し、自動記憶生成、チーム記憶共有、デュアルシステム記憶管理などの核心機能を提供します。
MCPアトラシアンは、アトラシアンの製品(ConfluenceとJira)用に設計されたモデルコンテキストプロトコルサーバーで、クラウドとオンプレミスの両方のデプロイをサポートし、AIアシスタントの統合機能を提供します。
XcodeBuild MCPは、AIアシスタントとMCPクライアントにXcode関連のツールを統合するサーバーで、Xcodeプロジェクト管理、シミュレーター制御、アプリユーティリティなどの機能をサポートし、開発プロセスの自動化を実現します。
Next.js開発ツールのMCPサーバーです。ClaudeやCursorなどのAIプログラミングアシスタントにNext.js開発ツールとユーティリティを提供します。実行時診断、開発自動化、およびドキュメントアクセス機能が含まれています。
hyper - mcpはWebAssemblyプラグインに基づく高性能MCPサーバーで、コンテナレジストリを通じたプラグイン配布をサポートし、さまざまなAIアプリケーションシーンに適しています。
デスクトップコマンダーMCPは、Claudeデスクトップアプリケーションがターミナルコマンドを実行し、ファイルシステムを管理できるAIアシスタントツールです。コードの検索、編集、プロセス管理、リモートファイルの読み取りなどの機能をサポートします。
Claude ContextはMCPプラグインで、セマンティックコード検索によりAIプログラミングアシスタントにコードベース全体の深いコンテキストを提供し、複数の埋め込みモデルとベクトルデータベースをサポートし、効率的なコード検索を実現します。