アリババクラウドの通義ラボは、Qwen Code バージョン0.5.0をリリースしました。国内のAIプログラミングツールがコマンドラインツールからフルスタック開発エコシステムプラットフォームへと進化しました。新バージョンでは、コアなコーディング能力が強化され、プラグインの統合、プロジェクトの上下文理解、開発者の協力支援において新たな突破を遂げました。多ツール連携アーキテクチャを導入し、開発者のデジタル作業台を構築しています。
イタリア当局は、MetaのWhatsApp Business APIにおける第三者AI制限を緊急停止。市場支配地位の乱用とAI競争・消費者利益損害の疑い。EU調査に続く動きで、欧州はMetaのAI戦略に反独占審査を強化。焦点は、ChatGPT型AIのみ禁止しカスタマーサービスAIを許可する矛盾した政策にある。....
OpenAIがChatGPTに「フォーマットブロック」機能を追加。メールやブログなど特定タスクにUIを自動調整し、コンテンツ作成体験を向上。新たな「フォーマットボックス」はリッチテキスト編集ツールバーとして、従来のチャット表示を刷新。....
2026年北京亦庄人形ロボットハーフマラソンは4月19日に開催され、人間とロボットが分離区間で競う「人機共跑」方式を採用。ロボットの自律性、人間らしい歩行、長距離稼働に焦点を当て、自律ナビゲーション部門と遠隔操作部門を設置。同時に、災害救助を模した「巴图魯」チャレンジも実施予定。....
コード不要、自社データを使用して知的AIチャットボットを構築し、迅速に業務問題を解決します。
AnuNeko は、ユーザーの質問に答えるスマートなチャットアシスタントです。
100種類以上の独特なAIフタナリキャラクターとチャットボットを探索しましょう。
文学、哲学、科学の分野の偉人たちとチャットして交友できるチャットボット
Openai
$2.8
入力トークン/百万
$11.2
出力トークン/百万
1k
コンテキスト長
Google
$0.49
$2.1
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$105
$525
$0.7
$7
$35
$17.5
$21
Alibaba
$1
$10
256
$6
$24
Baidu
128
$4
$16
$2
$20
Bytedance
$1.2
$3.6
4
NyxKrage
Moondream 3 Preview HFは、HuggingFace Transformersアーキテクチャの仕様に基づいてMoondream 3 (Preview)モデルを再実装したもので、Hugging Faceのエコシステムと完全に互換性があります。これはマルチモーダルビジュアル言語モデルで、エキスパート混合(MoE)テキストバックボーンを採用し、約90億のパラメータと20億のアクティブパラメータを持ちます。
facebook
SAM 3はMetaが発表した第3世代のプロンプト可能な分割ベースモデルで、テキストまたはビジュアルプロンプト(点、ボックス、マスク)を利用して、画像とビデオ内のオブジェクトを検出、分割、追跡することができます。前代と比較して、SAM 3はオープンボキャブラリ概念のすべてのインスタンスを詳細に分割する機能を導入し、大量のオープンボキャブラリプロンプトをサポートし、SA - COベンチマークで人間の性能の75 - 80%を達成しています。
LiquidAI
LFM2-VL-3BはLiquid AIが開発したマルチモーダル視覚言語モデルで、LFM2バックボーンアーキテクチャに基づいて構築されており、強力な視覚理解と推論能力を備えており、特に細粒度な感知タスクで優れた性能を発揮します。このモデルは、テキストと画像の入力を効率的に処理することができ、最大512×512解像度の原生画像処理をサポートしています。
rtr46
meiki.text.detect.v0.1は、ビデオゲームや漫画のテキスト検出に特化した高精度、低遅延のOCRモデルで、日本語関連の内容で優れた性能を発揮します。このモデルはD - FINE検出器アーキテクチャに基づき、MobileNet v4 smallをバックボーンネットワークとして使用し、異なるアプリケーションシーンに対応するために2種類の解像度バリエーションを提供します。
nvidia
NVIDIA GPT-OSS-120B Eagle3は、OpenAIのgpt-oss-120bモデルをベースに最適化されたバージョンで、ハイブリッドエキスパート(MoE)アーキテクチャを採用し、総パラメータ数が1200億、アクティブなパラメータ数が50億です。このモデルは商用および非商用の使用をサポートし、テキスト生成タスクに適しており、特にAIエージェントシステムやチャットボットなどのアプリケーション開発に適しています。
jeevanrushi07
OpenLLaMA 3B v2はTransformerアーキテクチャに基づくオープンソースの大規模言語モデルで、30億のパラメータを持っています。このモデルはMITライセンスを採用しており、主に英文テキスト生成タスクに使用され、チャットボットなどのさまざまなアプリケーションシナリオをサポートします。
chetwinlow1
Oviは、テキストまたはテキスト + 画像の入力に基づいて、同期したビデオとオーディオコンテンツを同時に生成できる高度なオーディオ - ビデオ生成モデルです。このモデルはデュアルバックボーンアーキテクチャを採用し、5秒のビデオ生成をサポートし、マルチメディア創作に強力なツールを提供します。
merve
これはDETRアーキテクチャとDINOv3ビジュアルバックボーンネットワークをベースに微調整されたナンバープレート検出モデルで、評価セットで2.7008の損失値を達成し、専門的にナンバープレート認識タスクに使用されます。
VLA-Adapter
VLA-Adapterは、Libero-Spatial上で訓練されたマイクロビジョン言語アクションモデルで、Prismatic-VLMアーキテクチャを採用し、大規模言語モデルのバックボーンとしてQwen2.5-0.5Bのみを使用しています。このモデルは、ロボットのベンチマークテストで、パラメータ規模がより大きいオープンソースのVLAモデルを上回り、高性能なビジョン - 言語 - アクションの理解と実行を実現しています。
adityak74
MEDFIT-LLM-3Bは、医療質問応答に特化して最適化された言語モデルで、MetaのLlama-3.2-3B-Instructをベースに微調整されています。このモデルは、LoRA技術を用いて医療データセットで訓練され、医学分野の理解と直接的な回答能力が大幅に向上しており、医療チャットボットや患者教育などのアプリケーションシナリオに適しています。
MEGHT
Qwen3 0.6Bモデルをベースにファインチューニングされた検索クエリ生成モデルで、ユーザー入力と対話コンテキストに基づいて関連する検索クエリを生成でき、検索エンジン提案システムやチャットボットなどのアプリケーションシナリオに適しています。
NVIDIA Qwen3-32B FP4モデルは、アリババのQwen3-32Bモデルの量子化バージョンで、最適化されたTransformerアーキテクチャを使用し、重みと活性化関数をFP4で量子化しています。AIエージェントシステム、チャットボット、RAGシステムなどのAIアプリケーションに適しています。
NVIDIA Qwen3-14B FP4モデルは、アリババのQwen3-14Bモデルの量子化バージョンで、FP4データ型を用いて最適化され、TensorRT-LLMによる効率的な推論が可能です。このモデルはNVIDIA GPU加速システム向けに設計されており、AIエージェントシステム、チャットボット、RAGシステムなどの様々なAIアプリケーションシーンに適しており、世界中での商用および非商用利用がサポートされています。
NVIDIA Qwen3-8B FP4モデルは、アリババのQwen3-8Bモデルの量子化バージョンで、最適化されたTransformerアーキテクチャを採用した自己回帰型言語モデルです。このモデルはFP4量子化技術を使用し、パフォーマンスを維持しながらメモリ使用量と計算要件を大幅に削減し、AIエージェントシステム、チャットボット、RAGシステムなどのアプリケーションシナリオに適しています。
wcy1122
MGM-Omni-TTS-2BはMGM-Omni全機能チャットボットの音声生成コンポーネントで、テキストから音声への変換に特化しています。中英語のゼロサンプル音声クローニングをサポートし、10分以上の流暢で自然な音声を生成でき、効率的なストリーミングオーディオ生成を実現します。
MGM-Omni-7Bは全モーダルチャットボットで、テキスト、画像、ビデオ、音声入力を処理し、テキストと音声の応答を生成することができます。長音声の理解と生成能力を備え、中英語のゼロサンプル音声クローンもサポートしています。
birder-project
これはBolyaらのPE-Coreモデルに基づくViT-L14画像エンコーダで、画像特徴抽出のためにBirder形式に変換されています。このモデルは元の重みとアーキテクチャを保持していますが、CLIP投影層を削除してオリジナルの画像埋め込みを出力するようになっており、画像分類と検出タスクに適した汎用の視覚バックボーンネットワークです。
gabriellarson
OpenBuddyはオープンソースの多言語チャットボットで、複数の言語をサポートし、ユーザーに多様な交流体験を提供できます。
NVIDIA Qwen3-30B-A3B FP4は、アリババのQwen3-30B-A3Bモデルの量子化バージョンで、最適化されたTransformerアーキテクチャを採用し、FP4量子化技術によりモデルサイズを約3.3倍削減しながら、良好な性能を維持しています。このモデルは商用および非商用用途をサポートし、AIエージェントシステム、チャットボット、RAGシステムなどのアプリケーションシーンに適しています。
metehanayhan
Meta LLaMA 3.1 8B大規模言語モデルをベースに微調整されたトルコ語教育質問と回答用のチャットボットで、トルコ語教育シーンに特化して最適化されています。
Coco AIは、Google Workspace、Dropbox、GitHubなどの企業アプリとデータを統合した統一検索プラットフォームで、プラットフォームを超えた検索とAI駆動のチームチャット機能を提供し、業務効率とコラボレーション体験の向上を目指しています。
AIインフラストラクチャエージェントは、ユーザーが自然言語コマンドでAWSクラウドリソースを管理できるインテリジェントなシステムです。AIモデルを利用してユーザーの要件を実行可能なAWS操作に変換し、Webダッシュボード、状態管理、およびセキュリティ保護機能を提供します。
RagRabbitは自ホスト型のAIサイト検索およびLLM.txt生成ツールで、Vercel上にワンクリックでデプロイできます。
このプロジェクトは、Node.jsベースのMCPサービスアーキテクチャを展示しており、バックエンドAPIサービス、MCPサーバー、およびクライアントAIチャットボットが含まれています。MCPサーバーはAPIアクセス方法を標準化し、クライアントはMCP機能を統合することでカスタムデータストレージ機能を実現しています。
MCP-ChatBotは、モジュール式能力プロトコル(MCP)に基づくチャットボットアプリケーションで、コンテナ化アーキテクチャを通じて天気サービスとGPT - 4oモデルを統合し、自然言語対話機能を提供します。
このプロジェクトでは、RAGベースのHRチャットボットを構築し、MCPサーバーを機能呼び出しの中心として、PDF文書のアップロード、解析、検索、および自然言語の質問応答機能を実現します。
ScreenPilotはMCPサーバーを介してLLMがデバイスを全面的に制御できるツールで、画面自動化ツールキットを提供し、画面キャプチャ、マウスとキーボードの制御などの機能をサポートし、自動化、教育、エンターテインメントに適しています。
ホームラボMCPは、Claude Desktopを通じて家庭用ラボのインフラストラクチャを管理および監視するためのModel Context Protocolサーバーのセットです。Docker、Ollama、Pi-hole、Unifi、UPSなどのさまざまなサービスをサポートし、統一型と独立型の2種類のデプロイメントモードを提供します。
これは、自然言語処理、画像生成から自動化ワークフローまで、複数の分野にまたがる多数のオープンソースAIプロジェクトのリストです。これらのプロジェクトは、開発者がAI技術を利用して、チャットボット、コード生成ツール、データ処理システムなどの様々なアプリケーションを構築するのを支援することを目的としています。
Glean APIを統合したMCPサーバーの実装で、検索とチャット機能を提供します。
このプロジェクトは、RAGベースのHRチャットボットを構築し、MCPサーバーを機能呼び出しセンターとして、PDFドキュメントのアップロード、解析、検索、自然言語の質問応答機能を実現します。
MCPサーバーを基にしたバーチャル旅行ロボット環境で、ユーザーはGoogle Mapsを通じてバーチャル旅行を行い、AI旅行者と対話することができます。
EspoCRM MCPサーバーは、全面的なモデルコンテキストプロトコルサーバーで、EspoCRMとのシームレスな統合を提供し、47種類のツールを使って完全なCRM操作をサポートします。連絡先、アカウント、機会、会議、ユーザー、タスク、潜在顧客管理、およびチーム、役割、エンティティ関係などの高度な機能を含み、AIチャットボットインターフェイスも備えています。
Image Gen MCP Serverは、Model Context Protocol(MCP)標準プロトコルを通じて、さまざまなLLMチャットボットにクロスプラットフォーム、多モデルの画像生成機能を提供する汎用AI画像生成サービスです。OpenAIとGoogleの複数の画像モデルをサポートし、テキスト対話からビジュアルコンテンツへのシームレスな変換を実現します。
MCPは、LLMのやり取りを標準化するオープンソースのプロトコルで、データソースに接続し、コンテキストを取得し、ツールを使用し、標準的なプロンプトを実行するための統一されたフレームワークを提供します。プロジェクトの例では、MCPサーバーとクライアントを構築し、知識ベースチャットボットの機能を実現する方法が示されています。
mcp-scaffoldは、モデルコンテキストプロトコル(MCP)サーバーを検証するための開発サンドボックスで、ローカルLLM(LLaMA 7Bなど)とクラウド推論をサポートし、チャットインターフェイスと参照アーキテクチャを含んでいます。
OpenAIエージェントフレームワークに基づくスマートチャットボットで、カスタムツールの拡張とWeb対話をサポートします。
MCPサーバーを通じてClaudeとDiscordチャンネルのやり取りを実現するリレーサービスで、メッセージの送信、返信の受信、ボタンによる対話機能をサポートします。
GLM - 4.5Vモデルに基づくMCPサーバーで、インテリジェント画像分析機能を提供し、ファイルパスまたはクリップボードから画像を取得することをサポートし、コード内容の抽出、アーキテクチャ分析、エラー検出、ドキュメント生成に特化しています。
Next.jsベースのMastraドキュメントチャットボットで、MastraエージェントとMCPドキュメントサービスを統合し、リアルタイム対話型のドキュメント検索機能を提供します。