アリババ・チエンワンが「テーブルエージェント」機能をリリースしました。ユーザーは自然言語の会話を通じてExcelファイルを直接作成・照会・編集でき、テキストの答えから直接的な成果への進化を実現します。この機能は、情報のテーブルへの転換におけるゼロコスト、スマートな検索と深い編集の3つの主要な領域をカバーし、従来のテーブル処理プロセスを簡略化します。
広汽グループは星河智舱ADiGO Intelligenceアーキテクチャを発表しました。このアーキテクチャはアリババの通義千問大規模モデルと深く統合されており、スマートシートン体験を革新することを目的としています。このアーキテクチャは375万台以上の車両からの実際のデータに基づいており、多モード感知、感情的なインタラクション、シーンエジンの3つのコア機能を通じて、1.6秒以内に素早い応答、95%を超える認識精度を実現し、場面に応じたサービスを主体的に提供します。これにより、人車のインターフェースがより知能化され、感情的になることが推進されます。
DeepSeekの創業者である梁文鋒氏は最近、次世代の旗艦モデルであるDeepSeek V4が2026年4月下旬にリリースされる予定であることを発表しました。それ以前には、製品に階層モードが導入されており、高速モードは日常的な会話や即時の応答を強調し、画像やファイルの文字認識をサポートしています。一方、エキスパートモードは複雑な論理処理や深く考えることに焦点を当て、より高い能力を持っています。
『ニューヨーク・タイムズ』の報道によると、グーグルのAI概要機能の正確度は約90%。グーグルが年間5兆回以上の検索を行うことを考慮すると、これは1時間に5,700万を超える誤った答えが生成される可能性を意味し、1分間に百万以上もの誤情報が発生する可能性がある。スタートアップ企業Oumiによる評価では、グーグルのGeminiモデルの正確度は昨年10月の85%から今年2月の91%まで向上した。
毎晩3つの質問に答えることで、AIがあなたの感情と思考パターンを明らかにし、無料で日記習慣を始められます。
最初のAI同僚で、タスクを自動化し、コードを書き、3000以上のツールを接続できます。質問に答えるだけでなく、実際の作業を行います。
AIを利用して質問に答えることで、パーソナライズされたギフトの提案を得ることができ、アマゾンの購入リンクも含まれています。
AnuNeko は、ユーザーの質問に答えるスマートなチャットアシスタントです。
Xai
$1.4
入力トークン/百万
$3.5
出力トークン/百万
2k
コンテキスト長
Openai
$7.7
$30.8
200
Anthropic
$105
$525
Google
$0.7
$2.8
1k
$7
$35
$2.1
$17.5
$21
Alibaba
$6
$24
256
$2
$20
-
$4
$16
Bytedance
$1.2
$3.6
4
$3.9
$15.2
64
$0.8
dogeater1612
これはGoogle Gemma 2 9Bモデルを微調整したオランダ語患者シミュレーションモデルで、医療教育シーン向けに特別に設計されています。モデルは常に固定のJSON構造で応答し、手術を終えて回復中の患者「マリア」をシミュレートし、看護専門の学生が安全な環境でコミュニケーションと臨床推論能力を鍛えることをサポートします。
Mungert
Nanonets-OCR2-3B GGUFモデルは、文書処理用に設計された強力なツールで、さまざまな文書をスマートに構造化されたMarkdown形式に変換でき、OCR、画像からのテキスト変換、PDFからのMarkdown変換、ビジュアル質問応答など、さまざまな高度な識別と処理能力を備えています。
mlx-community
これはQwen3-VL-32B-Thinkingモデルを変換した4ビット量子化バージョンで、MLXフレームワークに特化して最適化されています。このモデルは32Bパラメータ規模のマルチモーダル視覚言語モデルで、思考連鎖推論能力を備え、画像とテキストの入力を同時に処理し、高品質のテキスト応答を生成することができます。
nvidia
NVIDIA Nemotron Nano v2 12B VLは強力なマルチモーダルビジュアル言語モデルで、多画像推論と動画理解をサポートし、文書インテリジェンス、ビジュアル質問応答、要約機能を備え、商用に使用できます。
TIGER-Lab
本プロジェクトはQwen2.5-VL-7B-Instructモデルに基づいており、視覚質問応答タスクに特化しており、画像に関連する質問に正確に回答でき、高い正確性と関連性を備えています。これはマルチモーダル視覚言語モデルであり、画像理解と画像に基づく質問応答インタラクションをサポートします。
cpatonn
NVIDIA Nemotron Nano 12B v2は、NVIDIAによって最初から訓練された大規模言語モデルで、推論および非推論タスク用に設計されています。混合Mamba2-Transformerアーキテクチャを採用し、多言語に対応し、制御可能な推論能力を備えており、ユーザーの要求に応じて推論過程を生成するか、直接答えを提供することができます。
professorf
GPT-OSS-20BはOpenAIが開発したオープンウェイトモデルで、210億のパラメータ(うち36億がアクティブパラメータ)を持ち、低遅延、ローカルデプロイ、特定のユースケース向けに設計されています。このモデルはharmony応答形式で訓練されており、強力な推論能力とエージェントタスク処理能力を備えています。
sabaridsnfuji
日本のレシートビジュアル言語モデルlfm2 - 450Mは、日本のレシートを理解して処理するために特別に開発されたビジュアル言語モデルです。これはLiquidAIのLFM2 - VL - 450M基礎モデルに基づいて構築されており、レシート画像を分析し、構造化情報を抽出し、レシート内容に関する質問に答え、日本語と英語で詳細な説明を提供することができます。
wcy1122
MGM-Omni-7Bは全モーダルチャットボットで、テキスト、画像、ビデオ、音声入力を処理し、テキストと音声の応答を生成することができます。長音声の理解と生成能力を備え、中英語のゼロサンプル音声クローンもサポートしています。
tensorblock
Nile-Chat-4Bは、MBZUAI-Parisが開発した40億パラメータの多言語対話モデルで、先進的なTransformerアーキテクチャに基づいて構築され、対話シーンに特化して最適化されています。このモデルは複数の言語をサポートし、流暢な自然言語対話が可能で、高品質な応答生成能力を備えています。
axolotl-ai-co
gpt-oss-20bはOpenAIが開発したオープンウェイトモデルで、210億のパラメータ(うち36億はアクティブなパラメータ)を持ち、低遅延、ローカルデプロイ、特定のシナリオ向けに設計されています。このモデルはharmony応答形式で訓練され、強力な推論能力とエージェントタスク処理能力を備えています。
duyntnet
Impish_LLAMA_4Bは、nVidiaの枝刈りモデルに基づいて構築された40億パラメータの大規模言語モデルで、ロールプレイングとアドベンチャーシーンに特化して最適化されています。このモデルは、小さなパラメータ規模を維持しながら、卓越した応答能力とコンテキスト感知能力を発揮し、首尾一貫したアドベンチャーストーリーを生成し、一定のアシスタント機能を備えています。
mlxha
このモデルは、Qwen/Qwen3-4Bをベースに、medmcqa-grpoデータセットでGRPO方法を用いて微調整した医療質問応答大規模言語モデルです。医学選択問題のシナリオに特化して最適化されており、強力な医学的推論能力を備えています。
lakshya-rawat
LayoutLMv3-baseをファインチューニングしたドキュメントQAモデルで、OCRデータを利用してドキュメントを理解し関連する質問に答えることができます。
fahadh4ilyas
Llama 3.2-VisionはMetaが開発したマルチモーダル大規模言語モデルで、画像推論とテキスト生成能力を備え、視覚認識、画像記述、質問応答などのタスクをサポートします。
Video-R1
Video-R1-7BはQwen2.5-VL-7B-Instructを最適化したマルチモーダル大規模言語モデルで、ビデオ推論タスクに特化しており、ビデオコンテンツを理解し関連する質問に答えることができます。
prithivMLmods
Raptor-X5-UIGENはQwen 2.5 14Bモダリティアーキテクチャを基に設計された大規模言語モデルで、UI設計、ミニマルコーディング、コンテンツ集約型開発に特化し、強化された推論能力と構造化された応答生成を備えています。
yukiarimo
Yuna Ai V4は、LLaMA 3.1 8Bアーキテクチャに基づく多言語テキスト生成モデルで、スマートな対話と知識問答体験の提供に特化しています。3B以上のトークンで訓練され、量子思考などの先進的な特性を備え、対話能力と創造力に優れています。
yeniguno
mBART-large-50をファインチューニングしたトルコ語の抽象質問応答モデルで、法律テキスト向けに設計されており、単なる断片抽出ではなく自然で流暢な言い換え回答を生成できます。
トルコ法律テキストの抽出型Q&Aタスク向けにファインチューニングされたBERTモデルで、法律条項から関連する部分を抽出して質問に答えることができます。
ウォルフラム・アルファAPIに接続するMCPサーバーで、DuckDuckGoの '!wa' コマンドに似た機能を提供し、APIを通じてウォルフラム・アルファをクエリして答えを取得します。
Go言語で実装されたMCPサーバーで、Wordle APIを通じてWordleの毎日のパズルの答えを取得するために使用されます。Dockerによる迅速なデプロイとローカル実行の2つの方法をサポートしています。
このプロジェクトはMCPプロトコルサーバーを実装し、OpenRouterに基づくウェブ検索ツールを提供し、簡潔でリアルタイムの答えを生成できます。
dank - mcpは、Model Context Protocol (MCP)に基づくサーバーで、大麻データセットに関する質問に答えるために専用に設計されています。DuckDBを使用してデータを保存および処理し、Claude DesktopなどのLLMツールとの統合をサポートし、教育目的での大麻製品情報照会サービスを提供します。
AI支援洞察エージェントはMCPエージェントで、自然言語の質問を正確で、解釈可能で、再現可能なデータ洞察に変換します。自然言語インターフェイスを通じて業務上の質問をSQLクエリに翻訳し、説明付きの結果(クエリ文、指標定義、データ品質を含む)を提供し、分析の再現性を確保します。業務上の質問とデータの答えの間のギャップを埋め、データ分析の効率と透明性を向上させることを目的としています。
FastMCPベースのMCPサーバーで、4getメタ検索エンジンAPIへのシームレスなアクセスを提供し、ウェブ、画像、ニュース検索をサポートし、スマートキャッシュ、リトライ機構、および充実した応答形式を備えています。
MCPツールファクトリーはTypeScriptプロジェクトで、自然言語の記述、OpenAPI仕様、データベーススキーマ、GraphQLスキーマ、またはオントロジーから、すぐに本番環境で使用できるMCP(モデルコンテキストプロトコル)サーバーを迅速に生成できます。10のLLMプロバイダーをサポートし、コスト追跡、並列生成、LLM応答キャッシュなどの機能を備えており、それ自体がMCPサーバーでもあり、ClaudeなどのAIアシスタントと直接統合して使用できます。
Boundary MCPは、MCPプロトコルに基づく意思決定構造分析ツールです。これは答えやアドバイスを提供するのではなく、感情を取り除き、変数と制約を特定し、戦略空間を生成し、リスク分布を分析し、認知バイアスを警告することで、ユーザーが意思決定問題の本質的な構造と自分が何を賭けているのかを明らかにし、最終的に自分自身の選択に責任を持つことができるようにします。
ニューヨークタイムズのConnectionsゲームの答えを照会するAPIサービスを提供する