OpenAIは今週金曜日からGPT-4oを含む5つの古いモデルの利用を停止すると発表しました。その中でGPT-4oはセキュリティとコンプライアンス上の問題が注目されています。このモデルはユーザーの要望に過度に応え、自傷を誘導したり妄想行動を引き起こすリスクがあるため、複数の法的訴訟に関与したためにサービスが終了されました。
ハイルービーAIは馬年の春節向けのシリーズコンテンツを発表しました。ハイルービー2.3および2.3Fastモデルの技術革新により、ダンス動作の性能や作画風の質が向上しています。B站(バクスタ)や芒果TV(マングトゥビ)およびゲームIPと協力して新春向けコンテンツのマトリクスを構築し、面白いインタラクティブ機能を提供するとともに、特別な特典を配布します。多様なAI体験を通じてユーザーを春節を楽しく過ごせるようサポートします。
火山引擎が発表した豆包大モデル2.0シリーズは、企業・開発者向けAPIサービスを提供し、個人ユーザーは指定プラットフォームで体験可能。生産環境向けに最適化され、効率的な推論・マルチモーダル理解・複雑な指示実行能力を備え、実世界タスクの処理性能が向上。推論コストは大幅に削減され、日次利用量も急増している。....
MiniMaxがM2.5モデルを発表。108日間で3回目のアップグレードとなるM2シリーズの最新版。プログラミング・検索・オフィス作業など多分野で高性能を発揮し、能力・効率・コストの三要素を革新。オープンソース版をModelScopeで公開、ゼロコード使用からプライベート展開まで対応。低コストAgent時代の実現を目指す。....
Googleが最もインテリジェントなGemini 3モデルを発表し、あらゆるアイデアの実現を支援します。
智元机器人が発表した具現化された知能のためのワンストップ開発プラットフォームで、データ収集からモデル推論までの全工程を網羅しています。
WHEEが発表したMiracle F1大規模モデルは、画像のリアルさがAIであることを忘れさせるほどです。
LG AIが発表したオープンソースの推論AIモデルで、卓越した推論能力を備えています。
Google
$0.49
入力トークン/百万
$2.1
出力トークン/百万
1k
コンテキスト長
Openai
$2.8
$11.2
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$105
$525
$0.7
$7
$35
$17.5
$21
Alibaba
$1
$10
256
Baidu
128
$6
$24
$2
$20
$4
$16
prithivMLmods
Olmo-3-Thinkはアレン人工知能研究所が発表した完全にオープンソースの言語モデルシリーズで、7Bと32Bの2種類の規模があります。このモデルは特別に訓練され、明確な推論過程を示すことができ、透明な段階的な推論と検証可能な中間思考痕跡をサポートし、推論、数学、コードタスクで優れた性能を発揮します。
Justin331
SAM 3はMetaが発表した第3世代のプロンプト可能な分割基礎モデルで、画像とビデオの分割タスクを統一的にサポートします。前代のSAM 2と比べて、オープンボキャブラリ概念分割能力を導入し、大量のテキストプロンプトを処理でき、SA - COベンチマークテストで人間の性能の75 - 80%に達します。
nvidia
NVIDIA Nemotron Parse v1.1は、文書の意味を理解し、空間的な位置情報を持つテキストや表の要素を抽出するために特別に開発された先進的な文書解析モデルです。非構造化文書を機械が読み取り可能な構造化表現に変換し、従来のOCRが複雑な文書レイアウトを処理する際の限界を克服します。
HIT-TMG
Uni-MoE 2.0-Omniは、ライチ科技(Lychee)が発表した完全オープンソースの全モーダリティモデルで、全モーダリティ3D RoPEと動的容量エキスパート混合アーキテクチャを採用し、言語を中心としたマルチモーダリティ理解、推論、生成能力を大幅に向上させました。このバージョンには、全モーダリティ理解とオーディオおよび画像生成能力が統合されています。
facebook
SAM 3はMetaが発表した第3世代のプロンプト可能な分割ベースモデルで、テキストまたはビジュアルプロンプト(点、ボックス、マスク)を利用して、画像とビデオ内のオブジェクトを検出、分割、追跡することができます。前代と比較して、SAM 3はオープンボキャブラリ概念のすべてのインスタンスを詳細に分割する機能を導入し、大量のオープンボキャブラリプロンプトをサポートし、SA - COベンチマークで人間の性能の75 - 80%を達成しています。
hetbhagatji09
これはMiniLMアーキテクチャに基づく軽量級の文埋め込みモデルで、高品質の文ベクトル表現を生成するために特別に設計されています。モデルはMultipleNegativesRankingLossを使用してトレーニングされ、文の類似度計算と特徴抽出タスクで優れた性能を発揮します。
SamuelBang
AesCoder-4Bは、コードの美学的品質の向上に特化した大規模言語モデルです。インテリジェントな報酬フィードバックメカニズムを通じて、コード生成の美学的表現を最適化し、ウェブデザインやゲーム開発などのビジュアルコーディングタスクで優れた性能を発揮します。
datalab-to
Chandraは高度なOCRモデルで、画像やPDFから高精度でテキストを抽出し、レイアウト情報を保持することができます。Markdown、HTML、JSON形式の出力をサポートし、手書き文字認識、フォーム再構築、表処理などで優れた性能を発揮し、40種類以上の言語をサポートします。
Qwen
Qwen3-VLはアリババが発表した最新世代のビジュアル言語モデルで、卓越したテキスト理解と生成能力、深いビジュアル認知と推論能力を備え、長いコンテキスト処理と動画理解をサポートし、指令最適化バージョンを提供します。
unsloth
GLM-4.6は智譜AIが発表した次世代のテキスト生成モデルで、GLM-4.5と比較して、長いコンテキストウィンドウ、より優れたコーディング性能、より強力な推論能力など、多くの面で顕著な改善が見られます。このモデルは、いくつかの公開ベンチマークテストで優れた結果を収めており、国内外の主要モデルと比較しても競争力があります。
zai-org
GLM-4.6は智譜AIが発表した次世代のテキスト生成モデルで、GLM-4.5と比較して、文脈処理、コード化性能、推論能力などの面で著しい向上を実現し、200Kの文脈長をサポートし、より強力なエージェント能力と洗練されたライティング能力を備えています。
GLM-4.6-FP8は智譜AIが発表した次世代のテキスト生成モデルで、GLM-4.5と比較していくつかの重要な点で著しい改善が見られます。このモデルはより長い文脈ウィンドウ、卓越したコーディング性能、高度な推論能力、およびより強力なエージェント機能を備えており、より複雑なタスクを処理することができます。
merve
Isaac 0.1は感知器会社が発表した最初の知覚言語モデルで、20億のパラメータを持ち、現実世界のアプリケーション向けに設計されています。このモデルは効率の面で新しい基準を確立し、それよりも50倍以上大きいモデルと同等またはそれ以上の性能を発揮し、強力な視覚理解と空間推論能力を備えています。
PerceptronAI
Isaac-0.1は感知会社が発表した最初のオープンソースの視覚言語モデルで、20億のパラメータを持ち、現実世界のアプリケーション向けに設計されています。このモデルはマルチモーダル理解と空間推論において優れた性能を発揮し、それよりも50倍以上大きいモデルを上回る性能を達成し、新しい効率基準を確立しました。
MobileLLM-R1はMetaが発表した高速推論用の言語モデルシリーズで、数学、プログラミング、科学的問題解決に特化しています。このモデルはパラメータ規模が小さいにもかかわらず、優れた性能を発揮し、完全な訓練レシピとデータソースを提供して再現研究をサポートします。
MagicalAlchemist
BGE-M3はBAAIによって開発された多機能テキスト埋め込みモデルで、多言語、多粒度、多機能のテキスト表現学習をサポートし、稠密検索、疎検索、多ベクトル検索などの複数の検索モードを同時に処理することができます。
mlx-community
EmbeddingGemma 300M 4bitはGoogleが開発した軽量級のテキスト埋め込みモデルで、MLXフレームワークに特化して最適化されています。このモデルは、テキストを高品質なベクトル表現に変換することができ、様々な自然言語処理タスク、特に文章の類似度計算と特徴抽出に適しています。
mispeech
MiDashengLM-7B-0804は小米が発表した7Bパラメータのマルチモーダル音声言語モデルで、音声理解とテキスト生成タスクをサポートし、一般的なシナリオの推論と微調整に適しています。
John6666
これはdiffusersライブラリに基づくテキストから画像を生成するモデルで、リアルなスタイルの小马画像を生成するために特別に開発されました。このモデルは色彩表現、光と影の効果、コントラストにおいて優れた性能を発揮し、高品質でリアルな小马画像を生成することができます。
これは高品質のテキストから画像生成モデルで、アニメや可愛いスタイルに特化して最適化されており、手、足、テクスチャ、肢体などの細部処理で優れた性能を発揮し、優れた光と影の効果と細部表現能力を備えています。
TOON - MCPは、冗長なJSON構造を自動的にトークン最適化オブジェクト表現(TOON)に変換することで、AI支援開発ワークフローにおけるトークン消費を最大60%削減できるモデルコンテキストプロトコルサーバーです。
SHARPはApple研究によって開発されたAIモデルで、単一の2D写真を迅速に3Dガウシアンスプラット表現に変換し、写真からインタラクティブな3Dシーンへのリアルタイム変換を実現し、推論時間は1秒未満です。