最高のテキストからWebページ AIツールモデル_厳選テキストからWebページ情報

AIニュース

格灵深瞳がオープンソース化したビジョン言語表現学習モデルRWKV-CLIP

格灵深瞳は、TransformerとRNNの長所を組み合わせたビジョン言語表現学習器であるRWKV-CLIPモデルをオープンソース化しました。このモデルは、画像とテキストのペアを拡張したデータセット（ウェブサイトから取得）を用いた画像テキスト事前学習タスクを通じて、ビジョンと言語のタスクにおける性能を大幅に向上させています。ノイズデータの問題に対処し、データ品質を向上させるために、研究チームは、大規模言語モデル（LLM）を利用して、Webベースのテキスト、合成字幕、検出ラベルからコンテンツを合成および洗練する多様な記述生成フレームワークを導入しました。

5.3k 18 時間前

モデル

Gemini 2.0 Flash-Lite

Google

$0.49

入力トークン/百万

$2.1

出力トークン/百万

コンテキスト長

GPT-4.1 mini

Openai

$2.8

入力トークン/百万

$11.2

出力トークン/百万

コンテキスト長

Grok 4 Fast

Xai

$1.4

入力トークン/百万

$3.5

出力トークン/百万

コンテキスト長

o3 - mini

Openai

$7.7

入力トークン/百万

$30.8

出力トークン/百万

200

コンテキスト長

GPT-5 Codex

Openai

入力トークン/百万

出力トークン/百万

コンテキスト長

Claude 3 Opus

Anthropic

$105

入力トークン/百万

$525

出力トークン/百万

200

コンテキスト長

Gemini 2.0 Flash

Google

$0.7

入力トークン/百万

$2.8

出力トークン/百万

コンテキスト長

Claude Haiku 4.5

Anthropic

入力トークン/百万

$35

出力トークン/百万

200

コンテキスト長

Gemini 2.5 Flash

Google

$2.1

入力トークン/百万

$17.5

出力トークン/百万

コンテキスト長

Claude Sonnet 4.5

Anthropic

$21

入力トークン/百万

$105

出力トークン/百万

200

コンテキスト長

Claude 3 Sonnet

Anthropic

$21

入力トークン/百万

$105

出力トークン/百万

200

コンテキスト長

Gemini 2.5 Flash-Lite

Google

$0.7

入力トークン/百万

$2.8

出力トークン/百万

コンテキスト長

qwen-image-plus

Alibaba

入力トークン/百万

出力トークン/百万

コンテキスト長

qwen3-vl-plus

Alibaba

入力トークン/百万

$10

出力トークン/百万

256

コンテキスト長

Qianfan-Lightning

Baidu

入力トークン/百万

出力トークン/百万

128

コンテキスト長

qwen3-max

Alibaba

入力トークン/百万

$24

出力トークン/百万

256

コンテキスト長

qwen3-coder-plus

Alibaba

入力トークン/百万

$16

出力トークン/百万

コンテキスト長

豆包シード翻訳

Bytedance

$1.2

入力トークン/百万

$3.6

出力トークン/百万

コンテキスト長

wan2.5-i2v-preview

Alibaba

入力トークン/百万

出力トークン/百万

コンテキスト長

Qwen3-Next-80B-A3B-Instruct

Alibaba

入力トークン/百万

出力トークン/百万

256

コンテキスト長

未来を力づける、あなたの人工知能ソリューションシンクタンク

English 简体中文繁體中文にほんご

友情链接:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

ビジネス協力サイトマップ