AIニュース

AIニュース

世界のAIイノベーションの瞬間をお見逃しなく

AIデイリー

毎日の3分AI業界トレンド

AIタイムライン

AI業界のマイルストーン

Alハードウェアです

すべてのAIハードウェアをリストアップします。

AIマネタイズガイド

最新事例

AIマネタイズ事例の共有

画像コレクション

AI画像生成マネタイズ事例

ビデオコレクション

AIビデオ生成マネタイズ事例

オーディオコレクション

AIオーディオ生成マネタイズ事例

コンテンツコレクション

AIコンテンツ作成マネタイズ事例

AIチュートリアル

最新チュートリアル

最新のAIチュートリアルを無料で共有

AIプロダクトランキング

AIプロダクトランキング

AIウェブサイトの総訪問数ランキングを表示

AIトラフィック成長ランキング

トラフィックによる最も急速に成長しているAIウェブサイトを追跡

AIトラフィック減少ランキング

トラフィックが大幅に減少しているAIウェブサイトに焦点を当てる

AI週間ランキング

AIウェブサイトの週間訪問数ランキングを表示

人気のある国ランキング

アメリカ合衆国

米国のユーザーに最も人気のあるAIウェブサイト

中国

中国のユーザーに最も人気のあるAIウェブサイト

インド

インドのユーザーに最も人気のあるAIウェブサイト

ブラジル

ブラジルのユーザーに最も人気のあるAIウェブサイト

人気のあるカテゴリランキング

画像生成

AI画像生成ウェブサイトの総訪問数ランキング

パーソナルアシスタント

AIパーソナルアシスタントウェブサイトの総訪問数ランキング

キャラクター生成

AIキャラクター生成ウェブサイトの総訪問数ランキング

ビデオ生成

AIビデオ生成ウェブサイトの総訪問数ランキング

人気のあるオープンソースデータランキング

AIプロジェクトランキング

GitHubの人気のあるAIプロジェクトを総スター数でランキング

AIプロジェクト成長ランキング

GitHubの人気のあるAIプロジェクトを成長率でランキング

AI開発者ランキング

GitHubの人気のあるAI開発者ランキング

AI組織ランキング

GitHubの人気のあるAI組織ランキング

人気のあるオープンソースカテゴリ

Deepseek

GitHubの人気のあるDeepseekオープンソースプロジェクト

TTS

GitHubの人気のあるTTSオープンソースプロジェクト

LLM

GitHubの人気のあるLLMオープンソースプロジェクト

ChatGPT

GitHubの人気のあるChatGPTオープンソースプロジェクト

AIオープンソースプロジェクトライブラリ

概要

GitHubの人気のあるAIオープンソースプロジェクトの概要

プロダクトライブラリツールナビゲーション

InternVL2_5-4B-MPO-AWQ

画像とテキストの相互作用能力を最適化した多様なモダリティを持つ大規模言語モデル

一般製品画像多様なモダリティ大規模言語モデル

ウェブサイトを開く

InternVL2_5-4B-MPO-AWQは、画像とテキストの相互作用タスクにおけるモデルのパフォーマンス向上に焦点を当てた、多様なモダリティを持つ大規模言語モデル（MLLM）です。InternVL2.5シリーズをベースとし、混合嗜好最適化（MPO）によって性能がさらに向上しています。単一画像や複数画像、動画データなど、多様な入力に対応可能であり、画像とテキストの相互理解が必要な複雑なタスクに適しています。InternVL2_5-4B-MPO-AWQはその優れた多様なモダリティ能力により、画像とテキストからテキストを生成するタスクに強力なソリューションを提供します。

InternVL2_5-4B-MPO-AWQ

ウェブサイトを開く

InternVL2_5-4B-MPO-AWQ 最新のトラフィック状況

月間総訪問数

25296546

直帰率

43.31%

平均ページ/訪問

5.8

平均訪問時間

00:04:45

InternVL2_5-4B-MPO-AWQ 訪問数の傾向

InternVL2_5-4B-MPO-AWQ 訪問地理的分布

InternVL2_5-4B-MPO-AWQ トラフィックソース

InternVL2_5-4B-MPO-AWQ 代替品

InternVL2_5-4B-MPO-AWQ — 画像とテキストの相互作用能力を最適化した多様なモダリティを持つ大規模言語モデル

•多様なモダリティ•大規模言語モデル

InternVL2_5-26B-MPO — 視覚と言語のインタラクション能力を向上させた、多様なモダリティに対応する大規模言語モデルです。

•多様なモダリティ•大規模言語モデル

InternVL2_5-8B-MPO-AWQ — 視覚と言語の相互作用能力を向上させた多様なモダリティに対応する大規模言語モデル

•多様なモダリティ•大規模言語モデル

InternVL2-8B-MPO — 多様なモダリティに対応する大規模言語モデルで、多様なモダリティ推論能力を向上させます。

•多様なモダリティ•大規模言語モデル

ZeroSearch — 実際の検索なしで LLM の検索能力を促進するフレームワーク。

•強化学習•検索能力

NoteLLM — ノートの生成と推薦を行う検索可能な大規模言語モデル。

•大規模言語モデル•マルチモーダル処理

WeClone — 微信のチャットログを使用して大規模言語モデルを微調整し、高品質の音声クローンを実現します。

•デジタルクローン•音声クローン

Dream 7B — Dream 7Bは、最も強力なオープンソースの大規模言語モデルです。

•拡散モデル•大規模言語モデル

Argo — 自分自身の大規模モデルを簡単に構築し、専用の知恵をローカルで実現します。

中国セレクション

•大規模言語モデル•ローカル展開

NotaGen — NotaGen は、大規模言語モデルのトレーニングパラダイムを採用し、高品質のクラシック音楽楽譜の生成に特化した、記号音楽生成モデルです。

•音楽生成•大規模言語モデル

AoT — Atom of Thoughts (AoT)は大規模言語モデルの推論性能を向上させるためのフレームワークです。

プログラミング

•大規模言語モデル•推論フレームワーク

語析Yuxi-Know — 大規模言語モデルRAGナレッジベースに基づく知識グラフQ&Aシステムで、複数の主要な言語モデルへの対応とローカル展開をサポートしています。

•知識グラフ•大規模言語モデル

Level-Navi Agent-Search — Level-Navi Agentは、トレーニングなしで使用できるフレームワークであり、大規模言語モデルを使用して、深層クエリ理解と正確な検索を実行します。

プログラミング

•大規模言語モデル•ウェブ検索

M2RAG — マルチモーダルコンテキストにおける検索強化生成のためのベンチマークテストコードリポジトリです。

プログラミング

•マルチモーダル•検索強化生成

SWE-RL — 強化学習により、オープンソースソフトウェアの進化における大規模言語モデルの推論能力を向上させます。

プログラミング

•強化学習•大規模言語モデル

TableGPT2-7B — TableGPT2-7Bは、表データ処理に特化した大規模言語モデルであり、データ分析やビジネスインテリジェンスのタスクに最適です。

•表データ•データ分析

Coding-Tutor — 大規模言語モデルをプログラミング指導ツールとして活用する可能性を探求し、Trace-and-Verifyワークフローを提案します。

•プログラミング教育•大規模言語モデル

百宝箱Tbox

百宝箱Tbox — アリペイの生活シーンに基づき、最先端の大規模言語モデル技術を活用して、企業が専門的なインテリジェントエージェントを迅速に構築できるように支援します。

中国セレクション

•大規模言語モデル•インテリジェントエージェント

MoBA — MoBAは、長文コンテキストに対応した混合ブロックアテンション機構であり、大規模言語モデルの効率化を目的としています。

•大規模言語モデル•アテンション機構

Goedel-Prover — Goedel-Proverは、数学問題の形式化証明に特化したオープンソースの自動定理証明モデルです。

プログラミング

•自動定理証明•数学

OmniParser-v2.0 — OmniParserは、UIスクリーンショットを構造化されたフォーマットに変換し、LLMベースのUIエージェントのパフォーマンスを向上させる汎用スクリーン解析ツールです。

•スクリーン解析•画像認識

DMXAPI — DMXAPIは、300種類以上の大規模言語モデル（LLM）APIを統合するグローバルなプラットフォームです。

中国セレクション

•大規模言語モデル•API

Mistral-Small-24B-Instruct-2501 — Mistral Small 24Bは、多言語に対応した高性能な命令微調整大型言語モデルであり、幅広い用途に使用できます。

•大規模言語モデル•多言語対応

MNN大規模言語モデル Androidアプリ — 多様なモダリティに対応した、フル機能の巨大言語モデルAndroidアプリです。

•大規模言語モデル•マルチモーダル

Janus-Pro-1B — Janus-Pro-1Bは、統一的な多様なモダリティを理解し生成する自己回帰フレームワークです。

•多様なモダリティ•画像生成

人類最後の試験 (Humanity's Last Exam) — 人類最後の試験 (Humanity's Last Exam) は、大規模言語モデルの能力を測るための多様なモダリティを含むベンチマークテストです。

•人工知能•ベンチマークテスト

Baichuan-M1-14B — 百川智能が開発した、医療現場向けに最適化されたオープンソースの大規模言語モデルです。優れた汎用性と医療分野での高い性能を備えています。

•大規模言語モデル•医療

Doubao-1.5-pro — Doubao-1.5-proは、推論性能とモデル能力の究極的なバランスに重点を置いた、高性能なスパースMoE（Mixture of Experts）大規模言語モデルです。

中国セレクション

•大規模言語モデル•マルチモーダル

DeepSeek-R1-Distill-Llama-70B — DeepSeek-R1-Distill-Llama-70Bは、強化学習によって最適化された大規模言語モデルであり、推論と対話能力に特化しています。

プログラミング

•大規模言語モデル•強化学習

PaSa — PaSaは、大規模言語モデルを駆使した高度な学術論文検索エージェントであり、自律的に意思決定を行い、正確な結果を取得します。

•学術検索•大規模言語モデル