説明はありません
3月6日、北京智源人工知能研究院は、マルチモーダルベクトルモデルBGE-VLをオープンソース化すると発表しました。この成果は、マルチモーダル検索分野における新たなブレークスルーを意味します。BGE-VLモデルは、画像テキスト検索、複合画像検索などのマルチモーダル検索タスクにおいて最良の結果を達成し、マルチモーダル検索のパフォーマンスを大幅に向上させました。
智源研究院は最近、ベクトル検索タスクにおいて優れた性能を示し、複数の評価基準で最高水準を更新した3つの新しいベクトルモデルを発表しました。これら3つのモデルは次のとおりです。BGE-EN-ICL:タスク関連のクエリとドキュメントの例を少量の例として導入することにより、モデルのセマンティック表現能力を強化した英語ベクトルモデル。
ekacare
Parrotlet-eは、高度な多言語医学埋め込みモデルで、インドの諸言語における医学用語に特化して最適化されています。これはBAAI/bge-m3をベースに微調整され、1800万対以上の多言語医学用語ペアで訓練され、12種類のインド語と英語をサポートし、臨床文書中の略語、スペルバリエーション、口語表現に対して強いロバスト性を持っています。
bortunac
このモデルはBAAI/bge-reranker-v2-m3のGGUF量子化バージョンで、Q4_K_M量子化方法を使用しています。これは多言語の再並べ替えモデルで、主にテキスト検索の結果の再並べ替えタスクに使用され、検索結果の関連性を向上させることができます。
MagicalAlchemist
BGE-M3はBAAIによって開発された多機能テキスト埋め込みモデルで、多言語、多粒度、多機能のテキスト表現学習をサポートし、稠密検索、疎検索、多ベクトル検索などの複数の検索モードを同時に処理することができます。
OpenMed
OpenMed-NER-ChemicalDetect-MultiMed-568Mは、化学実体識別に特化した生物医学NLPモデルで、生物医学文献中の化学化合物や物質を高精度に識別することができます。このモデルはbge - m3アーキテクチャに基づいており、BC4CHEMDデータセットで訓練され、F1スコアが0.9459に達し、生物医学研究や臨床応用に有力な支援を提供します。
これはがん遺伝学に特化した専門的な命名実体認識モデルで、bge - m3アーキテクチャに基づいて構築され、5.68億のパラメータを持っています。このモデルはBIONLP2013_CGデータセットで訓練され、がんに関連する遺伝的実体を正確に認識でき、がん研究や臨床応用に強力なサポートを提供します。
OpenMed-NER-ProteinDetect-MultiMed-568Mは、生物医学エンティティ認識用に特別に開発された高度なモデルで、bge - m3アーキテクチャに基づいており、568Mのパラメータを持っています。このモデルはFSUデータセットで訓練され、タンパク質、タンパク質複合体、タンパク質ファミリーなどのさまざまな生物医学エンティティを正確に認識でき、臨床および研究のアプリケーションで非常に高い実用価値があります。
nmixx-fin
bge - m3に基づくSentenceTransformerモデルで、韓国語金融テキストに対して微調整され、多言語処理をサポートし、金融分野の意味的類似度タスクを最適化しています。
BAAI
BGE-Code-v1はLLMベースのコード埋め込みモデルで、コード検索、テキスト検索、多言語検索をサポートし、コード検索とテキスト検索タスクで優れた性能を発揮します。
foochun
これはBAAI/bge-reranker-baseからファインチューニングされたクロスエンコーダーモデルで、テキストペアのスコアリングに使用され、テキスト再ランキングやセマンティック検索タスクに適しています。
HyperBlaze
BGE-M3は北京智源人工知能研究院によって開発された多言語テキスト埋め込みモデルで、100種類以上の言語の密集検索、多ベクトル検索、疎検索の3種類の検索方式をサポートしています。このモデルはMTEBベンチマークテストで優れた成績を収め、多言語テキストの類似度計算と検索タスクを効果的に処理することができます。
shuyuej
これはBAAI/bge-multilingual-gemma2モデルの4ビットGPTQ量子化バージョンで、多言語テキスト埋め込みタスクをサポートします。
datasocietyco
これはBAAI/bge-base-en-v1.5から微調整されたsentence-transformersモデルで、文や段落を768次元の密ベクトル空間にマッピングできます。
mradermacher
これはBAAI/bge-large-zh-v1.5モデルの重み/行列量子化バージョンで、さまざまな量子化オプションを提供し、さまざまなニーズのシナリオに適しています。
BAAI/bge-large-zh-v1.5は中国語文変換モデルで、主に特徴抽出と文類似度計算に使用されます。
sabafallah
BAAI/bge-reranker-baseモデルを変換したGGUF形式のリランキングモデルで、中国語と英語のテキストランキングタスクをサポート
pyarn
このモデルはggml.aiのGGUF-my-repoスペースで、llama.cppを使用してBAAI/bge-reranker-v2-m3から変換されたGGUF形式のモデルで、主にテキスト分類タスクに使用されます。
yuriyvnv
BGE - m3は、法律アプリケーション用に特別にカスタマイズされた特定分野のテキスト埋め込みモデルで、法律文書、文章、クエリを密集ベクトル表現に変換し、法律言語の微妙な意味関係を正確に捉えることができます。
このモデルはBAAI/bge-reranker-v2-m3を変換したGGUF形式モデルで、テキストソートタスクに使用され、多言語をサポートします。
AITeamVN
BGE-M3をファインチューニングしたベトナム語埋め込みモデル、ベトナム語検索能力を強化
iris49
これはBAAI/bge-base-en-v1.5をファインチューニングした文変換モデルで、3GPP関連技術文書のQ&Aシステム向けに最適化されており、テキストを768次元ベクトル空間にマッピングできます。
MementoはSQLiteベースの知識グラフ記憶システムで、永続的な記憶機能を提供し、全文検索と意味検索をサポートし、BGE - M3埋め込みによるスマートなコンテキスト検索を実現し、技術的なクリエイティブプロジェクト管理に適しています。