ByteDanceと大学が共同でSa2VAモデルを開発。LLaVAの視覚言語理解とSAM-2の精密分割を統合し、動画内容の解析と対象の追跡・分割を実現。....
ByteDanceのAIアシスタントCiciが海外で好調、メキシコGoogleストアで1位、英国Appleストアでトップ10入り。豆包と同時展開の二重ブランド戦略で、開発元はByteDanceと確認。....
ByteDanceがUSOモデルを発表、AI画像生成におけるスタイルとテーマの矛盾を解決。データ駆動でスタイルの類似性とテーマの一貫性を両立させ、業界の進歩を促進。....
AI人材争奪戦が激化。MiniMaxとByteDanceが大規模なストックオプション制度を導入。MiniMaxはコア人材に数十万~数百万ドル規模のインセンティブを提供し、パートナーシップを構築。ByteDanceは大モデル技術チームを重点的に優遇し、業界の競争激化を反映。....
lmstudio-community
Seed - OSS - 36B - InstructはByteDance - Seedによって開発された大規模言語モデルで、パラメータ数は360億に達し、Apache 2.0オープンソースライセンスを採用しています。このモデルはtransformersライブラリに基づいて構築され、vllmとmlx技術の最適化をサポートし、特にApple Siliconチップに対して8ビット量子化処理を行い、効率的なテキスト生成能力を提供します。
DevQuasar
これはByteDance-Seed/cudaLLM-8Bの量子化バージョンで、モデル圧縮技術を通じて大規模言語モデルをより簡単にデプロイし使用できるようにし、「知識を誰もが利用できるようにする」という理念を実現します。
bartowski
これはByteDance-SeedのSeed-OSS-36B-Instructモデルの量子化バージョンで、llama.cppツールを通じて様々な精度の量子化処理を行い、BF16からIQ2_XXSまで20種類以上の量子化オプションを提供し、さまざまなハードウェアでのモデルの実行効率と性能を向上させることを目的としています。
RDson
Seed OSS 36B Instructは、ByteDanceによって開発された大規模言語モデルで、360億のパラメータを持ち、命令追従タスクに特化して最適化されています。llama.cppフレームワークに基づいて構築され、効率的なテキスト生成能力をサポートします。
yarikdevcom
Seed-OSS-36B-InstructはByteDanceによって開発された360億パラメータの大規模言語モデルで、Apache-2.0ライセンスに基づいてオープンソース化されています。このモデルは、指令追従タスクに特化して最適化されており、テキスト生成と対話機能をサポートし、強力な理解と生成能力を持っています。
dnakov
Seed-OSS-36B-InstructはByteDanceによって開発された大規模言語モデルで、パラメータ数は360億に達し、テキスト生成タスクに特化しています。このモデルはMLXフレームワークに基づいて実装され、英語と中国語の両方をサポートし、強力な指令追従とテキスト生成能力を備えています。
ByteDance-Seed
Seed-OSSは、バイトダンスのSeedチームによって開発されたオープンソースの大規模言語モデルシリーズで、強力な長文脈処理、推論、エージェントインタラクション能力および汎用性能を備えています。このモデルは、わずか12Tトークンで訓練され、複数の公開ベンチマークテストで優れた成績を収めています。
prithivMLmods
cudaLLM-8BはByteDance Seedによって開発された専門の言語モデルで、高性能かつ構文が正しいCUDAカーネルコードを生成するために特別に設計されています。Qwen3-8B基礎モデルをベースに構築され、監督微調整と強化学習の2段階のトレーニングを通じて、開発者が効率的なGPU並列プログラミングコードを記述するのを支援することができます。
Seed-X-RM-7BはSeed-Xシリーズの報酬モデルで、翻訳品質の評価に特化しています。このモデルは70億パラメータのMistralアーキテクチャに基づいており、多言語翻訳に報酬スコアを割り当てることができ、25種類の言語間の翻訳品質評価をサポートしています。
Seed-X-Instruct-7Bは強力なオープンソースの多言語翻訳言語モデルで、70億パラメータの範囲内で翻訳能力の限界を突破し、卓越した翻訳性能、軽量なアーキテクチャ、および幅広い分野のカバーを備え、翻訳研究とアプリケーションに強力なサポートを提供します。
ByteDance
XVerseは多主体画像合成に用いる革新的な方法で、全体画像の潜在的な特徴を損なうことなく、単一主体を正確かつ独立に制御することができます。
yujiepan
ByteDance-Seed/UI-TARS-1.5-7Bモデルに基づく量子化バージョンで、GPTQ技術を用いて4ビットの重み量子化と16ビットの活性化量子化を行い、画像テキストからテキストへの変換機能を実現し、効率的な推論性能を持ちます。
ContentVは高効率なビデオ生成モデルフレームワークで、極簡アーキテクチャ、多段階トレーニング戦略、経済的で効率的な強化学習フレームワークを通じて、限られた計算リソースで高品質なビデオ生成を実現します。
QuantStack
これはbytedance-research/PhantomモデルのGGUF直接変換バージョンで、ComfyUIでComfyUI-GGUFカスタムノードと組み合わせて使用できます。
これはbytedance-research/Phantomを直接GGUF形式に変換したプロジェクトで、画像から動画への変換タスクに使用されます。
bytedance-research
ATIは軌跡に基づく運動制御フレームワークで、動画生成における物体、局所、カメラ運動を統一します。
このプロジェクトでは、academic - ds - 9Bの量子化バージョンを提供し、知識を誰もが利用できるようにすることを目指しています。
Gapeleon
BAGELはオープンソースの7Bアクティブパラメータマルチモーダル基盤モデルで、マルチモーダル理解と生成タスクをサポートします
ドルフィンは革新的なマルチモーダルドキュメント画像解析モデルで、'分析してから解析する'というパラダイムを用いて複雑なドキュメント要素を処理します。
BAGELはオープンソースの、70億の活性化パラメータを持つマルチモーダル基盤モデルで、大規模なインターレースマルチモーダルデータで訓練され、理解と生成タスクで優れた性能を発揮します。