DragNUWAは、拡散アルゴリズムに基づく動画生成モデルであり、動画生成における精密な制御の問題解決を目指しています。このモデルは、テキスト、画像、軌跡情報を取り込み、意味、空間、時間という観点から精密な制御を提供します。実験により、DragNUWAモデルは動画生成の精密制御において優れた性能を示すことが証明されました。
関連AIニュースの推奨

UGMathBenchダイナミックなベンチマークデータセットがリリース 言語モデルの数学的な推論能力を評価可能
このたび、ModelScopeコミュニティは、大学レベルの数学における幅広い科目での言語モデルの数学的な推論能力を評価することを目的としたUGMathBenchという動的なベンチマークデータセットのリリースを発表しました。このデータセットの登場により、現在まで大学レベルの数学分野における言語モデルの推論能力を評価する上で存在していた空白が埋められ、研究者たちにさらに豊かで挑戦的なテストプラットフォームが提供されることになります。

Vidu Q1シリーズAPIが正式に公開され、同時に音声生成モデルも上线されました
今回公開されたVidu Q1シリーズのモデルは、ビデオ生成能力で大幅なアップグレードを実現しました。画像からビデオへの変換では、ユーザーが提供した画像に基づいて、関連性があるかつ創造的なビデオコンテンツを迅速に生成し、画像にダイナミックな生命を吹き込みます。また、初めと終わりのフレーム機能により、ユーザーはビデオの開始と終了の画を正確にコントロールでき、ビデオをより意図通りに表現することができます。

AIデイリーニュース: ボタンスペースのテストがオープン化; Tencentがビデオ生成ツール「混元カスタム」をオープンソース; Alibabaが大規模言語モデル検索エンジン「ZeroSearch」をオープンソース
【AIデイリーニュース】へようこそ!ここでは、あなたが毎日 artificial intelligence の世界を探索するためのガイドです。当サービスでは、AI分野で起こっているホットなトピックを毎日お届けします。開発者の視点から技術トレンドや革新的なAI製品の応用についてお伝えします。新しいAI製品の詳細はこちら: https://top.aibase.com/1. インビテーションコード不要!ボタンスペースがテストをオープン化しました。ボタンスペース(Coze Space)はテスト期間に入り、ユーザーは招待コードを受け取ることなく利用できるようになりました。このプラットフォームは強力なAI協力機能を示しています。
バイトダンス、Top Seedプログラムを開始 2026年卒業予定の博士課程学生向けAI人材募集
バイトダンスは先日、2026年卒業予定の学生を対象とした「Top Seed」大規模言語モデル分野のトップ人材採用プログラムを正式に開始すると発表しました。約30名の優秀な博士課程学生を採用する予定です。このプログラムは、大規模言語モデル、機械学習アルゴリズムとシステム、マルチモーダル生成と理解、音声処理など、最先端の人工知能分野に焦点を当てています。バイトダンスは、この取り組みを通じて、大規模言語モデル研究分野で非常に高い潜在能力と情熱を持つ若き才能を惹きつけたいと考えています。これまでの採用計画とは異なり、今回の「Top Seed」では「専攻分野不問」を強調しています。

巨人ネットワーク『スペースキル』にテンセントAI技術導入、700万人を超えるAIプレイヤー生成
R1とV3-0324を融合!DeepSeek R1T ChimeraがOpenRouterプラットフォームに登場

無料!DeepSeek R1T ChimeraがOpenRouterプラットフォームで正式リリース
TNG Technology Consultingが開発したDeepSeek R1T ChimeraモデルがOpenRouterプラットフォームで正式リリースされ、世界中の開発者に効率的で強力な推論能力を提供します。この新しいオープンソースモデルは、DeepSeek R1の優れた推論能力とV3-0324の高効率性能を組み合わせたもので、オープンソースAI技術における性能と効率のバランスにおける新たな大きなブレークスルーを意味します。以下は、AIbaseがまとめたものです。

古爾マン氏:アップルスマートグラスは依然遠い未来、メタは2025年ハイエンドモデル目指す
ブルームバーグの著名記者マーク・ガーマン氏によると、アップル社のスマートグラスプロジェクト(N50)は依然として初期開発段階にあり、完成には程遠いとのことです。アップルは小型で革新的なデバイス開発で実績がありますが、スマートグラスの開発は比較的遅れているようです。ガーマン氏は、N50グラスは「アップルインテリジェンス」を活用し、周囲の環境を分析して情報を着用者にフィードバックすることを目指しているものの、完全な拡張現実(AR)機能は提供しないと書いています。

Meng ToがAI駆動型HTML to Designツールを発表、ウェブデザインワークフローに革命
