Soraが話題沸騰、謝賽寧氏ら専門家が30億パラメーター規模の技術を分析

量子位
この記事はAIbaseデイリーからのものです
【AIデイリー】へようこそ!ここは、毎日人工知能の世界を探求するためのガイドです。毎日、開発者に焦点を当て、技術トレンドを洞察し、革新的なAI製品アプリケーションを理解するのに役立つ、AI分野のホットなコンテンツをお届けします。
【AIデイリー】へようこそ!ここは、毎日人工知能の世界を探求するためのガイドです。毎日、開発者に焦点を当て、技術トレンドを洞察し、革新的なAI製品アプリケーションを理解するのに役立つ、AI分野のホットなコンテンツをお届けします。
AIツールを使った有名人のイメージ動画作成と収益化方法を解説。企画から脚本作成、HeyGen等での動画生成、編集を経てSNSに投稿。広告収入や知識販売で収益化可能。肖像権に注意し、AI生成と明記が必須。編集スキルとSNS運用経験のある人向け。....
OpenAIは今夏GPT-5を発表予定で、既存モデルの機能を統合。新しいバージョンは「Oシリーズ」の推論能力とGPTシリーズのマルチモーダル強みを融合し、性能を大幅に向上。ユーザー体験を改善するため、モデル切り替えの課題を解決。GPT-5はより強力で使いやすくなるとのことだが、具体的なリリース日は未定。....
OpenAIが研究者向けリサーチレジデントプログラムを開始。21万ドルの年俸で物理・神経科学等の異分野人材を募集。6ヶ月のトレーニング後正規雇用の道も。年間約30名を採用し、文化適性を重視した独自の人材育成戦略を展開。....
B站は動画ポッドキャスト事業に注力し、AI創作ツール「コードネームH」を発表。音声自動動画化をサポートし、6分で千文字を動画に変換可能。将来的には3分まで短縮予定。現在のテスト評価は良好。支援策として、トラフィック支援、無料収録場所、AIツール提供を実施。....
GoogleのオープンソースCLIツールGemini CLIが大幅更新。音声/動画処理、Markdown機能強化、プライバシー保護を追加。51名の貢献者による85改善、VSCodium/Neovim連携、Ink6/React19へアップデート。Apache2.0ライセンスで百万トークン無料提供、端末AI操作を革新。今後はオフラインモデル対応を検討。....
B站は動画ポッドキャスト分野に注力し、AIツール「コードH」と支援策を発表。音声/テキストクリエイター向け支援計画を開始。2025年Q1の動画ポッドキャスト利用時間は259億分(+270%)、AIツールは6分で動画生成可能に。....
B站のAniSora V3はアニメ生成モデルを大幅に強化。動画品質と滑らかさが向上し、複数のスタイルに対応。新たにHuawei NPUをサポートし、生成速度20%向上。1000万の高品質データを追加し、キャラクター一貫性と動きの滑らかさで業界トップレベルを達成。....
【AIニュース】へようこそ!ここは毎日人工知能世界を探求するためのガイドです。毎日、AI分野のホットトピックをお届けし、開発者に焦点を当て、技術トレンドを理解し、革新的なAI製品の応用を学びます。新鮮なAI製品についてはこちらから:https://top.aibase.com/1、テンセント・ヤオファンの再アップグレード:1文で検索、画像や動画を即座に表示、情報取得がより直感的になります。テンセント・ヤオファンのアップグレード機能により、情報取得がさらに直感的かつ効率的になり、ユーザーは1文で質問するだけで図形とテキストを取得できます。
グーグルは、世界中で最新の動画生成モデルVeo3を正式に展開することを発表しました。今回の発表は多くのユーザーから長期間待たれていたもので、Veo3はすでに159カ国以上のGeminiユーザーに公開されており、新たな動画制作体験を提供しています。Veo3動画生成モデルの特徴は、シンプルなテキストのヒントを使用して最大8秒間の動画を生成できることです。グーグルによると、この技術は創造性を追求するユーザー向けに設計されており、特にSNSで短い動画コンテンツのニーズが増加しているユーザーにとって適しています。
最近、世界最大の変圧器メーカーである日立エナジーの最高経営責任者アンドレアス・シュライレンベック氏は、フィナンシャル・タイムズの取材に対して、大手テクノロジー企業が人工知能モデルをトレーニングする際の電力需要の急増に伴い、政府がその変動を制限する対策を講じる必要があると指摘した。画像の出典コメント:画像はAIによって生成され、画像ライセンス提供元はMidjourney。シュライレンベック氏は、AIデータセンターの電力需要の変動が非常に激しいと述べた。