【AI日報】へようこそ!ここは、あなたの人工知能の世界を探求するための毎日のガイドです。毎日、AI分野のホットなコンテンツを提供し、開発者に焦点を当て、技術トレンドの洞察と革新的なAI製品の応用に関する情報を提供します。

最新のAI製品詳細はこちら:https://top.aibase.com/

1.Luma AIがRay2動画生成モデルを発表、より速く自然な動きを実現

Luma AIは最近、Ray2動画生成モデルを発表し、AI動画制作分野における重要な進歩を示しました。Ray2は大量の計算によるトレーニングを経て、動画生成の速度と自然度が向上し、ユーザーは簡単なテキストの説明で短編動画を生成できます。複雑な指示では歪みが発生する可能性がありますが、全体的なフィードバックは肯定的です。この発表を祝うため、Luma Labsはコンテストを開催し、クリエイターの参加を促し、賞金を獲得する機会を提供しています。

【AiBase要約:】

🌟 Ray2動画生成モデルが発表され、動画制作の効率と自然度が向上。

🎥 テキストから動画への高速生成に対応し、ユーザーは簡単に短編動画を作成可能。

💰 Ray2コンテストを開催、クリエイターは最大7000ドルの賞金を獲得するチャンス。

詳細リンク:https://lumalabs.ai/ray

2.マスク氏率いるxAI、Grokウェブ版をリリース Xアカウント不要で体験可能

先日、イーロン・マスク氏率いるxAI社が、Grok AIチャットボットのウェブ版をリリースしました。ユーザーはX.comにアクセスしたり、Xアカウントを所有したりすることなく、その強力な機能を体験できます。ブラウザでgrok.comにアクセスし、生年月日を入力するだけで、このスマートチャットボットをすぐに利用できます。Grok AIは、リアルタイムで情報を収集し、質問に答えるだけでなく、画像生成機能も備えており、便利なユーザーエクスペリエンスを提供します。

【AiBase要約:】

🌐 Grok AIウェブ版がリリースされ、Xアカウントなしでも利用可能。

🤖 生年月日を入力するだけで、スマートチャット機能を体験可能。

🔒 一時的なモードでユーザーのプライバシーを保護、チャット内容は記録されません。

3.智譜AI、米国で初めてエンティティリストに掲載される中国の大規模モデル企業 影響なしと回答

智譜AIが米国商務省から輸出規制のエンティティリストに掲載され、制裁を受けた最初の中国の大規模モデル企業となりました。制裁を受けているにもかかわらず、智譜AIは、その技術が清華大学に由来しており、制裁が運営に実質的な影響を与えないと強調しています。智譜AIは大規模モデル技術分野で継続的にイノベーションを起こしており、強力な市場前景と技術力を示しています。

【AiBase要約:】

📉 智譜AIが米国で初めてエンティティリストに掲載された中国の大規模モデル企業となり、中国AI産業に対する新たな圧力の兆候。

🔧 同社は清華大学に由来する技術を有し、フルスタックの大規模モデルコア技術を保有しており、制裁は通常の運営に影響を与えないと主張。

📱 智譜AIはアップルと提携交渉中で、その技術力と市場前景を示している。

4.階躍星辰、自社開発推論モデルStep Reasoner miniをリリース

上海階躍星辰智能科技有限公司は、自社開発の推論モデルStep Reasoner mini(Step R-mini)を発表しました。このモデルは、その超長推論能力により、論理推論、コード、数学などの分野で優れた性能を発揮します。Step R-miniは大規模な強化学習トレーニングを通じて、文理両方の能力を兼ね備え、複雑な問題解決とコンテンツ作成における卓越した性能を示しています。

微信截图_20250116133149.png

【AiBase要約:】

🧠 Step R-miniは初の推論モデルであり、能動的な計画と反省に長け、正確で信頼性の高い回答を提供。

📊 数学と論理推論タスクにおいて、Step R-miniは優れた問題解決能力を示し、複雑な問題に対処し、複数の解法を提供可能。

🎨 このモデルはコンテンツ作成においてユーザーのニーズを深く理解し、革新的な表現スタイルを備え、感情豊かな文学作品を生成可能。

詳細リンク:https://yuewen.cn

5.アリババQwenチーム、新型プロセス報酬モデルを発表、数学的推論が進化

アリババQwenチームが最近発表した論文では、数学的推論における新型プロセス報酬モデル(PRM)の応用について紹介し、Qwen2.5-Math-PRMシリーズモデルを発表しました。これにより、推論の正確性と汎化能力が大幅に向上しました。これらのモデルは、革新的なコンセンサスフィルタリングメカニズムとモンテカルロ推定を通じて、従来の方法における推論プロセスにおける欠点を解決し、特に教育や科学計算などの分野での応用が期待されています。

QQ20250116-104124.png

【AiBase要約:】

🔍 新モデルは既存のPRMフレームワークの制限を突破し、数学的推論の正確性と汎化能力を大幅に向上。

📊 コンセンサスフィルタリングメカニズムを採用し、データノイズを約60%削減し、トレーニングデータの質を向上。

🚀 Qwen2.5-Math-PRMシリーズは複数の評価指標で優れた性能を示し、特に段階的なエラー識別タスクでは多くの専用モデルを凌駕。

6.Kinetix、新しいAI動画技術を発表 キャラクターの動きを正確に制御

Kinetixは最近、革新的なAI動画技術を発表しました。これは、真人パフォーマンスとテキスト指示を組み合わせることで、デジタルキャラクターの動きを正確に制御できます。この技術の操作手順はシンプルで分かりやすく、専門的なアニメーション制作経験がなくても、ユーザーはすぐに高品質のアニメーションコンテンツを作成できます。強力な3Dアニメーションデータベースのサポートと合成データ生成パイプラインにより、Kinetixは制作時間を大幅に短縮し、コストも削減しました。

image.png

【AiBase要約:】

🤖 真人パフォーマンス動画とテキスト指示を組み合わせることで、KinetixのAI技術はデジタルキャラクターの動きを正確に制御。

💡 システムは様々な動きや表情の正確なキャプチャをサポートし、ユーザーは動きの速度、大きさ、リズムを調整して、キャラクターの表現効果を高めることが可能。

⏱️ 制作時間は従来の数週間から数時間に短縮され、制作コストが削減されるため、中小規模のチームや個人のクリエイターも簡単にプロフェッショナルなアニメーションを実現できる。

詳細リンク:https://www.kinetix.tech/character-motion-control-for-video-generation-models

7.線画着色の新技術MangaNinja:線画と参照画像を入力し、線画を正確に着色

MangaNinjaは革新的な線画着色技術であり、線画と参照画像を入力することで、高精度の着色効果を実現できます。この技術は拡散モデルに基づいており、パッチ再配置モジュールと点駆動制御方式を採用することで、着色の正確性と画像品質を大幅に向上させています。MangaNinjaは複雑なシーンの処理において優れた性能を発揮し、キャラクターのポーズの変化や色の混同などの問題を効果的に解決し、ユーザーにより多くの創作のインスピレーションと可能性を提供します。

image.png

【AiBase要約:】

🌟 MangaNinjaは参照画像に基づいた線画着色方法であり、正確なマッチングと精密な制御能力を備えています。

🎨 革新的なパッチ再配置モジュールと点駆動制御方式により、MangaNinjaは着色の正確性と画像品質を大幅に向上。

🖌️ この技術は、極端なポーズや複数の参照画像の調整など、多様な着色課題に対応し、高品質のインタラクティブな着色体験を実現。

詳細リンク:https://johanan528.github.io/MangaNinjia/

8.Microsoft AutoGen v0.4リリース:AIエージェントの柔軟性とクロスリンガリティが大幅に向上

Microsoftが最近リリースしたAutoGen v0.4では、AIエージェントの柔軟性と制御性が大幅に向上し、ユーザーが使用中に遭遇したアーキテクチャの制限と効率の低下の問題が解決されました。新バージョンで導入された非同期メッセージングメカニズムとクロスリンガルな相互運用性により、開発者はより簡単に複雑なエージェントネットワークを構築できます。

image.png

【AiBase要約:】

💡 AutoGen v0.4はAIエージェントの柔軟性を強化し、ユーザーからのフィードバックに基づいて問題を解決。

🌐 新バージョンは非同期メッセージングとクロスリンガルな相互運用性をサポートし、エージェント間の協調能力を向上。

🔧 AutoGen Studioのローコードインターフェースがアップグレードされ、ユーザーはより簡単にエージェントを設計および管理できるようになりました。

詳細リンク:https://www.microsoft.com/en-us/research/blog/autogen-v0-4-reimagining-the-foundation-of-agentic-ai-for-scale-extensibility-and-robustness/

9.腾讯会议が大幅にアップグレード、AIアシスタントProが登場

腾讯会議は最近、AIアシスタントProをリリースしました。これは、腾讯の混元数十億パラメーターの大規模モデルに基づいており、深い理解と迅速な対応能力を備えており、ユーザーに正確な会議サポートを提供できます。今回のアップグレードでは、組織の協調機能も最適化され、会議の効率が向上し、ユーザーは会議の通知や録画の共有をより簡単に管理できます。同時に、新たに導入された個人認証と企業認証機能により、会議の専門性とセキュリティも強化されました。

image.png

【AiBase要約:】

🤖 AIアシスタントProは、インターネット検索と複数のタスク処理をサポートし、会議の内容を深く理解し、正確な回答を提供。

📅 ユーザーは会議中に直接組織を作成し、参加者を迅速に追加して、会議の効率を向上。

🔒 新しい認証機能を追加し、会議のセキュリティと専門性を強化し、ユーザーエクスペリエンスを向上。

10.スタートアップ企業がAIエージェントを使ってRedditで大量の宣伝投稿を投稿、気づかれずに

最近、Astralというスタートアップ企業が、AI技術を使ってRedditに広告を投稿したことで注目を集めています。創設者のサヴァナ・フェダーは、この技術の迅速な応用能力を示し、ユーザーの議論と同様のコンテンツを生成することで、顧客の製品を販売しています。この手法は効率的であるだけでなく、気づかれずに広告情報を挿入することもでき、人々はインターネット空間の未来に対する懸念を抱いています。従来のインターネットは、終わりのない商業化とスパムに侵食される可能性があります。

image.png

【AiBase要約:】

💡 AstralはAI技術を利用して、Redditでユーザーと同様の広告投稿を迅速に生成。

📈 創設者はAIエージェントを設計し、Redditの制限を回避し、ユーザーサービスではなく商業的な宣伝に焦点を当てている。

🚨 この行為は、インターネットコンテンツの未来に対する懸念を引き起こし、ソーシャルメディアは広告とスパムで溢れる可能性がある。

11.智譜、GLM-4-Air、GLM-4V-Plusモデルを発表、Flash全モダリティ無料モデルを設立

智譜華章科技公司は、新しいモデルGLM-4-AirとGLM-4V-Plusを発表し、新しいエンドツーエンドモデルGLM-Realtimeを発表し、低遅延のビデオ理解と音声インタラクションを実現しました。同社は、高コストパフォーマンスの言語モデルソリューションを提供することに尽力しており、Flash全モダリティ無料モデルを設立し、多様なアプリケーションシナリオをサポートし、開発者のイノベーションを支援しています。

图片

【AiBase要約:】

🌟 GLM-Realtimeを発表、アカペラ機能と2分の記憶能力を備えています。

💡 GLM-4-Air-0111が全面的にアップグレードされ、アプリケーションの敷居が従来の50%に低下。

📈 Flash全モダリティ無料モデルシリーズは、マルチモーダルな理解と生成をサポート。

プロジェクト入口:bigmodel.cn

12.Vidu2.0正式リリース 10秒で短編動画を生成、主題の一貫性向上

Vidu動画大規模モデルが2.0バージョンを正式にリリースしました。短編動画の生成速度は30秒から10秒に短縮され、効率が3倍に向上しました。新バージョンでは動画の品質が最適化され、スタイルと主題の一貫性が確保され、冒頭と結びの移行が自然でスムーズになりました。Vidu2.0では超お得なプランも導入され、制作コストが削減され、一括生成と現地決済にも対応し、ユーザーの利便性がさらに向上しました。

QQ20250115-170654.jpg

【AiBase要約:】

🎥 Vidu2.0は短編動画の生成時間を30秒から10秒に短縮。

💡 新バージョンでは動画の品質と一貫性が全面的に最適化。

💰 超お得なプランと現地決済により、ユーザーの制作体験が向上。