8月25日、阿里ババクラウドは、大規模視覚言語モデル「Qwen-VL」を発表しました。これは、中国語と英語など複数の言語に対応し、テキストと画像を統合的に理解できるモデルです。Qwen-VLは、阿里ババクラウドが以前オープンソース化した汎用言語モデル「Qwen-7B」をベースとしており、他の視覚言語モデルと比較して、視覚的な位置特定や画像内の中国語の理解などの機能が追加されています。Qwen-VLはGitHubで3400以上のスターを獲得し、ダウンロード数は40万回を超えています。視覚言語モデルは、汎用AIの重要な進化方向と見なされています。業界では、多様な入力に対応できるモデルは、世界に対する理解能力を高め、利用シーンを拡大すると考えられています。阿里ババクラウドは、Qwen-VLをオープンソース化することで、汎用AI技術の進歩をさらに促進します。
関連AIニュースの推奨

シリコンベースのフローアクセスプラットフォームにアリババのQwen3-VLモデルが正式リリースされ、視覚認識能力が大幅に向上
シリコンベースのフローアクセスプラットフォームにアリババのQwen3-VLオープンソースモデルがリリースされました。このモデルは視覚的理解、時系列分析、マルチモーダル推論において顕著な進歩を遂げています。画像のぼけや動画の複雑さなどの課題に対処することができ、視覚認識能力を向上させ、32言語のOCR機能をサポートし、弱い視覚情報の正確な処理が可能となり、ユーザーが複雑な視覚タスクを簡単に処理できるようにします。

拡散モデルの新進展:Radical Numericsが30BパラメータのRND1 AIをオープンソース化、自己進化への重要な一歩を遂げる
Radical Numericsは30Bパラメータのオープンソース拡散言語モデルRND1-Baseをリリースし、スパースエキスパート混合アーキテクチャを採用しており、3Bパラメータのみがアクティブ化されている。このモデルは並列生成の利点を持ち、ベンチマークテストでのパフォーマンスが優れている。また、完全な重みとトレーニングプロセスを公開し、拡散モデル技術の発展を推進している。
最新版国内直結Sora2 ノーマークで無料で使用する方法
OpenAIがSora2をリリースし、5日間でダウンロード数が100万を超えた。App Storeの無料ランキングで首位を獲得し、成長率はGPTを上回っている。前バージョンと比べて、文書理解能力が顕著に向上し、簡単なキーワードから音声と画像が同期した完全な動画を自動生成できる。手動での吹き替えやBGMの追加は必要ない。ショートビデオ、広告、短編ドラマ、MVおよびアニメ制作に適用可能である。

マレーシアにAIの新時代が到来、ChatGPT Goがデジタルトランスフォーメーションを支援
OpenAIはマレーシアでChatGPT Goのサブスクリプションサービスを提供し、月額は約9.25ドルであり、AIの利用ハードルを大幅に低下させます。このサービスにはGPT-5モデルや画像生成、ファイルアップロード、記憶機能などの豊富な機能が含まれており、ユーザー体験を向上させます。この取り組みは、當地で急速に増加する中堅層ユーザーおよび学生層を引きつけることを目的としています。

最初の自己回帰モデルを上回る!アリババグループが業界初の高性能拡散言語モデル推論フレームワークdInferをオープンソース化
10月13日、アリグループが高性能拡散言語モデル推論フレームワークdInferをオープンソース化。NVIDIA Fast-dLLMより10.7倍高速で、HumanEvalタスクでは1011Tokens/秒を達成。拡散モデルが自己回帰モデルを初めて上回った。....

Perplexity CEO、PPTから離れAIを活用した投資家向けプレゼンテーションの新しい形を発表
AI検索ツールPerplexityのCEOであるスリニヴァサは、伝統的なPPTでの資金調達プレゼンをやめ、AIを活用して投資家向けのプレゼンテーションを行っていると語った。彼はAラウンドの資金調達で一度だけスライドを作成し、以降はAI技術によりプロセスを簡素化しており、これは人工知能がビジネス活動に与える革新の影響を示している。(140文字)

オープンAIとマイクロソフトが重要な取引を発表:株式構造が再変化し、投資家は希薄化リスクに直面
オープンAIの最近の取引により株式構造が複雑化し、投資家はリターンへの懸念を抱えています。企業の評価額は5000億ドルに達し、世界で最も価値のある非上場企業となっています。主な要因はNVIDIAやAMDとの数十億ドル規模のチップ契約であり、資金は1京ドル規模の計算力展開目標に向けて使用される予定です。

Claude Codeに新機能プラグインシステムをリリースし、開発効率を向上
AnthropicはClaude Codeのプラグインシステムをリリースし、現在公開ベータテストを開始しました。このシステムでは、VS Codeのように開発者がカスタマイズ可能なツールをサポートし、4つのコアコンポーネントにより効率を向上させ、スラッシュコマンドにより一般的な操作を迅速に実行でき、作業プロセスを簡略化します。

マッシュルカーリンクがAIの商業化を加速し、元ディップ上級副社長のフー・キアンがCEOに就任
マッシュルカーリンクは、元ディップの上級副社長であるフー・キアンを新たにCEOに任命し、AIビジネス戦略の実施と商業化を全面的に担当する。フー・キアンは10年以上のスマートモビリティ経験を持ち、ディップで複数の重要な役職を務め、満邦グループのChief Operating Officerを務めた経験がある。

AIデイリーニュース:LiblibAI 2.0が正式リリース;通義千問、豆包で記憶機能が開始;SoraがGoogle Playに登場
LiblibAI 2.0が正式リリース。複数のトップモデルを内蔵し、期間限定で無料計算リソースを提供。単一ツールから創作エコシステムへ進化し、開発者向けに専門的なAI創作体験を提供。....