8月25日、阿里ババクラウドは、大規模視覚言語モデル「Qwen-VL」を発表しました。これは、中国語と英語など複数の言語に対応し、テキストと画像を統合的に理解できるモデルです。Qwen-VLは、阿里ババクラウドが以前オープンソース化した汎用言語モデル「Qwen-7B」をベースとしており、他の視覚言語モデルと比較して、視覚的な位置特定や画像内の中国語の理解などの機能が追加されています。Qwen-VLはGitHubで3400以上のスターを獲得し、ダウンロード数は40万回を超えています。視覚言語モデルは、汎用AIの重要な進化方向と見なされています。業界では、多様な入力に対応できるモデルは、世界に対する理解能力を高め、利用シーンを拡大すると考えられています。阿里ババクラウドは、Qwen-VLをオープンソース化することで、汎用AI技術の進歩をさらに促進します。
関連AIニュースの推奨

SpaceXが大規模投資!xAIに20億ドルを出資
SpaceXがxAIに20億ドル投資予定。xAIの50億ドル資金調達計画の一部で、Grok連携を強化。マスク氏の企業間連携戦略。....

OpenAIは大規模なオープンソースモデルの公開を延期、セキュリティテストを重視
OpenAIはオープンソースの大規模モデルの公開を延期することを発表しました。CEOのSam Altman氏は、追加の時間が必要で、セキュリティテストをしっかり行う必要があると述べました。このモデルは当初今週に公開される予定でしたが、次の週に延期され、安全性と信頼性を確保するためです。Altman氏は、モデルが公開されれば取り消すことができず、慎重であることが重要だと強調しました。これはOpenAIが初めてダウンロード可能な自立型モデルを公開しようとする試みであり、研究者や中小企業に強力なツールを提供することを目的としています。延期には残念に思う人もいるかもしれませんが、コミュニティの多くはセキュリティテストの重要性を理解しており、AIエコシステムにおいて重要な意味を持つと考えています。

ゴールドマン・サックスがAI新入社員を導入し、スマート金融時代を開く
高盛がAIコーディングアシスタント「デヴィン」を導入、開発効率向上を図る。数百インスタンス展開予定で、将来的には数千に拡大も。CIOは人間開発者の補助ツールとして活用し、「ハイブリッド」チームによる生産性向上を目指すと表明。複雑タスク処理能力は限定的だが、バージョン2.1で大規模コード処理を最適化。金融科技革新の伝統継承しつつ、完全な人間代替はしない方針。....

テスラ Optimus ロボットが初出勤:サンタモニカテーマレストランが開店
ロサンゼルスにテスラ初のテーマレストランが7月21日オープン。オプティマス人型ロボット接客、UFO型建物、200席/バー/LEDスクリーンを備えた2階建て。80基のV4スーパーチャージャー完備で「食事中充電」可能。自動運転配膳や車名をモチーフにしたメニューも特徴。....
国連関係機関がAI難民の仮想人物を公開 避難者の問題への認識を高めるため
国連大学の研究チームは、スーダンの難民アミナと武装勢力のアブドゥラという2人のAI仮想人物を開発し、対話形式を通じて避難者危機に対する公衆の認識を高めることを目的としている。このプロジェクトは学術チームによる実験的な取り組みであり、国連の公式プロジェクトではない。研究者はこれを寄付活動に使用することを考えていたが、テスト参加者の多くからは否定的な反応があり、現実の難民自身が自分の声を上げることができるはずだと指摘された。現在、関連するウェブサイトは正常にアクセスできなくなっている。(139文字)

PixVerse拍我AIに多キーフレーム生成機能が登場
7月11日、世界中のユーザー数が6000万を突破したAI動画制作プラットフォーム「パーウェイAI(PixVerse)」は大きな機能アップデートを実施しました。最初と最後のフレームモジュールに「多キーフレーム生成」機能が追加され、これによりAI動画制作は単一のスナップショットから「ストーリー的表現」への新たな段階へと進化しました。ユーザーは現在、ウェブ版の最初と最後のフレーム機能を通じて最大7枚の画像をキーフレームとしてアップロードでき、AIがフレーム間の意味関係を自動的に解析し、スマートに流れのある動きやシーンの変換経路を作成します。この技術的な突破により、静止画面が動的に表現されるようになりました。

Perplexity CEOがKimi K2モデルを称賛、後続のトレーニングを行う可能性も
アメリカのAI企業PerplexityのCEOは、月之暗面が新たにリリースしたKimi K2トランズパラメータオープンソースモデルを公的に称賛し、そのモデルに基づいてトレーニングを行うかもしれないと述べた。Kimi K2は混合エキスパートアーキテクチャを採用しており、コード生成、スマートエージェント、数学的推論などのタスクで優れた性能を発揮しており、複数のベンチマークテストでリードを維持している。Perplexityは以前にはDeepSeek R1モデルを使用していたが、今回の声明は技術協力を探求し、AI製品の発展を推進しようとしていることを示している。Kimi K

工業情報部は2025年の世界人工知能大会で「国際人工知能オープンソース協力イニシアチブ」を発表する
2025年世界AI会議は7月26-28日に上海で開催、テーマは「スマート時代の共創」。国際AIオープンソース協力イニシアチブを発表、金砖国家AI協力センター設立も。最新技術を展示し、業界交流を促進。....

映画級TTSの魔法が登場!IndexTTS2でゼロサンプルクローン+感情制御。吹き替え界の革命的な進展!
IndexTTS2は映画レベルのテキスト音声変換モデルで、ローカル展開・音声クローン・感情制御機能を備え、中英対応。映画吹替えに最適で、仮想キャラクター制作など幅広い応用が期待されます。....

人工知能を用いたチャットボットの治療に関する研究が重大なリスクを警告
スタンフォード大学の研究によると、AI心理療法チャットボットには重大なリスクが存在。アルコール依存や統合失調症に対する偏見があり、自殺念慮への対応も不適切。AIは危険を認識できず感情を無視する場合も。研究者はAIを補助ツールとして活用すべきと提案。....