テンセントがAI音声生成ツール「AudioGenie」を発表。マルチモーダル音声生成が可能で、トレーニング不要のフレームワークを採用。映画級の音響をワンクリックで生成でき、既存製品に挑戦。....
アリババがオープンソースのマルチモーダルエージェント「WebWatcher」を発表。ウェブ閲覧、画像検索、コード解釈などの機能を統合し、視覚理解、論理的推論、知識活用が可能。人間のように複雑なタスクを処理できる。....