知譜チームは4つの動画生成コア技術をオープンソース化しました。GLM-4.6Vの視覚理解、AutoGLMデバイス操作、GLM-ASR音声認識およびGLM-TTS音声合成モデルを含み、マルチモーダル分野における最新の進展を示し、動画生成技術の発展に基盤を築きました。
智谱AIがGLM-ASR音声認識モデルをオープンソース化し、PC用「智譜AI入力法」をリリース。GLM-ASR-2512クラウドモデルはリアルタイム転写をサポートし、複雑な環境でも低い文字誤り率(CER)を実現。....