智譜が新規の視覚大モデルGLM-4.5Vを発表。チキンブランドを簡単に区別できます！

AIbase基地

公開日AIニュース · 1 分で読めます · Aug 12, 2025

8月11日、智譜科技は最新の視覚理解モデル「GLM-4.5V」を正式にリリースしました。このモデルは、新世代のテキストモデル「GLM-4.5-Air」に基づいてトレーニングされ、前世代の視覚推論モデル「GLM-4.1V-Thinking」の技術路線を引き継いでおり、驚異的な1060億パラメータと120億アクティベーションパラメータを備えています。また、「思考モード」のスイッチ機能が新たに追加され、ユーザーはこのモードを有効または無効にすることができ、タスク処理時により柔軟に対応できます。

このモデルの視覚能力は注目を集めています。マクドナルドとケンタッキーのフライドチキンを簡単に区別でき、外観の色合いや質感など多角的な角度から詳細な分析が可能です。さらに、GLM-4.5Vは画像を使って場所を当てるチャレンジに参加し、大会で優れた成績を収め、99％の参加者を上回り、66位にランクインしました。智譜はこのモデルが42のベンチマークテストで優れた結果を示していることも紹介しており、ほとんどのテストでは同等規模の他のモデルを上回る得点を記録しています。

現在、GLM-4.5VはHugging Face、魔搭、GitHubなどのオープンソースプラットフォームで公開されており、ユーザーは無料でダウンロード・利用可能であり、FP8量化バージョンも提供されています。このモデルをより良く体験するために、智譜はデスクトップアシスタントアプリケーションをリリースしており、リアルタイムでのスクリーンショットや録画をサポートし、コード補助や文書解釈などのさまざまな視覚的推論タスクを支援します。

実際のテストでは、GLM-4.5Vはアップロードされた画像に基づいて位置を推測することができ、まれに小さな誤差が生じる場合もありますが、推論プロセスは非常に豊かです。ウェブコンテンツの処理においては、スクリーンショットを生成して類似度の高いページを作成でき、強力な再現能力を示しています。

GLM-4.5Vは視覚的理解分野だけでなく、エージェントアプリケーションの場面でも大きな可能性を示しています。この技術がさらに発展していくにつれて、私たちには今後、生活に多くの利便性をもたらすことを期待できるでしょう。

GLM-4.5V 智譜科技視覚理解モデル AI新語

この記事はAIbaseデイリーからのものです

【AIデイリー】へようこそ！ここは、毎日人工知能の世界を探求するためのガイドです。毎日、開発者に焦点を当て、技術トレンドを洞察し、革新的なAI製品アプリケーションを理解するのに役立つ、AI分野のホットなコンテンツをお届けします。

—— AIbase デイリーグループによって作成

騰訊が自社開発の大型モデル「混元2.0」を発表：さまざまな能力が向上

騰訊が自社開発の大型モデル「混元2.0（Tencent HY2.0）」を正式にリリースし、同時にDeepSeek V3.2も段階的に騰訊エコシステムに統合されました。現在、この2つのモデルは元宝、imaなどの騰訊のAIネイティブアプリで最初にローンチされており、騰訊クラウドも関連モデルのAPIおよびプラットフォームサービスを同時に公開しています。新たにリリースされたTencent HY2.0はミックスエキスパート（MoE）アーキテクチャを採用しており、総パラメータ数は4...

Dec 6, 2025

WhatsAppがサードパーティのAIチャットボットを禁止したことで欧州連合（EU）が独占禁止調査を開始、Metaは164億ドルの罰金を課される可能性

欧州委員会はMetaに対して独占禁止調査を開始し、WhatsApp Business APIの新しい規則が自社のMeta AIにのみ接続を許可し、ChatGPTなどのサードパーティのAIチャットボットの使用を禁止していることに対して疑問を投げかけている。この新規則では2025年10月からサードパーティのAIチャットボットによるAPIの呼び出しを禁止し、2026年1月15日までに統合されたサービスは退出しなければならないが、除外範囲は明確ではない。

Dec 5, 2025

NVIDIAが新AIフレームワークを発表 80億パラメータのモデルがツールのスマートな管理を支援

NVIDIAと香港大学が共同でOrchestratorモデルを発表。8億パラメータを持ち、複数のツールと大規模言語モデルを調整して複雑な問題を解決。低コストで高精度を実現し、ユーザーの好みに応じてツールを選択。新強化学習フレームワーク「ToolOrchestra」で訓練。....

Dec 5, 2025

2025年グローバルユニコーン企業500強が発表！SpaceX、バイトダンス、OpenAIが先頭を争う。中国企業が強く進出

12月3日、2025年グローバルユニコーン企業500強大会が青島市崂山区で開催された。会議では『2025年グローバルユニコーン企業500強報告書』が発表され、評価基準には70億元を超える評価額と独自の技術およびビジネスモデルが含まれる。報告書によると、2025年のグローバルユニコーン企業の総評価額は39兆1400億元に達し、前年比で増加している。

Dec 5, 2025

日本の政府はAI技術を活用して自殺傾向のある青少年を早期に特定する

日本の政府は、自殺傾向のある青少年を早期に特定し、心理的支援を提供するためのAI計画を推進しており、若者の自殺問題に対処しています。この取り組みは、AIの悪影響に関する議論が増加している中で行われており、特に最近、OpenAIがAIツールが若者を自殺に導く可能性があるとして訴えられ、AIの応用におけるリスクに対する社会的な関心が高まっています。

Dec 5, 2025

AIニュース：KlingAIAvatar 2.0がリリース；グーグルがGemini 3 Deep Thinkモードを発表；アリババクラウドのXiYan-SQLが強力勝利

【AIニュース】へようこそ！ここは毎日人工知能の世界を探索するためのガイドです。毎日、AI分野のトレンドを紹介し、開発者に焦点を当て、技術動向を理解し、革新的なAI製品の応用を知るお手伝いをします。新規のAI製品についてはこちらから確認してください：https://app.aibase.com/zh1、KlingAIAvatar2.0がリリースされるとすぐに人気爆発：5分でダンスと歌を一括生成し、デジタル人間は「顔面麻痺」の時代を終えるKlingAIAvatar2.0はマルチモーダルディレクターにより

Dec 5, 2025

アリババがAI駐車レーダーをリリース：分単位で駐車場の空きを予測、北京市が先駆けて導入

高德地図が「AI駐車レーダー」を導入。空間知覚とAI視覚分析で駐車スペースの利用状況をリアルタイムに可視化し、ナビゲーション中に空き状況を確認可能に。北京でサービス開始。....

Dec 5, 2025

アメリカの放送作家がAIの助言により詐欺疑惑に巻き込まれ、70年間の禁錮刑を目前にしている！

米司法省が31歳のポッドキャスト司会者をネットストーキングと州際脅迫で起訴。最大70年の懲役と350万ドルの罰金の可能性。SNSで「妻」探しの願望と女性への極端な怒りを表明し、ChatGPTを「親友」と呼び、AIの負の側面が浮き彫りに。....

Dec 5, 2025

OpenAIがGPT-5.1-Codex-Maxを発表、コストパフォーマンスが高い

OpenAIがGPT-5.1-Codex-Maxを発表。性能向上しながら価格はGPT-5同等。100万トークン超の長文処理が可能な「圧縮」技術を搭載し、複雑なプログラミングタスクに対応する「エージェント型」コーディング機能が開発者の注目を集めている。....

Dec 5, 2025

ボリューノエンジンが豆包音声認識モデル2.0を発表し、多言語認識精度を向上

ボリューノエンジンは、豆包音声認識モデル2.0を発表しました。このモデルは推論能力を大幅に向上させ、多言語およびビジュアル情報の認識をサポートしています。モデルは20億パラメータの音声エンコーダーを基盤としており、複雑な場面での最適化により、固有名詞、人名、地名、および多音字の認識精度が向上しています。

Dec 5, 2025

AIニュース

AIニュース日報

AIツールを探す

AI製品ランキング

AIプロダクト登録

AIツールディレクトリ

AIモデルファインダー

LLMランキング

LLMプロバイダー

LLM比較選定

LLMコスト計算機

LLMアリーナ

MCPサーバー

MCPクライアント

MCPケースチュートリアル

MCPランキング

MCPサービス提出

MCP実験場

MCPインスペクター

AIブランドモニタリング

GEOランキング照会ツール

GEO順位最適化サービス

AIモデル互換性チェッカー

モデル展開サーバー構成計算機

智譜が新規の視覚大モデルGLM-4.5Vを発表。チキンブランドを簡単に区別できます！

AIbase基地

この記事はAIbaseデイリーからのものです

関連AIニュースの推奨

騰訊が自社開発の大型モデル「混元2.0」を発表：さまざまな能力が向上

WhatsAppがサードパーティのAIチャットボットを禁止したことで欧州連合（EU）が独占禁止調査を開始、Metaは164億ドルの罰金を課される可能性

NVIDIAが新AIフレームワークを発表 80億パラメータのモデルがツールのスマートな管理を支援

2025年グローバルユニコーン企業500強が発表！SpaceX、バイトダンス、OpenAIが先頭を争う。中国企業が強く進出

日本の政府はAI技術を活用して自殺傾向のある青少年を早期に特定する

AIニュース：KlingAIAvatar 2.0がリリース；グーグルがGemini 3 Deep Thinkモードを発表；アリババクラウドのXiYan-SQLが強力勝利

アリババがAI駐車レーダーをリリース：分単位で駐車場の空きを予測、北京市が先駆けて導入

アメリカの放送作家がAIの助言により詐欺疑惑に巻き込まれ、70年間の禁錮刑を目前にしている！

OpenAIがGPT-5.1-Codex-Maxを発表、コストパフォーマンスが高い

ボリューノエンジンが豆包音声認識モデル2.0を発表し、多言語認識精度を向上