AIニュース

世界のAIイノベーションの瞬間をお見逃しなく

AIデイリー

毎日の3分AI業界トレンド

AIタイムライン

AI業界のマイルストーン

Alハードウェアです

すべてのAIハードウェアをリストアップします。

AIマネタイズガイド

画像コレクション

AI画像生成マネタイズ事例

ビデオコレクション

AIビデオ生成マネタイズ事例

オーディオコレクション

AIオーディオ生成マネタイズ事例

コンテンツコレクション

AIコンテンツ作成マネタイズ事例

AIチュートリアル

AIプロダクトランキング

AIウェブサイトの総訪問数ランキングを表示

AIトラフィック成長ランキング

トラフィックによる最も急速に成長しているAIウェブサイトを追跡

AIトラフィック減少ランキング

トラフィックが大幅に減少しているAIウェブサイトに焦点を当てる

AI週間ランキング

AIウェブサイトの週間訪問数ランキングを表示

AIオープンソースプロジェクトライブラリ

概要

GitHubの人気のあるAIオープンソースプロジェクトの概要

プロダクトライブラリツールナビゲーション MCP

THUDM、GLM-4を発表：32億パラメーターモデル、GPT-4oおよびDeepSeek-V3と正面衝突

AIbase基地

公開日AIニュース · 1 分で読めます · Apr 15, 2025

急速に発展する言語モデルの分野において、研究者や組織は多くの課題に直面しています。これらの課題には、推論能力の向上、強力な多言語サポートの提供、複雑なオープンタスクの効率的な管理などが含まれます。小規模モデルは一般的にアクセスしやすくコストも低いものの、大規模モデルには性能で劣る傾向があります。そのため、計算効率と強力な推論能力・指示遵守能力のバランスを効果的にとる中規模モデルの開発が、現在のトレンドとなっています。

最近、清華大学はGLM4、特にそのGLM-Z1-32B-0414バリアントを発表し、これらの課題に効果的に対応しました。GLM4は15兆トークンを含む大規模データセットでトレーニングされ、信頼性の高い多言語能力を提供することを目的としており、「思考パターン」と呼ばれる革新的な推論戦略を採用しています。

この発表により、GLM4はDeepSeek Distill、QwQ、O1-miniなどの著名なモデルと肩を並べ、人気のあるMITライセンスで配布されます。注目すべきは、パラメータ数は32億であるにもかかわらず、GLM4は推論ベンチマークテストで、最大6710億パラメータを持つGPT-4oやDeepSeek-V3などの大規模モデルと同等の性能を示していることです。

技術的な観点から見ると、GLM-Z1-32B-0414は、合成的に生成された推論タスクを含む高品質なトレーニングデータを利用して、分析能力を強化しています。このモデルは、高度な拒否サンプリングや強化学習（RL）などの技術を統合することで、エージェントベースのタスク、コーディング、関数呼び出し、検索駆動型の質問応答タスクにおけるパフォーマンスを向上させています。

さらに、「深層推論モデル」バリアントは、コールドスタート法と延長されたRLトレーニングを組み合わせることで、複雑な数学、論理、コーディングタスク向けに最適化されています。トレーニング過程ではペアワイズランキングフィードバックメカニズムも採用され、モデル全体の推論効果が向上しています。

高度なバリアントであるGLM-Z1-Rumination-32B-0414は、「熟考」と呼ばれる新しい方法を導入しており、AI駆動型の都市分析などの複雑なオープンエンドの問題に対処するために、より長い時間をかけて熟考しながら推論を行うことができます。このバリアントは高度な検索ツールと多目的強化学習を組み合わせることで、研究集約的なタスクや複雑な検索シナリオにおける実用性が大幅に向上しています。様々なニーズに対応するため、GLM-Z1-9B-0414バージョンは90億パラメータで強力な数学と汎用推論能力を示し、小規模モデルの実用性を証明しています。

ベンチマーク評価のパフォーマンスデータは、GLM4シリーズの優位性を強調しています。特にGLM-4-32B-0414は、複数のベンチマークテストで高いパフォーマンスを示し、GPT-4o、DeepSeek-V3、Qwen2.5-Maxなどのモデルと比較されています。IFEval指示遵守ベンチマークでは、GLM4は87.6の高得点を獲得しました。小売（68.7）や航空（51.2）などのタスク自動化ベンチマークTAU-Benchでも、GLM4は良好な成績を収めています。SimpleQAで評価された検索強化型質問応答タスクでは、88.1の高得点を記録しました。

さらに、GLM4はBFCL-v3ベンチマークの関数呼び出しタスクで全体で69.6点を獲得し、GPT-4oのパフォーマンスとほぼ同等です。Moatlessフレームワークでテストされた実際のコード修正シナリオでは、GLM4の成功率は33.8％であり、その実用性を示しています。

GLM4は、効率的な言語モデルシリーズとしての可能性を示しており、アクセスしやすい小規模モデルと従来の大規模モデル間の性能ギャップを効果的に埋めています。GLM-Z1シリーズ、特に32Bバリアントは、強力な推論能力を提供しながら計算コストを抑えることで、このバランスの取れたアプローチを実証しています。緩やかなMITライセンスにより、GLM4は研究や企業アプリケーションにおいて、従来の大規模モデルがもたらす膨大な計算コストを負担することなく、高性能なAIソリューションとして重要なツールになると期待されています。

huggingface:https://huggingface.co/THUDM/GLM-Z1-32B-0414

要点：
- 🌍 GLM4は清華大学が発表した32億パラメータの言語モデルで、強力な多言語能力と推論能力を備えています。
- 📊 このモデルは複数のベンチマークテストで優れた性能を示し、特に指示遵守とタスク自動化の分野では、大規模モデルと同等の性能を発揮しています。
- 🚀 GLM4はMITライセンスにより、高性能なAIソリューションのアクセス性を高め、研究や企業アプリケーションに適しています。

この記事はAIbaseデイリーからのものです

【AIデイリー】へようこそ！ここは、毎日人工知能の世界を探求するためのガイドです。毎日、開発者に焦点を当て、技術トレンドを洞察し、革新的なAI製品アプリケーションを理解するのに役立つ、AI分野のホットなコンテンツをお届けします。

—— AIbase デイリーグループによって作成

AIニュース

AIデイリー

AIタイムライン

Alハードウェアです

最新事例

画像コレクション

ビデオコレクション

オーディオコレクション

コンテンツコレクション

最新チュートリアル

AIプロダクトランキング

AIトラフィック成長ランキング

AIトラフィック減少ランキング

AI週間ランキング

アメリカ合衆国

中国

インド

ブラジル

画像生成

パーソナルアシスタント

キャラクター生成

ビデオ生成

AIプロジェクトランキング

AIプロジェクト成長ランキング

AI開発者ランキング

AI組織ランキング

Deepseek

TTS

LLM

ChatGPT

概要

THUDM、GLM-4を発表：32億パラメーターモデル、GPT-4oおよびDeepSeek-V3と正面衝突

AIbase基地

この記事はAIbaseデイリーからのものです