現在の動画処理システムは画面の内容を認識することはできますが、複雑な物理法則や空間移動を理解することはできません。たとえば、車両の通過順序や物体の軌道の最高点を判断するには困難があります。その主な理由は、高品質な運動参照データが不足しているためで、現状のデータ量は少なく、かつ高価な人間による識別に依存しており、システムの計算能力を制限しています。
小米がオープンソース大モデルのMiMo-V2-Flashを発表しました。高速で効率的な性能を特長とし、推論やコード生成などのタスクで優れた成果を収めています。応答速度は多数の有名な中国国内モデルを上回っています。このモデルはスパース活性化アーキテクチャを採用しており、パラメータ数は3090億に達し、MITライセンスにより重みとコードがオープンソースされています。
MIT研究チームは、問題の複雑さに応じて大規模言語モデルの計算リソースを動的に調整するインスタンス適応スケーリング技術を開発し、効率向上とエネルギー消費削減を実現。複数機関の支援を受け、関連論文は11月初旬に発表された。....
MITの15年間の研究により、初めて脳の言語ネットワークのミリメートルレベルの確率マップが作成された。このネットワークは小さいが強力で、単語の意味マッピングと文の組み立てを専門とし、思考や感情モジュールから完全に分離されている。1400回のfMRIスキャンを通じて、「言語チップ」の存在が確認された。....
データウェアハウスに基づくビッグデータ分析ソリューションで、より迅速かつ効率的な意思決定を支援し、ビジネスの成長を促進します。
健康を掌握し、未来を予測し、健康の軌跡を変える。
AIモデルの透明性を高める自動化された解釈性エージェント
浸透テストとリスク評価レポートを協調作業空間へと変換し、タスクの割り当て、進捗状況の追跡、AIによる洞察を提供します。
Deepseek
$4
入力トークン/百万
$12
出力トークン/百万
128
コンテキスト長
Alibaba
-
Chatglm
$16
32
$0.7
$1.95
16
$1.8
$5.4
$2
$8
Minimax
Stepfun
Baidu
mitegvg
このモデルはVideoMAEアーキテクチャに基づく暴力検出モデルで、Kineticsデータセットで事前学習した後、暴力検出タスクに対して92エポックの微調整を行っています。モデルはVision Transformerアーキテクチャを採用し、ビデオコンテンツ分析に特化しており、ビデオ内の暴力行為を識別することができます。
mlx-community
MiniMax-M2-5bitは、MiniMaxAI/MiniMax-M2モデルから変換された5ビット量子化バージョンで、MLXフレームワーク用に最適化されています。このモデルは大規模言語モデルで、テキスト生成タスクをサポートし、MITライセンスで公開されています。
Mitchins
これはEfficientNet-B0アーキテクチャに基づくディープラーニングモデルで、アニメやビジュアルノベルの画像のアートスタイル分類に特化しています。モデルは6種類の異なるアニメアートスタイル、ダーク、フラット、モダン、萌え系、絵画風、レトロスタイルを正確に識別できます。
jeevanrushi07
OpenLLaMA 3B v2はTransformerアーキテクチャに基づくオープンソースの大規模言語モデルで、30億のパラメータを持っています。このモデルはMITライセンスを採用しており、主に英文テキスト生成タスクに使用され、チャットボットなどのさまざまなアプリケーションシナリオをサポートします。
TareksLab
これはLinear DELLA方法を使用して結合された70Bパラメータの大規模言語モデルです。Llama-3.1-Nemotron-lorablated-70Bベースモデルに基づき、複数の高性能なLlama-3.3-70Bバリエーションモデルを統合し、より強力な言語理解と生成能力を提供することを目的としています。
cpatonn
GLM-4.5-Air-AWQは、GLM-4.5-Airベースモデルの8ビット量子化バージョンで、インテリジェントエージェント向けに設計され、混合推論モードを採用し、複雑な推論と即時応答をサポートし、MITオープンソースライセンスの下で公開されています。
unsloth
GLM-4.5はインテリジェントエージェント向けに設計された基礎モデルで、推論、コーディング、インテリジェントエージェント機能を統合し、総パラメータは3550億に達し、12の業界標準ベンチマーク評価で3位となり、得点は63.2です。MITオープンソースライセンスを採用しており、商用や二次開発に利用できます。
mradermacher
これはFBogaerts/NextCoder-7B-Finetunedモデルの静的量子化バージョンで、コード生成とテキスト生成タスクに特化して最適化され、より効率的な推論方案を提供します。このモデルは英語をサポートし、MITライセンスで公開されています。
GLM-4.5-Air-AWQは、zai-org/GLM-4.5-Airベースモデルを基に4ビットAWQ量子化を行ったテキスト生成モデルで、インテリジェントエージェントアプリケーション向けに設計されており、推論、コーディング、インテリジェントエージェント能力に優れています。MITオープンソースライセンスを採用しています。
lmstudio-community
GLM-4.5-Airはzai-orgが開発した高効率言語モデルで、MLXチームによる8ビット量子化最適化を経て、Appleシリコンチップに特化して最適化されています。このモデルはtransformersアーキテクチャに基づいており、テキスト生成タスクをサポートし、MITライセンスで公開されています。
mit-han-lab
Nunchakuによる量子化処理を施したFLUX.1-Kontext-devバージョンで、テキスト命令に基づいて画像を編集でき、推論効率を最適化しながら性能損失を最小限に抑えます。
Shuttle Jaguarに基づくNunchaku量子化バージョンで、テキストプロンプトに基づいて高品質な画像を生成することを目的とし、高効率な推論を最適化し、性能損失を最小限に抑えます。
FLUX.1-Fill-devのNunchaku量子化バージョンで、テキストの記述に基づいて既存の画像内の領域を塗りつぶすことができ、量子化処理により効率的な推論を実現します。
Nunchakuで量子化されたFLUX.1-schnellモデルで、テキストプロンプトに基づいて高品質な画像を生成するために最適化され、高効率な推論を実現します。
ナンチャクチームが提供するFLUX.1-Depth-devの量子化バージョンで、テキスト記述に基づいて画像を生成し、入力画像の構造を保持し、推論効率を最適化します。
FLUX.1-Canny-devのNunchaku量子化バージョンで、テキストの説明に基づいて画像を生成し、同時に与えられた入力画像の構造に従います。
NICOPOI-9
nvidia/mit-b3をベースにファインチューニングした画像セグメンテーションモデルで、NICOPOI-9/morphpad_coord_hgo_512_4class_v2データセットで優れた性能を発揮
NVIDIA MIT-B1アーキテクチャに基づくSegFormer画像分割モデルで、特定のデータセットで微調整され、高精度な画像分割タスクに優れています
nvidia/mit-b3をベースに微調整した画像セグメンテーションモデルで、NICOPOI-9/morphpad_coord_hgo_512_4classデータセットでトレーニングされ、高精度な画像セグメンテーションタスクに優れています。
Mungert
GLM-Z1-32B-0414は32Bパラメータ規模の多言語テキスト生成モデルで、中国語と英語をサポートし、MITライセンスで公開されています。
このプロジェクトには、モデルコンテキストプロトコルの仕様とプロトコルパターンが含まれており、TypeScriptとJSON Schemaの2種類の形式で定義されています。また、オープンソース貢献ガイドとMITライセンスが提供されています。
このプロジェクトはVale-MCPの共同開発プロジェクトで、主にテキスト検証と文章作成支援に使用され、MITオープンソースライセンスを採用しています。
MCPプロトコルを実装したサーバープロジェクトで、ノートの保存と要約生成機能を提供します
このプロジェクトは、Miden開発者ツールとインタラクションするMCPサーバーを実装しており、開発者ドキュメント検索機能を提供します。MCP SDKに基づいて構築され、MITライセンスを採用しています。
Firefox MCP BridgeはClaudeウェブアプリケーションのサーバーサイドプログラムで、付属のFirefox拡張をサポートし、MITとApacheの二重ライセンスで提供されます。
MITRE ATT&CK MCPサーバーはAIネイティブの脅威インテリジェンスツールで、Model Context Protocolを通じてMITRE ATT&CKフレームワークに全面的にアクセスできます。200以上の技術、140以上の脅威組織、700以上のソフトウェアエントリの検索機能を備え、ATT&CK Navigatorの可視化レイヤー生成をサポートし、セキュリティチームとAIエージェント向けに設計されています。
このプロジェクトはMITオープンソースライセンスを使用しています
Yusuke Wadaによって開発されたMCPサーバープロジェクトで、Node.jsを使用してゲームサーバーを実行し、MITライセンスを採用しています。
MCPサーバーはMITRE ATTACK知識ベースにアクセスするために使用されます
このプロジェクトはMIT Hack分散型AIサミットの練習プロジェクトで、Windows上でClaude MCPプロトコルサービスを迅速に構築する方法を示しています。天気アプリとSQLiteデータベースの2つのサンプルを含み、それぞれ政府APIからのデータ取得とパン屋の在庫管理機能をデモンストレーションしています。