ロイター通信によると、オプンエイアイは2026年下半年に上場を検討しており、評価額は10桁に達する可能性があり、世界で最も価値のある上場企業の一つとなる見込みである。企業は最近、収益構造の再編を行い、マイクロソフトと新たな協定を締結した。この協定により、ハードウェアおよび汎用人工知能の開発に焦点を当て、今後の拡大に向けて基盤を築いている。
中国通信研究院および人工知能産業発展連盟が『大モデル一体機応用研究報告(2025年)』を発表し、技術の進化、産業動向、応用実践を分析し、企業に包括的な参考を提供します。報告では大モデル一体機の発展歴史を整理し、近年の顕著な進歩を強調し、技術面での変化に焦点を当てています。
米国のグループ遠見者会議で、智元ロボティクスの共同創業者であるSteve Zhouは、人工知能が急速に汎用知能(AGI)に向かって進んでいると予測し、GPT-6の後にその初期段階が実現されるかもしれないと言った。彼は過去10年のAIの進化を振り返り、2015年のコンピュータビジョンの実用化から2025年のAGIの原型の現れに至るまで、その進展の速さが目覚ましいことを示した。
Anthropic社の最新研究によると、同社のAIモデルClaude Opus4.1は初期段階の自己反省能力を持ち、自身の思考活動を認識し調整できるようになった。これは人工知能がブラックボックス出力から内部的な認知プロセスを感知できるように進化したことを示しており、意識の目覚めには至っていないものの、技術的哲学における重要な壁を突破したとされる。
LTX-2 はマルチモーダル AI 動画生成モデルです。
Perplexity AIはユーザーの接続セキュリティを検証する必要があり、操作を完了した後で引き続き使用できます。
Vibe Codingは雰囲気とAIサポートを組み合わせ、初心者が簡単にプログラミングスキルを習得できるようにします。
人間用のドキュメントから数分でエンジニアが利用できるAPIを生成でき、数ヶ月かける必要はありません。
alibaba
-
入力トークン/百万
出力トークン/百万
131.1k
コンテキスト長
xai
$21.6
$108
1M
$1.08
$1.44
32.8k
openai
$4.32
128k
nineninesix
KaniTTS Pretrain v0.3は高速で高忠実度のテキストを音声に変換するモデルで、リアルタイム対話型人工知能アプリケーション向けに最適化されています。2段階パイプラインアーキテクチャを採用し、大規模言語モデルと高効率オーディオコーデックを組み合わせて、超低遅延と高品質の音声合成を実現します。
Tesslate
WEBGEN DEVSTRAL IMAGESは、ウェブページ生成に特化した人工知能モデルで、HTML、CSS、JS、Tailwind技術を利用してシングルページ型のウェブページを生成することができます。このプロジェクトはカスタムテンプレートに基づいて訓練され、監督微調整手法を採用し、GPT - OSS - 120Bで生成されたデータセットを使用して訓練されています。
KaniTTSは高速で高忠実度のテキスト音声変換モデルで、リアルタイム対話型人工知能アプリケーション向けに最適化されています。このモデルは2段階の処理フローを採用し、大規模言語モデルと効率的なオーディオコーデックを組み合わせています。Nvidia RTX 5080で15秒の音声を生成する際の遅延は約1秒だけで、MOS自然度評価は4.3/5で、英語、中国語、日本語などの多言語をサポートしています。
mlx-community
これはMLXフレームワークに基づく4ビット量子化大規模言語モデルで、スイスの人工知能研究所によって開発され、多言語テキスト生成タスクをサポートし、Apache - 2.0ライセンスで公開されています。
allenai
MolmoActはアレン人工知能研究所によって開発されたオープンソースのロボット操作動作推論モデルで、Qwen2.5 - 7BとSigLip2視覚バックボーンネットワークに基づいて構築され、家庭およびデスクトップ環境における片腕のフランカロボット操作タスクに特化して最適化されています。
MolmoActは、アレン人工知能研究所によって開発された完全なオープンソースのロボット操作アクション推論モデルで、Qwen2.5 - 7BとSigLip2の視覚バックボーンネットワークに基づいて構築され、家庭やデスクトップ環境でのロボット操作タスクに特化しています。
MolmoActはアレン人工知能研究所によって開発されたオープンソースの行動推論モデルで、ロボット操作タスクに特化しています。このモデルはQwen2.5 - 7BとSigLip2をベースに構築され、家庭およびデスクトップ環境における93種類の操作タスクで訓練され、優れた視覚 - 言語 - 行動処理能力を持っています。
MolmoActはアレン人工知能研究所によって開発されたオープンソースの動作推論モデルで、ロボット操作タスクに特化しています。このモデルはQwen2.5 - 7BとSigLip2ビジュアルバックボーンネットワークに基づいており、家庭およびデスクトップ環境の93種類の独特な操作タスクで訓練され、優れたビジュアル - 言語 - 動作推論性能を持っています。
prithivMLmods
Qwen3アーキテクチャに基づいて構築された専門モデルで、科学、人工知能設計、一般的な推論分野に特化しています。このモデルは高難度の科学推論データセットで微調整され、優れた一般的および創造的な推論能力を備え、サイズが小さく、ローカルデバイスとサーバーへのデプロイに適しています。
Phonepadith
これはラオス語に特化して最適化された要約生成モデルで、Google Gemma - 3 - 4B - Instructモデルをベースに、5000以上の高品質なラオス語の入力 - 出力ペアを使って微調整されており、主に人工知能とデジタルコンテンツ(AIDC)のテーマに焦点を当てています。
menzo-ai
これはLLaMA - 3 - 8Bをファインチューニングした対話型人工知能モデルで、メンタルヘルス指導に対して共感的で偏見のないサポートを提供するために特別に設計されています。モデルは精心に企画されたメンタルヘルスデータセットを使用してファインチューニングされ、思いやりのある、支援的な返答を提供し、治療的対話を模倣することができます。
stanfordmimi
MedVAL-4Bは微調整された言語モデルで、医師レベルに近い信頼性で人工知能が生成した医学テキスト出力を評価することができます。これは自己教師付きフレームワークで、合成データを利用して評価器の大規模言語モデルを訓練し、医師のラベルや参照出力なしで大規模言語モデルが生成した医学出力と入力の間の事実の一致性を評価します。
aisingapore
WangchanLION-v3-ITは、VISTECとシンガポールの人工知能会社が共同開発した多言語大規模言語モデルで、タイ語に特化して命令調整を行っています。このモデルはLlama3アーキテクチャに基づいており、約376万個のタイ語の命令 - 完成ペアを使用して微調整され、英語とタイ語の処理をサポートしています。
Llama-3.1-8B-Instruct-RM-RB2はAllen人工知能研究所が公開した報酬モデルの一つで、Llama-3.1-8B-Instructをベースに微調整され、生成モデルの嗜好学習を評価および最適化するために使用されます。
Llama-3.1-70B-Instruct-RM-RB2はアレン人工知能研究所が発表した7つの報酬モデルの1つで、ベンチマークテストの開発と下流のPPO/Best-of-N性能との関連分析に使用されます。
Fastweb
FastwebMIIAはFastwebによって開発された70億パラメータのイタリア人工知能モデルで、イタリア語と英語用に設計され、長文書処理をサポートしています。
mradermacher
Medra27Bの量子化バージョンで、複数の量子化タイプを提供し、テキスト生成、医療人工知能などの複数の分野に適用されます。
unsloth
Cosmos-Reason1はNVIDIAが開発した物理人工知能モデルで、物理常識を理解する能力を備え、長鎖思考推論により具身決定を生成できます。このモデルはマルチモーダル入力(テキスト + ビデオ/画像)をサポートし、出力はテキストで、ロボットや自動運転などの物理AI分野に適しています。
HyperBlaze
BGE-M3は北京智源人工知能研究院によって開発された多言語テキスト埋め込みモデルで、100種類以上の言語の密集検索、多ベクトル検索、疎検索の3種類の検索方式をサポートしています。このモデルはMTEBベンチマークテストで優れた成績を収め、多言語テキストの類似度計算と検索タスクを効果的に処理することができます。
nvidia
Cosmos-Predict2は、物理感知を持った画像、ビデオ、世界状態を生成するために設計された一連の高性能事前学習世界基礎モデルで、物理人工知能の開発に使用できます。
Apktool MCP Serverは、Model Context Protocolに基づくAndroid APK分析サービスで、ApktoolツールとGemini CLI人工知能を統合し、APKのデコンパイル、セキュリティ分析、プライバシー監査、およびリバースエンジニアリングのガイダンス機能を提供します。
神経小児発達システムは、画期的な人工知能フレームワークで、人間の心理発達段階(認知、感情、社交的成長を含む)を模倣することで、ニューラルネットワークの学習方法を再構築します。このシステムは、発達心理学理論(ピアジェの認知発達段階、愛着理論など)と神経科学の原理を統合し、知覚処理、感情調節、記憶システム、心理コンポーネントを含む複雑なアーキテクチャを構築し、真の感情知能と自然な発達能力を持つAIを作成することを目指しています。
このプロジェクトはNasdanikaの機能を基に人工知能システムを構築し、リソース集合(相互接続モデル)上で操作することに特化しています。「ナレーター」プロセッサを通じて、モデル要素とその関係を多角的に説明し、埋め込みとベクトルストレージを利用して意味検索とRAG(検索強化生成)を実現し、同時にOpenAIとOllamaのチャット完了機能をサポートします。
このプロジェクトはコマンドラインインターフェース(CLI)ツールで、Arcee AI、TESS、MCPサービスを統合し、Clean ArchitectureとDDDの設計原則を採用して、複数の人工知能サービスに対する統一アクセスの抽象層を提供します。
MCPツールが複数のサービスとやり取りする能力を示し、人工知能機能を標準化して拡張するサーバーサイドの実装を提供します。