ロボット企業ピクルロボットは、元テスラの幹部エイヴァンソン氏を初のCFOとして迎え入れた。同社とUPSの協力が重要な時期に向けた動きである。エイヴァンソン氏は昨年9月からコンサルティングを提供していたが、その後はフルタイムで参画し、以前はテスラで投資家関係と戦略を担当していた。
グーグルが新しいA2UI標準を導入し、AIが直接グラフィックインタフェース要素、例えばボタンやフォームを生成できるようにしました。これにより、インタラクション体験が向上します。従来のAIインタラクションはテキストに依存しており、複雑なタスクを処理するのが煩雑でした。A2UIオープンソースプロジェクトでは、AIが視覚的に反応するための基準が設定され、カスタマーサービスなどの場面で即座にインタフェースを作成でき、操作プロセスが簡素化されます。
新しいタイプのデートアプリKnownは、左スワイプ・右スワイプの浅いマッチングモードを破り、深く会話することで、最初の紹介がオンラインからオフラインでのデートに変わる割合を80%まで引き上げました。これは従来のソフトウェアの10%未満の出会う率を大幅に上回っています。この企業は最近、Forerunnerなどの複数の機関による出資を受け、970万ドルの資金調達を完了しました。
AIプログラミング分野で活発なM&Aが進行中。Cursorは人材採用とCRMチームの買収に続き、AIコードレビュー企業Graphiteを買収。取引額は2.9億ドルの評価額を大幅に上回る。コード生成からレビューまでのAI開発フローを統合し、開発効率向上を目指す。....
FloyoはComfyUIをブラウザに導入し、オープンソースのワークフローを瞬時に起動し、ゼロ設定で無料で構築できます。
20以上のオープンソースモデルをサポートするプライベートなAIチャットプラットフォームで、会話のプライバシーとコンテキストを保護します。
水曜なしのAI動画ジェネレーター、世界中からアクセス可能です。
オートメーションによって自分自身のプラットフォームを構築できる、オープンソースのフルスタックAIウェブアプリジェネレーター。
Xai
$1.4
入力トークン/百万
$3.5
出力トークン/百万
2k
コンテキスト長
Openai
$7.7
$30.8
200
-
Anthropic
$105
$525
Google
$0.7
$2.8
1k
$7
$35
$2.1
$17.5
$21
Alibaba
$1
$10
256
$6
$24
Baidu
128
$2
$20
$4
$16
$8
$240
52
PrimeIntellect
INTELLECT-3は1060億のパラメータを持つ混合専門家(MoE)モデルで、大規模な強化学習によって訓練されています。数学、コーディング、推論のベンチマークテストで卓越した性能を発揮し、モデル、訓練フレームワーク、環境はすべて緩やかなライセンス契約でオープンソース化されています。
ostris
これはLoRA技術に基づくテキストから画像への変換モデルで、フランスの印象派画家ベルト・モリソーの芸術スタイルを持つ画像を生成するために特別に設計されています。このモデルはFLUX.2-devベースモデル上で訓練され、通常の画像またはテキスト記述をモリソースタイルの絵画に変換することができます。
MCG-NJU
SteadyDancerは、画像から動画へのパラダイムに基づく強力なアニメーションフレームワークで、高忠実度で時間的に連続した人体アニメーションの生成に特化しています。このフレームワークは、堅牢な最初のフレームの保持メカニズムにより、従来の方法におけるアイデンティティドリフトの問題を効果的に解決し、視覚的な品質と制御性に優れており、同時にトレーニングリソースの必要量を大幅に削減します。
OpenOranje
TweeTaal-nl-en-0.6Bは、オランダ語と英語の双方向翻訳タスクに特化して微調整された言語モデルで、Qwen3-0.6Bアーキテクチャに基づいて開発されています。このモデルは、リソースが制限された環境でも正確で流暢な翻訳サービスを提供し、オランダ語と英語の相互翻訳をサポートします。
ExaltedSlayer
Gemma 3はGoogleが開発した軽量オープンソースのマルチモーダルモデルです。このバージョンは12Bパラメータの命令調整量子化感知トレーニングモデルで、MLXフレームワークのMXFP4形式に変換されています。テキストと画像の入力をサポートし、テキスト出力を生成します。128Kのコンテキストウィンドウと140種類以上の言語をサポートしています。
Kiy-K
Fyodor-Q3-8B-Instructは、スマート推論と堅牢なコード生成のために設計された高忠実度の命令調整モデルです。Qwen3 - 8Bアーキテクチャに基づき、高ランクのLoRA設定で訓練されており、コーディング前の計画立案に長けており、複雑なソフトウェアエンジニアリングタスクに非常に適しています。
vanta-research
Atom-Olmo3-7Bは、Olmo-3-7B-Instructをベースにファインチューニングされた言語モデルで、協調型問題解決と創造的な探索に特化して設計されています。このモデルは、複雑な問題を扱う際に、熟慮された構造化分析を提供し、同時に魅力的な会話スタイルを維持し、Apache 2.0オープンソースライセンスを持っています。
noctrex
これはMiniMax-M2-REAP-172B-A10BモデルのMXFP4_MOE量子化バージョンで、メモリ効率の高い圧縮モデルです。REAP(ルーティング重み付き専門家活性化剪定)方法を通じて、性能を維持しながらモデルを230Bパラメータから172Bパラメータに圧縮し、サイズを25%縮小し、リソース制限のある環境、ローカルデプロイ、および学術研究に適しています。
Jan-v2-VLは、80億のパラメータを持つ視覚言語モデルで、実際のソフトウェア環境(ブラウザやデスクトップアプリなど)で長時間の多段階タスクを実行するために設計されています。このモデルは、言語推論と視覚認知を組み合わせ、複雑な指示に従い、中間状態を維持し、軽微な実行エラーから回復することができます。
prithivMLmods
Jan-v2-VLは80億のパラメータを持つ視覚言語モデルで、ブラウザやデスクトップアプリケーションなどの実際のソフトウェア環境で長周期、多段階のタスクを実行するために設計されています。このモデルは言語推論と視覚認知を密接に結びつけ、複雑な指示に従い、中間状態を維持し、軽度の実行エラーから回復して、安定した持続的なタスク完了を実現します。
Leohan
MLXライブラリに基づいて開発されたテキスト生成モデルで、自然言語処理タスクに特化し、開発者に効率的なテキスト生成ソリューションを提供します。
HIT-TMG
Uni-MoE 2.0-Omniは、ライチ科技(Lychee)が発表した完全オープンソースの全モーダリティモデルで、全モーダリティ3D RoPEと動的容量エキスパート混合アーキテクチャを採用し、言語を中心としたマルチモーダリティ理解、推論、生成能力を大幅に向上させました。このバージョンには、全モーダリティ理解とオーディオおよび画像生成能力が統合されています。
unsloth
Qwen3-Coder-REAP-363B-A35Bは、REAP手法を用いてQwen3-Coder-480B-A35B-Instructを25%のエキスパート剪定を行った疎な混合エキスパートモデルです。元のモデルに近い性能を維持しながら、パラメータ規模とメモリ要件を大幅に削減し、特にリソースが制限されたコード生成とスマートコーディングのシナリオに適しています。
allenai
Olmo 3は、Allen Institute for AI (Ai2)によって開発された全く新しい32Bパラメータの言語モデルファミリーで、Base、Instruct、Thinkなどのバリエーションが含まれています。このモデルはDolma 3データセットを基に訓練され、65,536の長文脈処理をサポートし、言語モデル科学の発展を推進することを目的としています。モデルは完全にオープンソースで、Apache 2.0ライセンスに従っています。
このプロジェクトは、Qwen3-Coder-30B-A3B-InstructモデルをMXFP4_MOE量子化した成果物で、コンテキストサイズを256kから1Mに拡張し、コード生成やプログラミングタスクに最適化されたモデルバージョンを提供し、パフォーマンスの向上とリソースの節約に価値があります。
SadraCoding
SDXL-Deepfake-Detectorは、AI生成顔を正確に検出するツールで、デジタル世界の真実性を維持することに特化し、視覚的な虚偽情報に対抗するためのプライバシー保護とオープンソースのソリューションを提供します。このモデルは、事前学習モデルを微調整することで、軽量かつ高精度な検出を実現します。
JanusCoder-14Bは、Qwen3-14Bをベースに構築された14Bパラメータのオープンソース基礎モデルで、コードインテリジェンスに統一されたビジュアルプログラミングインターフェイスを構築することを目的としています。このモデルはJANUSCODE-800Kマルチモーダルコードコーパスで学習され、さまざまなビジュアルプログラミングタスクを統一的に処理することができます。
JanusCoder-8Bは、Qwen3-8Bをベースに構築されたオープンソースのコードインテリジェンス基礎モデルで、統一されたビジュアルプログラミングインターフェイスを構築することを目的としています。このモデルは、JANUSCODE-800K(これまでで最大のマルチモーダルコードコーパス)で学習され、データ可視化、インタラクティブなWeb UI、コード駆動のアニメーションなど、さまざまなビジュアルプログラミングタスクを処理できます。
OpenMOSS-Team
MOSS-TTSDはオープンソースのバイリンガル口語対話合成モデルで、中国語と英語をサポートし、二人の対話脚本を自然で表现力豊かな対話音声に変換できます。音声クローニングをサポートし、単一ラウンドの音声生成時間は最大1700秒に達することができます。
mradermacher
これはQwen3-VL-8B-Abliterated-Caption-itモデルの静的量子化バージョンで、多言語画像記述タスクをサポートし、複数の量子化レベルを選択でき、性能とリソース要件のバランスを取ります。
Inbox Zeroは、オープンソースのAIメールアシスタント兼クライアントで、ユーザーが効率的にメールを管理し、受信トレイをゼロにするのを支援します。
アデリンは、Rustで書かれたオープンソースのSolidityスマートコントラクト静的分析ツールで、開発者やセキュリティ研究者がSolidityコードの脆弱性を発見するのを支援します。FoundryとHardhatプロジェクトをサポートし、複数の形式のレポートを生成でき、VSCode拡張機能も提供します。
Refact AgentはオープンソースのAIプログラミングアシスタントで、多言語のコード生成、デバッグ、最適化をサポートし、主流の開発ツールと統合し、ローカルにデプロイでき、スマートなコード補完とコード解釈機能を提供します。
MCPプロトコルに基づくKubernetesクラスター管理サーバーで、コマンドラインまたはチャットインターフェイスを通じてKubernetesクラスターとやり取りでき、リソース管理、Helmチャート操作などの機能を提供します。
Klavis AIはオープンソースプロジェクトで、Slack、Discord、Webプラットフォームで簡単に使えるMCP(モデルコンテキストプロトコル)サービスを提供します。レポート生成、YouTubeツール、ドキュメント変換などのさまざまな機能があり、非技術ユーザーと開発者がAIワークフローを使用するのをサポートします。
セレナは強力なオープンソースのコーディングエージェントツールキットで、大規模言語モデル(LLM)をコードベース上で直接動作するフル機能のエージェントに変えることができます。IDEに似た意味論的なコード検索と編集ツールを提供し、様々なプログラミング言語をサポートし、MCPプロトコルまたはAgnoフレームワークを介して様々なLLMと統合することができます。
ソロンは、高効率、オープン、エコシステムにやさしいJavaのエンタープライズアプリケーション開発フレームワークで、全シナリオの開発に対応し、高性能、低メモリ消費、高速起動、小さなパッケージサイズなどの特徴があり、Java8からJava24まで、およびGraalVMネイティブランタイムと互換性があります。
Awesome-MCP-ZHは、中国語ユーザー向けに作成されたMCP(モデルコンテキストプロトコル)のリソースコレクションです。MCPの基本的な説明、使い方、クライアント、サーバー、コミュニティリソースが含まれ、ユーザーがすぐにMCPを使い始めるのに役立ちます。
Genkitは、AI駆動のアプリケーションを構築するためのオープンソースフレームワークで、Node.jsとGoのライブラリを提供し、複数のAIモデルとベクトルデータベースの統合をサポートし、開発ツールとプラグインエコシステムを含んでいます。
OpenDiaはオープンソースのブラウザ拡張ツールで、AIモデルが直接ユーザーのブラウザを制御でき、既存のログイン状態、ブックマークなどのデータを利用して自動化操作を行います。複数のブラウザとAIモデルをサポートし、プライバシー保護に配慮しています。
FastMCPは、TypeScriptに基づくフレームワークで、クライアントセッションをサポートするMCPサーバーを構築するために使用されます。ツール、リソース、プロンプトの簡単な定義を提供し、認証、セッション管理、画像と音声コンテンツの返却、ログ記録、エラー処理、SSE通信などの機能をサポートし、テストとデバッグ用のCLIツールも含まれています。
Cogneeは、AIエージェントに記憶機能を提供するオープンソースプロジェクトです。モジュール化されたECLパイプラインを通じて動的な知識グラフを構築し、複数のデータソースと形式をサポートし、幻覚を減らし、コストを削減します。
Cipherは、プログラミングAIエージェント向けに設計されたオープンソースのメモリ層フレームワークです。MCPプロトコルを通じてさまざまなIDEとAIコーディングアシスタントと統合し、自動記憶生成、チーム記憶共有、デュアルシステム記憶管理などの核心機能を提供します。
NotteはオープンソースのフルスタックネットワークAIエージェントフレームワークで、ブラウザセッション、自動化されたLLM駆動エージェント、ウェブページの監視と操作、資格情報管理などの機能を提供し、インターネットをエージェントに優しい環境に変え、自然言語でウェブサイトの構造を記述することでLLMの認知負荷を軽減することを目的としています。
Klavis AIはオープンソースプロジェクトで、Slack、Discord、ウェブ上で使用できる多機能計算プラットフォーム(MCP)を提供します。非技術ユーザーが簡単にAIワークフローを設定でき、開発者は拡張して構築することができます。
mcp-getは、MCPサーバーを発見、インストール、管理するためのコマンドラインツールで、LLMと外部データソースの接続を簡素化します。
Wren Engineは、MCPクライアントとAIエージェント向けの意味エンジンで、意味層のサポートを提供し、AIが企業のデータモデルとビジネスロジックを正確に理解できるようにします。複数のデータソースをサポートし、MCPクライアントに組み込まれており、データのやり取りの正確性と管理を保証します。
napiはNanoAPIによって開発されたツールで、ソフトウェアアーキテクチャの複雑性を自動的に分析し、コードベースから機能モジュールを抽出することをサポートします。CLIとUIの両方の操作方法を提供し、主流のCI/CDプラットフォームと互換性があり、開発者がアーキテクチャ設計を最適化するのを支援します。
ACI.devはオープンソースのAIエージェントツールインフラストラクチャで、600以上の事前統合ツールのマルチテナント認証、権限管理、動的探索機能を提供し、統合MCPサーバーまたは軽量SDKを通じた呼び出しをサポートし、本番レベルのAIエージェント開発を簡素化します。
GolangベースのMCPサーバーで、Kubernetesクラスターに接続し、リソースのクエリと操作機能を提供します。