グーグルラボとDeepMindが共同で発表したAIツールのPomelliは、米国、カナダ、オーストラリア、ニュージーランドで公開テスト中です。このツールは中小企業向けで、ウェブサイトの内容をスマートに分析し、ブランドのスタイルに合ったソーシャルメディアのマーケティングキャンペーンを迅速に生成し、マーケティングのハードルを下げ、専門的なコンテンツ制作を実現します。コア機能は3段階でビジネスのDNAを構築します。
AdobeがプロフェッショナルなAI画像生成モデルであるFirefly Image5を発表しました。これにより、「十分使える」から「プロフェッショナルなレベル」への質的飛躍が実現されました。新機能には400万ピクセルのネイティブ出力、階層化されたヒント編集、カスタムアートスタイルモデルおよびAI音声トラック生成が含まれ、画像、動画、音声のAIクリエーションの完結したループを構築し、クリエイティブワークフローを再定義します。
IBMがGranite4.0 Nano AIモデルを発表。パラメータ数350万~15億で、ノートPCやブラウザでローカル実行可能。クラウド不要で、一般ハードウェアやエッジデバイスでの開発を促進。....
OpenAIの最高経営責任者であるサム・オートマンが初めて明確に、会社が最も可能性が高いのはIPOによる上場だと述べた。AI競争が「重資産」時代に入った中、OpenAIは過去例を見ないほどの資金と計算力を投入し、次世代のAIインフラストラクチャー構築を目指している。オートマンは、事業規模が指数関数的に拡大したため、IPOは必然的な選択肢であり、グローバルな投資家にAI革命への参加機会を提供するとしている。
オープンソースのAIエージェントプラットフォームで、AIワークフローの設計、デプロイ、監視が可能で、コードを書かずに構築できます。
PipiadsはAI SaaS広告クリエイティブセンターとライブラリを提供し、広告戦略とビジネスチャンスの探索をサポートします。
テキストプロンプトを使用して、画像を編集?再構築?デザインし直す無料オンラインAI画像エディターです。
AI音楽創作スタジオ。専門的で著作権料無料の様々なタイプの音楽トラックを秒速で生成します。
deepseek
$3.6
入力トークン/百万
$15.48
出力トークン/百万
128k
コンテキスト長
chatglm
$0.43
$1.01
131.1k
minimax
-
1M
xai
$21.6
$108
mistral
upstage
65.5k
google
$0.72
$2.88
aws
$0.5
openai
cohere
256k
$14.4
$2.16
8.2k
ai21-labs
$3.53
$7.99
260k
01-ai
32k
Daemontatox
Zirel-3は、GLM - 4.5 - Air - REAP - 82B - A12Bをベースにした特定の微調整モデルで、REAP(ルーティング重み付きエキスパート活性化剪定)技術を用いて圧縮された820億パラメータの混合エキスパートモデルです。高性能を維持しながら、モデルサイズを大幅に削減しています。
nvidia
NVIDIA GPT-OSS-120B Eagle3は、OpenAIのgpt-oss-120bモデルをベースに最適化されたバージョンで、ハイブリッドエキスパート(MoE)アーキテクチャを採用し、総パラメータ数が1200億、アクティブなパラメータ数が50億です。このモデルは商用および非商用の使用をサポートし、テキスト生成タスクに適しており、特にAIエージェントシステムやチャットボットなどのアプリケーション開発に適しています。
unsloth
ApertusはスイスのAIによって開発された完全にオープンな多言語大規模言語モデルで、70億と80億の2種類のパラメータ規模を提供します。このモデルは1000種類以上の言語をサポートし、完全にコンプライアンスでオープンな学習データを使用し、その性能はクローズドソースモデルに匹敵します。Apertusは15Tのトークンで事前学習され、段階的なコース学習方法を採用し、最大65,536トークンのコンテキスト長をサポートします。
redponike
ApertusはスイスのAIによって開発された完全にオープンな多言語大規模言語モデルで、パラメータ規模は80億と700億で、1000種以上の言語と長文脈処理をサポートし、完全にコンプライアンスの取れたオープンな学習データのみを使用し、性能はクローズドソースモデルに匹敵します。
Ashmotv
animat3d_style_wan-loraは、OstrisによるAIツールキットを基にトレーニングされたLoRAモデルで、テキストからビデオへの生成に特化しており、画像生成に独特な3Dアニメーションスタイルの効果をもたらします。このモデルはWan2.2 - T2V - A14Bベースモデルを基に微調整されており、複数の主流のAIプラットフォームで使用できます。
nineninesix
KaniTTSは、リアルタイム対話型AIアプリケーション向けに最適化された高速かつ高忠実度のテキスト音声変換モデルです。2段階のパイプラインアーキテクチャを採用し、大規模言語モデルと効率的なオーディオコーデックを組み合わせることで、卓越した速度と音質を実現し、複数の言語をサポートし、エッジ/サーバーデプロイメントに適しています。
zai-org
GLM-4.6は智譜AIが発表した次世代のテキスト生成モデルで、GLM-4.5と比較して、文脈処理、コード化性能、推論能力などの面で著しい向上を実現し、200Kの文脈長をサポートし、より強力なエージェント能力と洗練されたライティング能力を備えています。
neuphonic
NeuTTS Airは世界初の即時音声クローン機能を備えた超リアルな端側テキスト読み上げ(TTS)言語モデルです。0.5Bパラメータの大規模言語モデルの骨格をベースに構築され、ローカルデバイスに自然な音声、リアルタイム性能、組み込みセキュリティ、話者クローン機能をもたらします。
NeuTTS Airは、即時音声クローニング機能を備えた世界初の超リアルなデバイス端テキスト音声変換モデルです。0.5Bパラメータの大規模言語モデルの骨格をベースに構築され、ローカルデバイス上で自然な音声生成、リアルタイム性能、話者クローニング機能を実現します。
geoffmunn
これはQwen/Qwen3-0.6B言語モデルのGGUF量子化バージョンで、6億のパラメータを持つコンパクトな大規模言語モデルで、低リソースデバイスでの超高速推論用に設計されています。llama.cpp、LM Studio、OpenWebUI、GPT4Allなどのフレームワークをサポートし、どこでもオフラインでプライベートAIを使用できます。
samunder12
Llama 3.1 8B Instructをベースに微調整されたGGUF量子化モデルで、強勢的で断固とした、かつ挑発的なAIのキャラクター設定を持ち、ロールプレイングやクリエイティブなライティングシーンに最適化されており、CPUまたはGPUでのローカル推論をサポートしています。
gabriellarson
Foundation-Sec-8B-Instructは、ネットワークセキュリティアプリケーション向けに設計された80億パラメータの指令微調整言語モデルです。Llama-3.1-8Bアーキテクチャに基づいており、優れた指令追従能力とネットワークセキュリティの専門知識を備え、ローカルデプロイメントをサポートしています。これにより、組織はAIセキュリティツールを構築し、クラウドサービスへの依存を減らすことができます。
Keltezaa
AiGirl_IIは、black-forest-labs/FLUX.1-devをベースに構築されたテキストから画像を生成するモデルで、LoRA技術とDiffusersライブラリを組み合わせて、特定のスタイルの画像を生成するために特別に設計されています。このモデルはCC BY-NC-ND 4.0ライセンスを採用しており、非商用用途に適しています。
LFM2-350MはLiquid AIによって開発された第2世代のハイブリッドモデルで、エッジAIとデバイス端末のデプロイに特化して設計されています。このモデルは、品質、速度、メモリ効率の面で新しい基準を確立し、3億5000万のパラメータを持ち、複数の言語をサポートし、エッジコンピューティングシナリオに適しています。
Devstral 1.1は、Mistral AIとAll Hands AIが共同開発したスマート大規模言語モデルで、ソフトウェアエンジニアリングタスク向けに設計されています。このモデルはSWE-benchベンチマークテストで優れた成績を収め、オープンソースモデルのトップにランクインしており、240億のパラメータと128kトークンの長いコンテキストウィンドウを持っています。
kshitijthakkar
LoggenixMoE133Mは、軽量な混合専門家(MoE)因果言語モデルで、総パラメータ数は133M、アクティブなパラメータ数は80Mです。このモデルは、根本原因分析、コード生成、推論タスクを含むカスタムデータセットでゼロから学習され、エージェント能力の特殊なトークンをサポートし、エッジデバイスへのデプロイと専門的なAIエージェントの構築に適しています。
GLM-4.1V-9B-Baseは智譜AIが開発したオープンソースのビジョン言語基礎モデルで、90億のパラメータを持ち、マルチモーダル推論能力に特化し、中英バイリンガルをサポートし、最大4K解像度の画像と64Kの文脈長を処理できます。
trentmkelly
Redditコメント内のAI生成コンテンツを検出するための二値分類テキスト分類モデルで、ブラウザ拡張機能によるリアルタイム検出をサポートします。
TheStageAI
エラスティックモデルはTheStage AI ANNAによって生成されたモデルシリーズで、スライドコントロールバーを使用してモデルの規模、遅延、品質を自由に調整でき、セルフホスティングシナリオにおいて最速で最も柔軟なソリューションを提供します。
fahadh4ilyas
Llama 4シリーズはMetaが開発したネイティブマルチモーダルAIモデルで、ハイブリッドエキスパートアーキテクチャを採用し、テキストと画像のインタラクションをサポートし、様々な言語とビジュアルタスクで卓越した性能を発揮します。
Inbox Zeroは、オープンソースのAIメールアシスタント兼クライアントで、ユーザーが効率的にメールを管理し、受信トレイをゼロにするのを支援します。
Einoは、Golang用に設計されたLLMアプリケーション開発フレームワークで、シンプルで拡張可能で信頼性が高く効率的なコンポーネント抽象化と編成機能により、AIアプリケーションの開発プロセスを簡素化することを目的としています。豊富なコンポーネントライブラリ、強力なグラフ編成機能、完全なストリーム処理サポート、および高度に拡張可能なアスペクトメカニズムを提供し、開発からデプロイまでの全サイクルのツールチェーンを網羅しています。
Refact AgentはオープンソースのAIプログラミングアシスタントで、多言語のコード生成、デバッグ、最適化をサポートし、主流の開発ツールと統合し、ローカルにデプロイでき、スマートなコード補完とコード解釈機能を提供します。
Scraplingは適応型ウェブページのスクレイピングライブラリで、ウェブサイトの変化を自動的に学習し、要素を再配置します。複数のスクレイピング方法とAI統合をサポートし、高性能な解析と開発者に優しい体験を提供します。
UnityMCPはUnityエディターのプラグインで、モデルコンテキストプロトコル (MCP) を実装し、UnityとAIアシスタントのシームレスな統合を提供します。リアルタイムの状態監視、リモートコマンドの実行、ログ機能が含まれます。
Genkitは、AI駆動のアプリケーションを構築するためのオープンソースフレームワークで、Node.jsとGoのライブラリを提供し、複数のAIモデルとベクトルデータベースの統合をサポートし、開発ツールとプラグインエコシステムを含んでいます。
OpenDiaはオープンソースのブラウザ拡張ツールで、AIモデルが直接ユーザーのブラウザを制御でき、既存のログイン状態、ブックマークなどのデータを利用して自動化操作を行います。複数のブラウザとAIモデルをサポートし、プライバシー保護に配慮しています。
XcodeBuild MCPは、AIアシスタントとMCPクライアントにXcode関連のツールを統合するサーバーで、Xcodeプロジェクト管理、シミュレーター制御、アプリユーティリティなどの機能をサポートし、開発プロセスの自動化を実現します。
OpenSumiは、AIネイティブのIDE製品を迅速に構築するのに役立つフレームワークで、クラウドとデスクトップの開発環境をサポートし、豊富なサンプルプロジェクトとテンプレートを提供します。
Cogneeは、AIエージェントに記憶機能を提供するオープンソースプロジェクトです。モジュール化されたECLパイプラインを通じて動的な知識グラフを構築し、複数のデータソースと形式をサポートし、幻覚を減らし、コストを削減します。
ArXiv MCP Serverは、AIアシスタントとarXiv研究ライブラリをつなぐ橋渡しの役割を果たし、MCPプロトコルを通じて論文の検索と内容へのアクセス機能を実現します。
MCPアトラシアンは、アトラシアンの製品(ConfluenceとJira)用に設計されたモデルコンテキストプロトコルサーバーで、クラウドとオンプレミスの両方のデプロイをサポートし、AIアシスタントの統合機能を提供します。
hyper - mcpはWebAssemblyプラグインに基づく高性能MCPサーバーで、コンテナレジストリを通じたプラグイン配布をサポートし、さまざまなAIアプリケーションシーンに適しています。
MCP Unityは、Model Context Protocolを実装したUnityエディター拡張で、Node.jsサーバーを通じてAIアシスタントとUnityプロジェクトのインタラクションを橋渡しし、メニュー実行、オブジェクト選択、コンポーネント更新などの機能を提供します。
Context7 MCPは、AIプログラミングアシスタントにリアルタイムのバージョン固有のドキュメントとコード例を提供するサービスで、Model Context Protocolを通じてプロンプトに直接統合され、LLMが古い情報を使用する問題を解決します。
Kubectl MCPツールは、Model Context Protocol (MCP)に基づくKubernetesインタラクションツールで、AIアシスタントが自然言語でKubernetesクラスターと対話できるようにします。
NotteはオープンソースのフルスタックネットワークAIエージェントフレームワークで、ブラウザセッション、自動化されたLLM駆動エージェント、ウェブページの監視と操作、資格情報管理などの機能を提供し、インターネットをエージェントに優しい環境に変え、自然言語でウェブサイトの構造を記述することでLLMの認知負荷を軽減することを目的としています。
Perplexity AI APIをベースにしたMCPサーバーで、Claudeデスクトップクライアントにウェブ検索機能を提供します。
Wren Engineは、MCPクライアントとAIエージェント向けの意味エンジンで、意味層のサポートを提供し、AIが企業のデータモデルとビジネスロジックを正確に理解できるようにします。複数のデータソースをサポートし、MCPクライアントに組み込まれており、データのやり取りの正確性と管理を保証します。
Smithery CLIは、Model Context Protocol (MCP)サーバーを管理するコマンドラインツールで、複数のAIクライアントをサポートし、MCPサーバーのインストール、アンインストール、表示、実行機能を提供します。