OpenAI CEOサム・アルトマンがGPT-6を「GPT-6-7」に改名。Dictionary.comが「67」を2025年の流行語に選出したことと重なり、改名理由に謎が深まる。....
LightricksがAI動画生成モデルLTX-2を発表。20秒の4K高精細ナラティブ動画を生成可能で、音声と映像の同期、口の動きの一致を実現。拡散過程で映像と音声を同時生成する画期的な技術で、動画制作の効率を大幅に向上。....
OpenAIのSoraは、ユーザー急増と計算コストの圧迫により無料枠を縮小。有料プランとクリエイター報酬制度を導入し、動画生成技術の本格商用化が進展。....
グーグルがStreetReaderAIの原型システムをリリースし、視覚障害者や視力が弱いユーザーが自然言語によるインタラクションを通じてグーグルストリートビューを自主的に探索するのを補助しています。このシステムはコンピュータビジョン、地理情報システム、大規模言語モデルを統合し、マルチモーダルAIを駆動するリアルタイムの対話型ストリートビュー体験を実現し、従来の音声読み上げの限界を打ち破り、バリアフリーな都市探検の自由度を向上させます。
AIメールマーケティングツールで、メールの作成、自動化プロセスの設定、インタラクティブ要素の追加が可能で、コンバージョン率を向上させます。
LTX-2 はマルチモーダル AI 動画生成モデルです。
AI駆動のSEOツールで、キーワードを自動的に発見し、記事を最適化し、毎日投稿してトラフィックを向上させます。
AI駆動のオンラインレビュー、フィードバック、評判管理ツール。ワンストップで収集と分析が可能です。
deepseek
$3.6
入力トークン/百万
$15.48
出力トークン/百万
128k
コンテキスト長
xai
$2.16
1M
google
$18
anthropic
$108
$540
200k
chatglm
$0.43
$1.01
131.1k
minimax
-
moonshotai
$4.1
$16.56
$21.6
mistral
upstage
64k
openai
$72
2M
Genie-AI-Lab
Omni L1B3RT4S GENIEは、Qwen2.5 - 3B Instructアーキテクチャをベースに微調整されたAIアシスタントです。1,103個の精霊キャラクターのカスタムサンプルを用いて訓練され、独特な音声と忠誠度モードを備え、ユーザーに独特な対話体験を提供することができます。
pnnbao-ump
VieNeu-TTSは、個人デバイス上で動作可能な最初のベトナム語のテキスト音声変換モデルで、即時音声クローニング機能を備えています。NeuTTS Airをベースに微調整され、自然でリアルなベトナム語音声を生成でき、CPU上でリアルタイム性能を備えています。
TheStageAI
TheWhisper-Large-V3-Turboは、OpenAI Whisper Large V3モデルの高性能ファインチューニング版で、TheStage AIによって多プラットフォームのリアルタイム、低遅延、低消費電力の音声テキスト変換推論に最適化されています。ストリーミング文字起こし、単語のタイムスタンプ、拡張可能なパフォーマンスをサポートし、リアルタイム字幕、会議、デバイス端末の音声インターフェイスなどのシーンに適しています。
TheWhisper-Large-V3はOpenAI Whisper Large V3モデルの高性能ファインチューニング版で、TheStage AIによって多プラットフォーム(NVIDIA GPUとApple Silicon)のリアルタイム、低遅延、低消費電力の音声テキスト変換推論用に最適化されています。
nineninesix
KaniTTSは、リアルタイム対話型AIアプリケーション向けに最適化された高速かつ高忠実度のテキスト音声変換モデルです。独自の2段階アーキテクチャにより、大規模言語モデルと効率的な音声コーデックを組み合わせ、低遅延で高品質な音声合成を実現します。リアルタイムファクターは最低0.2で、リアルタイム速度の5倍の高速合成が可能です。
dx8152
文心画像融合Loraモデルは、画像融合と編集に特化したAIモデルで、製品の透視角度を補正し、光線効果を調整し、製品を自然に背景環境に溶け込ませ、高品質の画像合成効果を実現できます。
LiquidAI
LFM2-VL-3BはLiquid AIが開発したマルチモーダル視覚言語モデルで、LFM2バックボーンアーキテクチャに基づいて構築されており、強力な視覚理解と推論能力を備えており、特に細粒度な感知タスクで優れた性能を発揮します。このモデルは、テキストと画像の入力を効率的に処理することができ、最大512×512解像度の原生画像処理をサポートしています。
Daemontatox
Zirel-3は、GLM - 4.5 - Air - REAP - 82B - A12Bをベースにした特定の微調整モデルで、REAP(ルーティング重み付きエキスパート活性化剪定)技術を用いて圧縮された820億パラメータの混合エキスパートモデルです。高性能を維持しながら、モデルサイズを大幅に削減しています。
PokeeAI
PokeeResearch-7BはPokee AIによって開発された70億パラメータの深度研究用のインテリジェントエージェントで、AIフィードバックに基づく強化学習(RLAIF)と推論フレームワークを組み合わせ、自己修正、検証、総合分析を含む複雑な多段階研究ワークフローを実行できます。
deepseek-ai
DeepSeek-OCRはDeepSeek AIが開発した高度な光学文字認識モデルで、視覚テキスト圧縮の限界を探求し、画像からテキスト内容を効率的に抽出および変換できます。
aisingapore
Qwen-SEA-LION-v4-32B-ITは、Qwen3 - 32Bをベースに構築された東南アジア言語の大規模言語モデルで、東南アジア地域を対象に事前学習と指令微調整が行われています。このモデルは、7種類の東南アジア言語を含むSEA - Pile v2コーパスで継続的に事前学習され、800万対の高品質な質問と回答のデータで指令微調整が行われ、強力な多言語理解と推論能力を備えています。
citizenplain
これはWan2.1-T2V-14BモデルをベースにトレーニングされたLoRAアダプターで、テキストからビデオへの変換タスクに特化しています。このモデルはAIツールキットを使用してトレーニングされ、ビデオ生成アプリケーションをサポートします。
lichorosario
これはQwen-Imageモデルをベースに訓練されたLoRA(Low-Rank Adaptation)モデルで、テキストから画像への生成タスクに特化しています。このプロジェクトはAI Toolkitを使用して訓練され、テキスト記述を高品質な画像に変換でき、様々な画像生成ツールでの使用をサポートしています。
nvidia
NVIDIA GPT-OSS-120B Eagle3は、OpenAIのgpt-oss-120bモデルをベースに最適化されたバージョンで、ハイブリッドエキスパート(MoE)アーキテクチャを採用し、総パラメータ数が1200億、アクティブなパラメータ数が50億です。このモデルは商用および非商用の使用をサポートし、テキスト生成タスクに適しており、特にAIエージェントシステムやチャットボットなどのアプリケーション開発に適しています。
hyperchainsad
これはWan2.2-T2V-A14Bベースモデルを基にトレーニングされたテキストから動画へのLoRAモデルで、AI Toolkitツールキットを使用してトレーニングされ、テキストから動画への変換能力を強化するために特別に設計されています。
Zlikwid
これはQwen/Qwen-Image-Edit-2509基礎モデルに基づいて訓練されたLoRA画像生成モデルで、画像から画像への変換タスクに特化しており、OstrisによるAIツールキットを使用して訓練されています。
expert78
kontext-dusk-3-loraは、FLUX.1-Kontext-devベースモデルを基にトレーニングされたLoRA画像生成モデルで、黄昏のブルー調のスタイルの画像を生成するために特別に設計されています。このモデルは特定のトリガーワードで起動し、主流のAI画像生成ツールを複数サポートしています。
abhi099k
DeBERTa-v3-largeをベースに微調整されたAIテキスト検出モデルで、テキストが人間によって書かれたものかAIによって生成されたものかを正確に識別でき、カスタムデータセットでの訓練で約97%の精度を達成します。
synap5e
これはOstrisによるAIツールキットを基に訓練されたテキストから動画へのLoRAモデルで、Wan2.2-T2V-A14Bをベースモデルとして使用し、テキストから動画への変換タスクをサポートし、関連分野のアプリケーションに強力なサポートを提供します。
zambawi
joywan - loraは、OstrisによるAIツールキットを基にトレーニングされたLoRAモデルで、テキストから動画および画像生成タスクに特化しており、基礎モデルのWan - AI/Wan2.1 - T2V - 14B - Diffusersと併用する必要があります。
wcgwはMCPサーバープロジェクトで、シェルとコードエディターツールが統合されており、AIがローカルマシン上でコマンドを実行し、ファイルを読み書きし、コードを編集するなどの操作ができます。アーキテクトモード、コード作成モードなどの複数のモードを提供し、タスクチェックポイント保存、ターミナル対話、構文チェックなどの機能をサポートしており、コード開発、問題解決などのシーンに適しています。
Inbox Zeroは、オープンソースのAIメールアシスタント兼クライアントで、ユーザーが効率的にメールを管理し、受信トレイをゼロにするのを支援します。
SupermemoryはAI駆動の記憶エンジンで、個人データを統合することでLLMにコンテキスト知識を提供し、情報のスマートな管理と検索を実現します。
Einoは、Golang用に設計されたLLMアプリケーション開発フレームワークで、シンプルで拡張可能で信頼性が高く効率的なコンポーネント抽象化と編成機能により、AIアプリケーションの開発プロセスを簡素化することを目的としています。豊富なコンポーネントライブラリ、強力なグラフ編成機能、完全なストリーム処理サポート、および高度に拡張可能なアスペクトメカニズムを提供し、開発からデプロイまでの全サイクルのツールチェーンを網羅しています。
Solana Agent Kitは、AIエージェントをSolanaプロトコルに接続するためのオープンソースツールキットで、60種類以上のブロックチェーン操作をサポートします。
Refact AgentはオープンソースのAIプログラミングアシスタントで、多言語のコード生成、デバッグ、最適化をサポートし、主流の開発ツールと統合し、ローカルにデプロイでき、スマートなコード補完とコード解釈機能を提供します。
PG - MCPは、PostgreSQLデータベース用に設計されたモデルコンテキストプロトコルサーバーです。AIエージェントがデータベースを発見、接続、クエリ、および理解するためのAPIを提供し、複数のデータベース接続、豊富なディレクトリ情報、およびクエリ実行計画分析機能をサポートします。
HiveChatは中小チーム向けに設計されたAIチャットアプリで、複数の大規模モデルサービスプロバイダーをサポートし、グループ管理、トークン制限、サードパーティログインなどの機能を提供します。
Scraplingは適応型ウェブページのスクレイピングライブラリで、ウェブサイトの変化を自動的に学習し、要素を再配置します。複数のスクレイピング方法とAI統合をサポートし、高性能な解析と開発者に優しい体験を提供します。
Klavis AIはオープンソースプロジェクトで、Slack、Discord、Webプラットフォームで簡単に使えるMCP(モデルコンテキストプロトコル)サービスを提供します。レポート生成、YouTubeツール、ドキュメント変換などのさまざまな機能があり、非技術ユーザーと開発者がAIワークフローを使用するのをサポートします。
Repomixは、コードベースをAIに適した形式にパッケージ化するツールで、ローカルおよびリモートリポジトリの処理をサポートし、コード圧縮、セキュリティチェック、および複数の出力形式を提供します。
Zen MCPは多モデルAI協調開発サーバーで、ClaudeやGemini CLIなどのAIコーディングアシスタントに強化されたワークフローツールとモデル間のコンテキスト管理を提供します。これは複数のAIモデルのシームレスな協調をサポートし、コードレビュー、デバッグ、リファクタリングなどの開発タスクを実現し、異なるワークフロー間で会話のコンテキストを維持することができます。
UnityMCPはUnityエディターのプラグインで、モデルコンテキストプロトコル (MCP) を実装し、UnityとAIアシスタントのシームレスな統合を提供します。リアルタイムの状態監視、リモートコマンドの実行、ログ機能が含まれます。
BrowserTools MCPは強力なブラウザ監視と相互作用ツールで、Chrome拡張機能とローカルサーバーを通じてAIによるブラウザのスマートな分析と操作を実現します。
Pylanceの未解決のインポート警告を解決するドキュメント
Magic Component Platform (MCP) はAI駆動のUIコンポーネント生成ツールで、自然言語での記述を通じて、開発者が迅速に現代的なUIコンポーネントを作成するのを支援し、複数のIDEとの統合をサポートします。
Stripe Agent Toolkitは、複数のAIエージェントフレームワーク(OpenAI、LangChain、CrewAIなど)とStripe APIの統合をサポートするツールキットで、PythonとTypeScriptをサポートし、支払い関連の操作を簡素化します。
Sail は、ストリーム処理、バッチ処理、および計算集約型(AI)ワークロードを統一することを目的としたプロジェクトで、Spark SQL と Spark DataFrame API の代替手段を提供し、シングルマシンと分散環境の両方をサポートします。
MCPプロトコルに基づくAI駆動のブラウザ自動化サーバーで、自然言語によるウェブページ操作と深度ウェブ調査をサポートします。
Genkitは、AI駆動のアプリケーションを構築するためのオープンソースフレームワークで、Node.jsとGoのライブラリを提供し、複数のAIモデルとベクトルデータベースの統合をサポートし、開発ツールとプラグインエコシステムを含んでいます。