【AI新聞】へようこそ!ここは毎日、人工知能の世界を探索するためのガイドです。毎日、AI分野のホットなコンテンツをお届けし、開発者に焦点を当て、技術のトレンドや革新的なAI製品の応用を理解していただきます。新規なAI製品についてはこちらからご確認ください:https://app.aibase.com/zh1、アリババが強力な音声合成モデルQwen3-TTSをリリース、49種類の声質であなたの声のニーズを満たします!8、ChatGPTがアップルストアでのダウンロード首位に上り、アメリカユーザーのお気に入りアプリとなりました。
商湯科技がAIビデオエージェント「Seko2.0」を発表。一言入力で最大100話の一貫性のある長編アニメを低コストで自動生成可能。多話記憶と一貫性アーキテクチャにより、キャラクターや世界観の安定を実現。現在テスト公開中。....
FigmaがAI画像編集機能を発表。新機能には、オブジェクトのワンクリック削除・分離、背景の自動拡張、テキストプロンプト不要の照明・色調整が含まれます。Lasso 2.0は対象を選択後に削除や移動が可能で、背景はそのまま保持。まずFigma DesignとDrawで提供され、来年全プラットフォームに拡大予定。....
腾讯は自社開発の大規模AIモデル「混元」を「Tencent HY」に改名し、バージョン2.0にアップグレード。グローバル市場への適応と国際ユーザーへのサービス向上を目的としたブランド戦略の一環。....
専門のAI画像生成とエディターで、2 - 5秒で2K/4Kの高品質画像を生成し、多言語に対応しています。
Seedance 2.0は画像とテキストを専門的な品質を持つ映画レベルのAIビデオに変換することができます。
AIメールマーケティングツールで、メールの作成、自動化プロセスの設定、インタラクティブ要素の追加が可能で、コンバージョン率を向上させます。
再定義されたガールフレンド関係を体験し、独自のAIガールフレンドと意味ある会話を楽しんでください。
Google
$0.49
入力トークン/百万
$2.1
出力トークン/百万
1k
コンテキスト長
Xai
$1.4
$3.5
2k
Anthropic
$105
$525
200
$0.7
$2.8
$7
$35
$17.5
Alibaba
-
$3.9
$15.2
64
Bytedance
$0.8
$2
128
Baidu
Openai
$0.4
Clemylia
Gheya-1はLES-IA-ETOILESエコシステムにおける次世代の基礎言語モデルで、2.02億のパラメータを持ち、旧版のSmall-laminaシリーズのアップグレード版です。このモデルは専門的な微調整用に設計されており、人工知能、専門言語モデル、生物学の分野で対象的な訓練を行っています。
vanta-research
Atom-Olmo3-7Bは、Olmo-3-7B-Instructをベースにファインチューニングされた言語モデルで、協調型問題解決と創造的な探索に特化して設計されています。このモデルは、複雑な問題を扱う際に、熟慮された構造化分析を提供し、同時に魅力的な会話スタイルを維持し、Apache 2.0オープンソースライセンスを持っています。
HIT-TMG
Uni-MoE 2.0-Imageは、Uni-MoE 2.0-Omniをベースに派生したビジュアル生成モデルで、ビジュアル生成データで特別に微調整され、強力な画像生成と編集能力を備えています。
Uni-MoE 2.0-Omniは、ライチ科技(Lychee)が発表した完全オープンソースの全モーダリティモデルで、全モーダリティ3D RoPEと動的容量エキスパート混合アーキテクチャを採用し、言語を中心としたマルチモーダリティ理解、推論、生成能力を大幅に向上させました。このバージョンには、全モーダリティ理解とオーディオおよび画像生成能力が統合されています。
allenai
Olmo 3は、Allen Institute for AI (Ai2)によって開発された全く新しい32Bパラメータの言語モデルファミリーで、Base、Instruct、Thinkなどのバリエーションが含まれています。このモデルはDolma 3データセットを基に訓練され、65,536の長文脈処理をサポートし、言語モデル科学の発展を推進することを目的としています。モデルは完全にオープンソースで、Apache 2.0ライセンスに従っています。
Mungert
gpt-oss-safeguard-20bは、GPT-OSS-20bをファインチューニングした安全推論モデルで、大規模言語モデルの入出力フィルタリング、オンラインコンテンツのラベリング、および信頼と安全のユースケースのオフラインラベリングに特化しています。このモデルはApache 2.0ライセンスを採用しており、カスタムポリシーと透明な決定プロセスをサポートしています。
lefromage
これはQwen3-Next-80B-A3B-InstructモデルのGGUF量子化形式のバージョンで、lefromageによって提供されています。このモデルは800億パラメータの大規模言語モデルで、Apache 2.0ライセンスを採用し、テキスト生成タスクをサポートしています。GGUF形式はローカルデバイスでのデプロイと実行が容易です。
textcleanlm
これはunsloth/gpt-oss-20b-BF16ベースモデルに基づく内容忠実モデルで、元のテキストを簡潔で明瞭なMarkdown形式に変換するために特別に設計されています。モデルはApache 2.0ライセンスを採用し、主に英語のテキスト処理をサポートしています。
numind
NuExtract 2.0は、NuMindによって開発された、構造化情報抽出に特化したマルチモーダルモデルです。テキストと画像の入力をサポートし、多言語処理能力を備えており、JSONテンプレートに基づいて入力内容から構造化情報を抽出することができます。
NuExtract 2.0は、NuMind社が構造化情報抽出タスク用に特別にトレーニングした一連のマルチモーダルモデルです。この4BバージョンはQwen2.5-VL-3B-Instructをベースに構築されており、テキストと画像の入力をサポートし、多言語処理能力を備え、非構造化データから構造化情報を抽出することができます。
inclusionAI
Ring-mini-2.0はLing 2.0アーキテクチャを基に深度に最適化された高性能推論型MoEモデルで、総パラメータが160億、活性化パラメータが14億に過ぎないが、100億規模以下の密集モデルと同等の総合推論能力を実現しています。論理推論、コード生成、数学タスクにおいて優れた性能を発揮し、12.8万の長文脈処理と毎秒300以上のトークンの高速生成をサポートしています。
Ling 2.0はMoEアーキテクチャに基づく大規模言語モデルファミリーで、最初のバージョンであるLing-mini-2.0はパラメータ規模がコンパクトでありながら強力な機能を備え、複雑な推論と命令遵守において優れた性能を発揮します。1/32の活性化率のMoEアーキテクチャを採用し、卓越した性能と高効率な動作を完璧に結びつけています。
mlx-community
これはMLXフレームワークに基づく4ビット量子化大規模言語モデルで、スイスの人工知能研究所によって開発され、多言語テキスト生成タスクをサポートし、Apache - 2.0ライセンスで公開されています。
lmstudio-community
Seed - OSS - 36B - InstructはByteDance - Seedによって開発された大規模言語モデルで、パラメータ数は360億に達し、Apache 2.0オープンソースライセンスを採用しています。このモデルはtransformersライブラリに基づいて構築され、vllmとmlx技術の最適化をサポートし、特にApple Siliconチップに対して8ビット量子化処理を行い、効率的なテキスト生成能力を提供します。
Immac
NetaYume Lumina Image 2.0はテキストから画像への拡散モデルで、GGUF形式で量子化処理されており、テキスト記述を画像に変換することができます。このモデルは最適化されており、生成品質を維持しながらメモリ使用量を削減し、パフォーマンスを向上させています。
dnakov
Seed-OSS-36B-Instructは、バイトダンスによって開発された360億パラメータの大規模言語モデルであり、MLXフレームワークに基づいて最適化され、テキスト生成タスクに特化しています。このモデルは英語と中国語の両方をサポートし、Apache 2.0オープンソースライセンスを採用しており、強力な指令追従とコンテンツ生成能力を備えています。
0xShonen
GPT-OSS-20BはOpenAIがリリースしたオープンウェイトモデルで、強力な推論、エージェントタスク、および多様な開発者のユースケースに特化して設計されています。このモデルは21Bのパラメータ(うち3.6Bがアクティブパラメータ)を持ち、低遅延推論とローカルデプロイをサポートし、Apache 2.0ライセンスを採用しており、実験、カスタマイズ、および商用デプロイに自由に使用できます。
giladgd
GPT-OSS-120b-GGUFはOpenAIが公開した1200億パラメータのオープンソースのテキスト生成モデルで、Apache 2.0の緩やかなライセンスを採用し、柔軟な推論強度の設定と完全な思考過程のアクセスをサポートし、ネイティブ関数呼び出し、ウェブ閲覧、コード実行機能を備えています。
GPT-OSS-20b-GGUFは、OpenAIのGPT-OSS-20bモデルに基づく量子化バージョンで、Apache 2.0許諾契約書を採用しており、緩やかな使用条件を持っています。このモデルはテキスト生成タスクをサポートし、完全な思考過程の推論能力を備えており、ネイティブのMXFP4量子化が行われているため、さまざまなメモリ条件下で効率的に動作します。
lodestones
Chroma1-HDはFLUX.1-schnellアーキテクチャに基づくテキストから画像生成の基礎モデルで、89億のパラメータを持ち、Apache 2.0オープンソースライセンスを採用しています。このモデルは微調整用に特別に設計されており、開発者や研究者に強力な画像生成の基礎を提供し、様々な専門的なビジュアルコンテンツの作成をサポートします。
WordPress MCPサーバーは、JSON - RPC 2.0プロトコルを通じてWordPress REST APIとやり取りし、クロスプラットフォームでの実行をサポートします。
JSON - RPC 2.0ベースのクロスプラットフォームノート管理サービスで、コマンドラインとバックグラウンドサービスの2つの動作モードをサポートし、スレッドセーフなノート操作と要約生成機能を提供します。
Kernel MCP ServerはModel Context Protocol (MCP)に基づくオープンソースサーバーで、AIアシスタントがKernelプラットフォームのツールとブラウザー自動化機能に安全にアクセスできるようにします。クラウドアプリケーションのデプロイ、ヘッドレスブラウザーの制御、ドキュメント検索などの機能をサポートし、OAuth 2.0認証を採用してセキュリティを確保しています。
Python Alfresco MCP Serverは、FastMCP 2.0フレームワークに基づいて構築されたAlfrescoコンテンツサービスモデルコンテキストプロトコルサーバーで、全文検索、ドキュメント管理、メタデータ操作など15種類のツールを提供し、STDIO/HTTP/SSEの複数の伝送プロトコルをサポートし、Alfrescoコミュニティ版とエンタープライズ版に適しています。
TypeScriptベースのWordPressモデルコンテキストプロトコル(MCP)サーバーで、AIシステムに標準化されたインターフェースを提供し、JSON - RPC 2.0を通じてWordPressサイトとの安全なプログラム的な相互作用を実現します。
標準のOAuth 2.0フローでLinearへのアクセスを承認し、MCPクライアント上で問題の作成、更新、一覧表示機能を実現します。
このプロジェクトは、APIMaticに基づくOpenAPI仕様検証サービスを提供し、MCPプロトコルを通じてClaudeなどのツールとの統合を実現し、OpenAPI 2.0/3.0ファイルのJSON/YAML形式の検証をサポートします。
FastMCPフレームワークに基づくGoogle Ads API統合サーバーで、自動OAuth 2.0認証、GAQLクエリ、キーワード研究機能を提供し、Claude DesktopなどのMCPクライアントとのシームレスな接続をサポートします。
Roo CodeにGemini 2.0 Flashの画像生成機能を提供するMCPサービス
強化版XプラットフォームMCPサーバーで、OAuth 2.0認証、メディアアップロード、APIのレート制限をサポートし、ツイートの投稿、検索、削除などの機能を提供します。
ElixirベースのMCPプロトコルテストサーバー実装で、JSON - RPC 2.0標準をサポートし、プラグイン可能な検証ミドルウェアとスキーマ駆動の検証を提供します。
このプロジェクトは、pyATSとGenieに基づくMCPサーバーを実装し、JSON - RPC 2.0プロトコルを通じて構造化、モデル駆動型のネットワーク機器とのやり取り機能を提供します。安全なCLIコマンドの実行、設定変更、およびデータ収集をサポートし、コンテナ化またはLangGraph統合シナリオに適しています。
pyATSに基づくMCPサーバーは、JSON - RPC 2.0プロトコルを通じて構造化されたネットワーク機器のやり取りを実現します。
TypeScriptベースのMCPサーバー実装で、Google Gemini APIを直接呼び出すことでGeminiモデルを統合し、最新のGemini 2.0 Flashモデルをサポートし、会話コンテキストを維持します。
Scala 3で書かれたMCPプロトコルサーバーで、様々なツール機能をサポートします。
OAuth 2.0認証に基づく本番環境向けのAirtable MCPサーバーで、完全なAirtable APIカバレッジと標準化されたMCPインターフェイスを提供し、AIアシスタントがAirtableとやり取りできるようにします。
JSON - RPC 2.0プロトコルを通じてMicrosoft Paintを制御するサーバーで、Paintプログラムの起動、グラフィックの描画、色とツールの属性の設定などの機能をサポートします。
V2EX公式API 2.0をラップしたサーバーで、通知管理、ユーザー情報、ノードトピックなどのインターフェース機能を提供し、npmを通じてグローバルにインストールし、トークンを設定して使用できます。
AWS Lambda、CloudFront、Cognito認証に基づくサーバーレスMCPプロトコルの実装プロジェクトで、完全なクラウドMCPサーバーインフラストラクチャを提供し、OAuth 2.0認証、リアルタイムストリーム転送、拡張可能なアーキテクチャをサポートします。
Gemini Flash 2.0ベースのコマンドラインコード要約ツールで、MCPサーバーの統合をサポートします