ElevenLabsは、Music v2音楽生成モデルをリリースしました。前バージョンと比較して3つの大きな進歩を実現したものです:動的な曲風の切り替えをサポートし、音楽編成の複雑さと歌唱表現を向上させました。新しいモデルでは、創作プロセスをブロック式にし、細粒度のワークフローを提供します。アーティストは異なるセクションのスタイルを柔軟に調整でき、単純なテキストから音声を生成するのではなく、音楽創作の柔軟性と表現力を著しく強化します。
アップル社は最近公開した手紙で、AI生成音楽に対して広く受け入れる姿勢を表明し、一括りにブロックする方針ではないが、厳格な業界統治を強調している。データによると、現在AI音楽のApple Musicでの再生数割合は1%未満であり、わずかではあるが、同社はすでに先手を打っており、革新と著作権保護のバランスを取っている。
SpaceXAI(旧xAI)は2月の社名変更後、人材流出に直面。50人以上の主要研究者とエンジニアが退職し、プレトレーニングチームは数人のみに。元責任者の庄俊堂などキーパーソンがMetaやMira Murati新設のThinking Machine Labsに移籍。....
Metaは2026年5月13日、WhatsAppと独立Meta AIアプリに「シークレットモード」を導入。隔離環境でAIと対話可能にし、プライバシーデータの保存問題を解決。有効にすると会話履歴は保存されず、ウィンドウやアプリを閉じると自動的にセッションが終了し、コンテキスト情報が消去される。....
Mubert AI音楽ジェネレーター。数秒でオリジナル音楽を作成し、無料で試用できます。
無料のAI音楽生成ツールで、テキストの指示に基づいて曲を創作し、スタイルを選択し、ダウンロードして共有できます。
Mac用の音声優先アプリで、会議記録、音声メモ、音声入力をサポートし、ローカルモードは無料です。
YouTube、ポッドキャスト、研究論文などの内容を自動的に文字起こしして要約し、毎日メールで重要な洞察を配信します。
MuXodious
Gemma 3n E4B ITは、Googleが開発した軽量マルチモーダルオープンモデルで、Geminiモデルと同じ研究に基づいて構築されています。このモデルは、テキスト、オーディオ、ビジュアル入力をサポートし、様々なタスクに適用できます。MatFormerアーキテクチャを採用して、効率的なパラメータ利用を実現しています。
Mungert
MiroThinker v1.0はオープンソースの研究エージェントで、モデルレベルの対話型拡張により、ツール強化推論と情報検索能力を向上させます。このモデルは複数のベンチマークテストで優れた性能を発揮し、長文脈と深度のある多段階分析をサポートします。
mudasir13cs
これはGoogle Gemma - 3 - 4B - ITモデルを微調整したテキスト生成モデルで、デモンストレーションテンプレートのメタデータに基づいて多様で関連性のある検索クエリを生成するために特別に設計されています。このモデルはLoRAアダプタを使用して効率的に微調整されており、構造化文書のフィールド適応型密集検索フレームワークの重要な構成要素です。
aquif-3.5シリーズのトップモデルで、高度な推論能力と100万トークンの大規模コンテキストウィンドウを備え、複数のベンチマークテストで卓越した性能を発揮し、AAII総合スコアが60点に達します。
hetbhagatji09
これはMiniLMアーキテクチャに基づく軽量級の文埋め込みモデルで、高品質の文ベクトル表現を生成するために特別に設計されています。モデルはMultipleNegativesRankingLossを使用してトレーニングされ、文の類似度計算と特徴抽出タスクで優れた性能を発揮します。
gpt-oss-safeguard-20bは、GPT-OSS-20bをファインチューニングした安全推論モデルで、大規模言語モデルの入出力フィルタリング、オンラインコンテンツのラベリング、および信頼と安全のユースケースのオフラインラベリングに特化しています。このモデルはApache 2.0ライセンスを採用しており、カスタムポリシーと透明な決定プロセスをサポートしています。
PokeeResearch-7Bは、Pokee AIによって開発された70億パラメータの深度研究エージェントモデルです。AIフィードバック強化学習(RLAIF)と強力な推論フレームワークを組み合わせ、ツール強化型大規模言語モデルにおいて信頼性が高く、アライメントされ、拡張可能な研究レベルの推論を実現し、複雑な多段階研究ワークフローに適しています。
Nanonets-OCR2-1.5B-exp GGUFは強力な画像からMarkdownへのOCRモデルで、ドキュメントを構造化されたMarkdown形式に変換し、インテリジェントコンテンツ認識とセマンティックマーキングを行い、多言語のドキュメント処理をサポートします。
Fathom-Search-4B GGUFは、テキスト生成タスク用に特別に開発された強力なツールです。特定の基礎モデルと技術に基づいて生成され、検索集中型のベンチマークテストで卓越した性能を発揮し、長期間の情報検索と合成の問題を効果的に解決できます。
Nanonets-OCR2-3B GGUFモデルは、文書処理用に設計された強力なツールで、さまざまな文書をスマートに構造化されたMarkdown形式に変換でき、OCR、画像からのテキスト変換、PDFからのMarkdown変換、ビジュアル質問応答など、さまざまな高度な識別と処理能力を備えています。
通義深度研究30Bは300億パラメータを持つ大規模言語モデルで、長周期、深度情報検索タスクに特化して設計されています。このモデルは複数の知能検索ベンチマークテストで優れた成績を収め、革新的な量子化手法を用いて性能を向上させ、知能事前学習、監督微調整、強化学習をサポートしています。
LFM2はLiquid AIによって開発された次世代のハイブリッドモデルで、エッジAIとデバイス端末のデプロイメントに特化して設計されており、品質、速度、メモリ効率の面で新しい基準を確立しています。このモデルは革新的なハイブリッドLiquidアーキテクチャを採用し、乗算ゲートと短い畳み込みを備えており、多言語処理をサポートしています。
MiniCPM4.1-8B GGUFはエッジデバイス向けに設計された高効率大規模言語モデルで、モデルアーキテクチャ、学習データ、学習アルゴリズム、推論システムの4つの重要な次元で体系的な革新を行い、極限までの効率向上を実現しました。65,536個のトークンの文脈長と混合推論モードをサポートします。
Hunyuan-MT-7Bは、騰訊が開発した7Bパラメータの翻訳モデルで、5種類の中国少数民族語を含む33言語の相互翻訳をサポートしています。このモデルはWMT25の試合で優れた成績を収め、31の言語カテゴリのうち30カテゴリで1位を獲得し、事前学習から統合最適化までの完全な翻訳モデル学習フレームワークを提案しました。
NVIDIA Nemotron Nano 12B v2はNVIDIAによって開発された大規模言語モデルで、Mamba2-Transformer混合アーキテクチャを採用し、120億のパラメータを持っています。このモデルは多言語処理をサポートし、複数のベンチマークテストで優れた成績を収めており、特に推論タスクに長けており、実行時の推論予算制御をサポートしています。
混元翻訳モデルは、騰訊が開発した先進的な機械翻訳システムで、翻訳モデルの混元-MT-7Bと統合モデルの混元-MT-Chimeraを含んでいます。このモデルは、中国語、英語、フランス語などの主要言語や中国の5つの少数民族語を含む33言語の相互翻訳をサポートし、WMT25競技で優れた成績を収めています。
SamilPwC-AXNode-GenAI
PwC-Embedding-exprは、multilingual-e5-large-instruct埋め込みモデルをベースに訓練された韓国語最適化バージョンで、精心に設計された強化方法と微調整戦略により、韓国語の意味テキスト類似度タスクでの性能を向上させています。
Jackmin108
Moonlightは、Muonオプティマイザーを用いて訓練された、総パラメータ16B、活性化パラメータ3Bのハイブリッドエキスパート(MoE)モデルで、5.7Tのトークンを使って訓練されました。このモデルは現在のパレートフロンティアを改善し、より少ない訓練FLOPでより良い性能を実現し、複数のベンチマークテストで優れた結果を示しています。
minpeter
これは🤗 Transformersライブラリに基づいて構築された、kozistr/pytorch_optimizer内のMuon実装エラーを検出するための専用の学習モデルです。このモデルは、オプティマイザー実装内の潜在的な問題を識別および特定し、開発者がコード品質を改善するのを支援します。
AnasAlokla
これは強力な多言語、多ラベル感情分類モデルで、テキストを分析して27種類の異なる感情と中性カテゴリを識別でき、複数の感情を同時に検出し、異なる言語のソースからの微妙なテキスト表現を効果的に理解できます。
Open Multi - Agent Canvasは、旅行計画、研究、一般的なタスク処理に使用される、動的な会話で複数のエージェントを管理することをサポートするオープンソースの多エージェントチャットインターフェースです。
Mux Node APIライブラリは、サーバーサイドのTypeScriptまたはJavaScriptからMux REST APIに簡単にアクセスするためのライブラリです。完全なAPIドキュメント、型定義、エラー処理、自動ページング、JWTツール、Webhook検証などの機能を提供し、複数のランタイム環境をサポートします。
MusicMCP.AIの公式MCPサーバーで、自然言語の指示でAIアシスタント(Claudeなど)が高度なAI音楽生成プラットフォームを呼び出せます。インスピレーションモードとカスタマイズモードで曲を生成し、残高確認とヘルスチェック機能も提供します。
MUXI.aiは、オープンソースのマルチAIエージェントシステムフレームワークで、永続的なメモリ、標準化された通信プロトコル、および思考チェーン追跡機能を提供し、複数のインターフェース統合をサポートします。開発者が高度なAIアプリケーションを構築するためのモジュール型で拡張可能なプラットフォームを目指しています。
教育目的のマルチエージェントシステムのラボプロジェクトで、電子商取引と健康相談のシーンを模擬し、マルチエージェントの協調、MCPプロトコルの使用、および異なるLLMモデルの統合を展示します。
AppleScriptを通じてmacOS上のApple Musicを制御するFastMCPサーバーの実装で、再生制御、楽曲検索、再生リスト作成などの機能を提供します。
MCPプロトコルに基づくウェブページコンテンツの取得と処理ツール
マカオ科学技術大学のキャンパスシステム用に設計されたMCPサーバーで、LLMが自動的にWemustとMoodleにログインし、授業スケジュールを取得し、授業資料を照会し、待办事項を確認し、講義資料をダウンロードし、ページを自動的に開くことができます。
複数のLLMプロバイダーの並列クエリをサポートするモデル制御プロトコルサーバーで、OpenAI、Anthropic、Perplexity、GoogleのAPIを同時に呼び出して相互検証し、統一インターフェースを提供し、非同期処理をサポートします。
ResearchMCPは、Model Context Protocol (MCP)と複数の検索エンジンを組み合わせた研究ツールで、ChatGPT DeepResearchに似た研究機能を提供することを目的としています。
Agent Muxはtmuxベースのエージェントプール管理システムで、MCPプロトコルを通じてプロジェクト管理と複数エージェントの対話機能を提供し、プロジェクトの作成、切り替え、閉じる、およびエージェントの生成、制御、通信をサポートします。
MCPとlibrosaに基づく音声分析ツールで、ローカルファイル、YouTubeリンク、音声リンクの分析をサポートします。
multilspyを通じて言語サーバープロトコル(LSP)機能を提供するMCPサーバー
複数のMCPサーバーに基づくAIエージェントロボットプロジェクト
このプロジェクトはPythonベースの多MCPサーバー管理フレームワークで、SSEプロトコルを通じてGoogle Gemini APIとのやり取りを実現し、カレンダー管理とブラウザー自動化の2つの主要な機能モジュールを備えており、設定ファイルを通じて複数のサービスを動的にロードすることをサポートしています。
マルチクラスタMCPサーバーは、生成AIシステムが複数のKubernetesクラスタと相互作用するためのゲートウェイを提供し、リソース操作、クラスタ管理、および監視をサポートします。
Cursor MCPは、ClaudeデスクトップアプリとCursorエディタを接続するブリッジツールで、AI駆動の自動化プログラミング、マルチウィンドウ管理、およびクロスプラットフォーム操作をサポートし、標準化されたプロトコルを通じて複数のAIサービスとの統合を実現します。
Multi - Model AdvisorはOllamaに基づくマルチモデル相談システムで、複数のAIモデルの異なる見解を統合することで、問題に対してより包括的な解答を提供します。「アドバイザー委員会」モードを採用し、Claudeが複数のAI視点を総合して回答を生成することができます。
Murekaモデルコンテキストプロトコル(MCP)は、強力な歌詞、歌曲、およびバックグラウンドミュージック生成APIとのインタラクションをサポートする公式サーバーです。このサーバーは、MCPクライアント(Claude DesktopやOpenAI Agentsなど)が歌詞、歌曲、およびバックグラウンドミュージック(楽器演奏)を生成することを可能にします。
TIDAL MCPは個性化された音楽推薦システムで、LLMを使ってユーザーが定義した条件でTIDAL曲庫をフィルタリングし、再生履歴や歌单に基づくインテリジェントな推薦と歌单管理をサポートします。