WindsurfがWave13をリリース。モデル能力、マルチエージェント連携、端末体験を強化。SWE-1.5モデル搭載で、複雑なコードタスクに対応可能。....
百度はWAVE SUMMITで文心大モデルX1.1を発表。事実性、指示追従、エージェント性能が向上。個人は公式サイト・アプリ、企業は百度智能雲で利用可能。....
AI日報:Google DeepMindがGemini 2.5 Flashを発表、高精度な画像編集と創造的機能を提供。....
バイトが新AI動画モデル「Waver1.0」を発表。テキスト/画像から動画生成可能で、既存モデルを凌駕する品質。Waver-Bench1.0とHermes Motion Testsetで優れた性能を示す。....
AI 画像および動画生成を高速化し、創造力を高めます。
Windsurf Wave 3は、開発者体験の向上に特化したAIエディターのアップデート版です。
Windsurfの大幅アップデート。インテリジェントなコード生成と最適化機能を提供します。
オンラインAI吹き替えで、動画や音声コンテンツをあらゆる言語にローカライズ
waveletdeboshir
ロシア語自動音声認識モデル、外部ngram言語モデルとビームサーチデコードをサポート、単語レベルのタイムスタンプ抽出可能
GigaAM-v2-RNNT はロシア語自動音声認識(ASR)モデルで、RNNTアーキテクチャに基づいており、音声からテキストへの変換タスクに適しています。
GigaAM-v2-CTCはCTC損失関数でトレーニングされたロシア語自動音声認識(ASR)モデルで、Hugging Face transformersライブラリを通じて利用可能です。
agentsea
PaliGemma 3B 448解像度の重みを基に、WaveUIデータセットで物体検出タスク向けに微調整された視覚言語モデル
microsoft
WaveCoderはコード領域向けの大規模言語モデルシリーズで、命令追従学習によりコード関連領域の問題を解決します。WaveCoder-Ultra-6.7Bはこのシリーズの高性能モデルです。
shiwangi27
facebook/wav2vec2-large-xlsr-53モデルをベースにファインチューニングしたヒンディー語音声認識モデルで、OpenSLRとCommon Voiceのヒンディー語データセットを使用して訓練され、16kHzサンプリングレートの音声入力をサポートします。
VCD波形ファイルを処理するためのモデルコンテキストプロトコル(MCP)サーバーで、大型の波形ファイルを分析するための信号抽出ツールを提供します。
wellenライブラリに基づくMCPサーバーで、VCD/FST形式の波形ファイルを読み取り、分析します。信号の表示、値の読み取り、イベントの検索などの機能を提供します。
WAL言語に基づくRTL波形解析MCPサーバーで、波形ファイルの信号抽出、タイミング解析、および高度な式クエリ機能を提供します
最小AI MCPサーバーは、Wavesのテキスト読み上げと音声クローニングプラットフォーム用に設計された本番グレードのModelContextProtocolサーバーで、高速で安全なAI音声ワークフローの解決策を提供します。
MCPプロトコルに基づく波形データサーバープロジェクト
ClaudeとWave会計ソフトウェアを統合するMCPサーバーで、自動化された費用追跡と収入取引の作成を行い、複数企業の管理、仕入先/顧客の検索、およびリアルタイムAPI接続をサポートします。