AIの最先端を探索、業界トレンドを完全マスター
毎日更新!AIホットトピックス&業界最前線
精確な製品選定&多角的市場調査
話題のAI製品総合力&バズ度ランキング(年間/月間/デイリー)
AI製品を登録して、認知度アップ&ユーザー獲得を加速!
AIツール総合ナビ!あなたにピッタリのツールが見つかる
ワンストップGEOブランドインサイト
あなたのブランドがAI検索でどのように評価され、表示されているかをワンクリックで確認します
AIプラットフォーム上のブランド認知度を測定する
ユーザーがAIに尋ねるトレンド質問を発掘し、コンテンツ制作を最適化
プロモ記事引用を素早く評価、データで意思決定を支援
独自のGEOシステムを所有し、プロフェッショナルなGEO最適化サービスプロバイダーになりましょう
GEOサービスにより、御社の企業やブランドのAI検索における支配的な表示を実現
人気AI-MCPサービスを集約、あなたに適したサービスを迅速発見
MCPクライアントに簡単接続、強力なAI機能を呼び出し
MCP使用テクニックを学習、入門から上級まで
人気MCPサービス性能ランキング、最適選択をサポート
あなたのMCPサービスを公開・プロモーション
MCPサービスを自由にテスト、オンラインで迅速体験
MCPサービス迅速テスト、迅速リリース
主要なLLM APIを一つのインターフェースで。
全種類AIモデル完備!開発から研究まで、あなたのニーズを完全サポート
信頼できるAIモデルパートナーを見つけよう!安心のサポート体制
人気AI大規模モデル性能・注目度・年/月/日ランキング
AI大規模モデル徹底比較!あなたにピッタリのモデルが見つかる
AIモデルのコストを正確に把握!スマートな予算計画で無駄を削減
マルチモデルリアルタイム評価、モデル出力結果迅速比較
PC環境でDeepSeek・Llamaが動作するか無料診断
大規模モデルの計算力要件を入力すると、最適なGPU・メモリ・サーバー構成を即座に推薦
Baseline Recipe for VoicePrivacy Challenge 2020: https://www.voiceprivacychallenge.org/vp2020/docs/VoicePrivacy_2020_Eval_Plan_v1_3.pdf
WhisperX: Automatic Speech Recognition with Word-level Timestamps (& Diarization)
A scalable generative AI framework built for researchers and developers working on Large Language Models, Multimodal, and Speech AI (Automatic Speech Recognition and Text-to-Speech)
Offline speech recognition API for Android, iOS, Raspberry Pi and servers with Python, Java, C# and Node
Easy-to-use Speech Toolkit including Self-Supervised Learning model, SOTA/Streaming ASR with punctuation, Streaming TTS with text frontend, Speaker Verification System, End-to-End Speech Translation and Keyword Spotting. Won NAACL2022 Best Demo Award.
A PyTorch-based Speech Toolkit
Speech-to-text, text-to-speech, speaker diarization, speech enhancement, and VAD using next-gen Kaldi with onnxruntime without Internet connection. Support embedded systems, Android, iOS, HarmonyOS, Raspberry Pi, RISC-V, x86_64 servers, websocket server/client, support 11 programming languages
Multilingual Voice Understanding Model
? wukong-robot 是一个简单、灵活、优雅的中文语音对话机器人/智能音箱项目,支持ChatGPT多轮对话能力,还可能是首个支持脑机交互的开源智能音箱项目。
Context aware, pluggable and customizable data protection and de-identification SDK for text and images
Nexa SDK is a comprehensive toolkit for supporting GGML and ONNX models. It supports text generation, image generation, vision-language models (VLM), Audio Language Model, auto-speech-recognition (ASR), and text-to-speech (TTS) capabilities.