世界のAIイノベーションの瞬間をお見逃しなく
毎日の3分AI業界トレンド
AI業界のマイルストーン
すべてのAIハードウェアをリストアップします。
AIマネタイズ事例の共有
AI画像生成マネタイズ事例
AIビデオ生成マネタイズ事例
AIオーディオ生成マネタイズ事例
AIコンテンツ作成マネタイズ事例
最新のAIチュートリアルを無料で共有
AIウェブサイトの総訪問数ランキングを表示
トラフィックによる最も急速に成長しているAIウェブサイトを追跡
トラフィックが大幅に減少しているAIウェブサイトに焦点を当てる
AIウェブサイトの週間訪問数ランキングを表示
米国のユーザーに最も人気のあるAIウェブサイト
中国のユーザーに最も人気のあるAIウェブサイト
インドのユーザーに最も人気のあるAIウェブサイト
ブラジルのユーザーに最も人気のあるAIウェブサイト
AI画像生成ウェブサイトの総訪問数ランキング
AIパーソナルアシスタントウェブサイトの総訪問数ランキング
AIキャラクター生成ウェブサイトの総訪問数ランキング
AIビデオ生成ウェブサイトの総訪問数ランキング
GitHubの人気のあるAIプロジェクトを総スター数でランキング
GitHubの人気のあるAIプロジェクトを成長率でランキング
GitHubの人気のあるAI開発者ランキング
GitHubの人気のあるAI組織ランキング
GitHubの人気のあるDeepseekオープンソースプロジェクト
GitHubの人気のあるTTSオープンソースプロジェクト
GitHubの人気のあるLLMオープンソースプロジェクト
GitHubの人気のあるChatGPTオープンソースプロジェクト
GitHubの人気のあるAIオープンソースプロジェクトの概要
Implementation of the paper "Listen, Attend and Spell" Paper in Pytorch
WhisperX: Automatic Speech Recognition with Word-level Timestamps (& Diarization)
A scalable generative AI framework built for researchers and developers working on Large Language Models, Multimodal, and Speech AI (Automatic Speech Recognition and Text-to-Speech)
? wukong-robot 是一个简单、灵活、优雅的中文语音对话机器人/智能音箱项目,支持ChatGPT多轮对话能力,还可能是首个支持脑机交互的开源智能音箱项目。
Speech-to-text, text-to-speech, speaker diarization, speech enhancement, and VAD using next-gen Kaldi with onnxruntime without Internet connection. Support embedded systems, Android, iOS, HarmonyOS, Raspberry Pi, RISC-V, x86_64 servers, websocket server/client, support 11 programming languages
Multilingual Voice Understanding Model
Nexa SDK is a comprehensive toolkit for supporting GGML and ONNX models. It supports text generation, image generation, vision-language models (VLM), Audio Language Model, auto-speech-recognition (ASR), and text-to-speech (TTS) capabilities.
Production First and Production Ready End-to-End Speech Recognition Toolkit
Automatic Speech Recognition with Speaker Diarization based on OpenAI Whisper
Streamer-Sales 销冠 —— 卖货主播 LLM 大模型??,一个能够根据给定的商品特点从激发用户购买意愿角度出发进行商品解说的卖货主播大模型。??内含详细的数据生成流程? ?另外还集成了 LMDeploy 加速推理?、RAG检索增强生成 ?、TTS文字转语音?、数字人生成 ?、 Agent 使用网络查询实时信息?、ASR 语音转文字??、Vue 生态搭建前端?、FastAPI 搭建后端??、Docker-compose 打包部署?
Lingvo