AIツールを探す

AIツールを提出

AI モデル検索

MCPサーバー

MCPクライアント

MCPインスペクター

ケーススタディ

AI日刊要約

アマゾン、史上最大のテキスト音声変換モデルBASE TTSを発表

站长之家

公開日AIニュース · 1 分で読めます · Feb 18, 2024

アマゾンのAGIチームが、これまでで最大のパラメータ数と最大のトレーニングデータセットを持つ、史上最大のテキスト音声変換モデルを発表しました。チームは、学習した知識を応用することで、人間の音声品質を向上させたいと考えています。新しいモデルの名前はBASE TTSで、980億個のパラメータを持ち、10万時間の録音データを使用してトレーニングされました。チームは、BASE TTSを学習アプリケーションに使用し、テキスト音声変換アプリケーションの人間の音声品質を向上させる計画です。

アマゾンテキスト音声変換人工知能

この記事はAIbaseデイリーからのものです

【AIデイリー】へようこそ！ここは、毎日人工知能の世界を探求するためのガイドです。毎日、開発者に焦点を当て、技術トレンドを洞察し、革新的なAI製品アプリケーションを理解するのに役立つ、AI分野のホットなコンテンツをお届けします。

—— AIbase デイリーグループによって作成

ザッカーバーグがメタAIチームを再編成　3400人規模の新アーキテクチャーが明らかに

メタはAIアーキテクチャーを再編してスーパーアルキテクトラボを設立し、3400人の従業員を統合しました。最高AI担当者はAlexandr Wangです。新しいアーキテクチャーは4つのチームに分かれています：AGI基礎研究、AI製品開発（メタAIアシスタントを含む）、Yann LeCunが率いる基礎AIラボ、そしてLlama5の開発に専念するグループです。メタは高給でOpenAIやアップルなどの企業の人材を引き抜いていますが、これにより元のチームから外部の高給人材への疑問が生じています。最近、アップルの2人のAI責任者が参加しました。

Jul 18, 2025

理想自動車が最初の自動車生成型AIセキュリティ評価認証を取得

理想自動車は2025年中国自動車フォーラムで国内で最初の自動車生成型AIセキュリティ二重認証を獲得し、GB/T45654およびGB45438-2025の二つの国家標準認証を初めて通過した企業となった。この認証はCCIA自動車サイバーセキュリティ作業委員会とAI生成コンテンツ識別サービスプラットフォームが共同で発行したもので、コンテンツセキュリティと識別の両分野をカバーしている。この成果は、理想自動車が車載AIGC技術のセキュリティにおいて業界の先駆けであることを示しており、スマートカーのセキュアな発展にモデルを設け、消費者の信頼を強化するものである。

Jul 18, 2025

ChatGPTの音声モードがリリース！ワンタップで会議を転記し、計画を生成。AIが効率を飛躍的に向上させます！

OpenAIがChatGPT Plusユーザー向けにmacOSデスクトップアプリの録音機能を全面開放。120分間のリアルタイム録音が可能で、構造化メモやタスク、コード枠を自動生成。プライバシー保護を重視し、処理後はオリジナル音声を削除。現在はmacOS限定だが、他プラットフォームにも拡張予定。会議やブレインストーミングの効率化に貢献するAI生産性ツールの画期的な進化。....

Jul 18, 2025

Aニュース：KimiオープンプラットフォームにKimi Playgroundが登場；OpenAIがChatGPT Agentを発表；Sunoがボーカル置換機能をリリース

【AIニュース速報】本日のAI分野では複数の進展がありました。1) 月の暗面がKimiオープンプラットフォームにPlaygroundをリリースし、AIを対話アシスタントからスマートアシスタントへとアップグレードしました。2) OpenAIがタスクを自動的に実行できるChatGPT Agentを発表しました。3) Suno v4.5+がボーカル置換などの革新的な音楽機能を導入しました。4) グーグルがVeo3動画生成モデルのAPIを公開しましたが、コストは高めです。5) 最初のリアルタイムビデオ変換AIモデルMirageLSDが登場しました。6) VSC

Jul 18, 2025

LTX-Video 13Bがリリース！30倍速で高精細動画を生成オープンソースAIで創作に境界なし！

Lightricksがオープンソースのビデオ生成モデルLTX-Video13Bを発表。130億パラメータとマルチスケールレンダリング技術により、同類モデル比30倍の生成速度を実現。消費級GPUで1216×704解像度のリアルタイム生成が可能で、テキスト/画像/動画から動画への多様な創作モードを提供。....

Jul 18, 2025

Perplexityがインドに進出：AIのレースでOpenAIに迫る新たな戦略

AI検索企業Perplexityはインド市場で急成長中。Bharti Airtelと独占提携し、3.6億ユーザーに1年間無料Proサービスを提供。ダウンロード数600%増、MAU640%増。Paytmとも協業。商業化が課題だが、通信事業者連携と現地化戦略でインドAI市場攻略を目指す。....

Jul 18, 2025

テンセントヤオヨンがQQミュージックに統合：曖昧検索、シーン別BGM、スライド再生をサポート

QQ音楽と連携したTencent元宝アプリがバージョン2.30でリリース。AIを使った曖昧検索や類似曲推薦が可能に。歌詞認識で自動再生する新機能も追加され、エンタメシーンでのAI活用が進展。....

Jul 18, 2025

アップルがエヌビディアに譲歩し、MLXフレームワークがCUDAをサポート！AI分野の競争が激化

AppleのMLXフレームワークがCUDAサポートを追加し、NVIDIA生態系への歩み寄りを示した。AI市場での優位性確保のため、開発者がNVIDIA GPUで訓練したモデルをAppleデバイスに展開可能に。500万人の開発者を抱えるCUDA生態系への戦略転換。....

Jul 18, 2025

テスラのDojo 2チップが量産へ性能はインテルに迫るマスク氏はゲームのルールを変えると語る

テスラは新世代のDojo2チップを発表しました。性能は初代の10倍に向上し、演算能力はインテルB200に近づきました。このチップは台湾積電によって製造され、高度なパッケージング技術を採用しており、消費電力などの問題を解決しています。Dojo2はテスラのFSD自動運転システムのトレーニングをサポートし、毎日1600億フレームのビデオデータを処理し、技術の自給自足を実現します。マスク氏は来年にはさらに強力なDojo3を発表すると明らかにし、ドジョー2は1秒間に10億フレームで『Crysis』を動作させられると冗談を言いました。この突破により、テスラがインテルへの依存を減らし、外部にも提供する可能性があります。

Jul 18, 2025

Claude Code シニアユーザーが予告なしの使用制限に直面　Anthropic のコメントは曖昧

Claude Codeの有料ユーザーが突然の利用制限に直面し、信頼危機が発生。Anthropicは明確な説明なく使用上限を導入、ユーザーはプロジェクト遅延と透明性不足を批判。約束されたリソースと実際のサービスの乖離が問題に。....

Jul 18, 2025

AIツールを探す

AIツールを提出

AI モデル検索

MCPサーバー

MCPクライアント

MCPインスペクター

ケーススタディ

最新AIニュース

AI日刊要約

アマゾン、史上最大のテキスト音声変換モデルBASE TTSを発表

站长之家

この記事はAIbaseデイリーからのものです

関連AIニュースの推奨

ザッカーバーグがメタAIチームを再編成　3400人規模の新アーキテクチャーが明らかに

理想自動車が最初の自動車生成型AIセキュリティ評価認証を取得

ChatGPTの音声モードがリリース！ワンタップで会議を転記し、計画を生成。AIが効率を飛躍的に向上させます！

Aニュース：KimiオープンプラットフォームにKimi Playgroundが登場；OpenAIがChatGPT Agentを発表；Sunoがボーカル置換機能をリリース

LTX-Video 13Bがリリース！30倍速で高精細動画を生成オープンソースAIで創作に境界なし！

Perplexityがインドに進出：AIのレースでOpenAIに迫る新たな戦略

テンセントヤオヨンがQQミュージックに統合：曖昧検索、シーン別BGM、スライド再生をサポート

アップルがエヌビディアに譲歩し、MLXフレームワークがCUDAをサポート！AI分野の競争が激化

テスラのDojo 2チップが量産へ性能はインテルに迫るマスク氏はゲームのルールを変えると語る

Claude Code シニアユーザーが予告なしの使用制限に直面　Anthropic のコメントは曖昧

AIツールを探す

AIツールを提出

AI モデル検索

MCPサーバー

MCPクライアント

MCPインスペクター

ケーススタディ

最新AIニュース

AI日刊要約

アマゾン、史上最大のテキスト音声変換モデルBASE TTSを発表

站长之家

この記事はAIbaseデイリーからのものです

関連AIニュースの推奨

ザッカーバーグがメタAIチームを再編成 3400人規模の新アーキテクチャーが明らかに

理想自動車が最初の自動車生成型AIセキュリティ評価認証を取得

ChatGPTの音声モードがリリース！ワンタップで会議を転記し、計画を生成。AIが効率を飛躍的に向上させます！

Aニュース：KimiオープンプラットフォームにKimi Playgroundが登場；OpenAIがChatGPT Agentを発表；Sunoがボーカル置換機能をリリース

LTX-Video 13Bがリリース！30倍速で高精細動画を生成 オープンソースAIで創作に境界なし！

Perplexityがインドに進出：AIのレースでOpenAIに迫る新たな戦略

テンセントヤオヨンがQQミュージックに統合：曖昧検索、シーン別BGM、スライド再生をサポート

アップルがエヌビディアに譲歩し、MLXフレームワークがCUDAをサポート！AI分野の競争が激化

テスラのDojo 2チップが量産へ 性能はインテルに迫る マスク氏はゲームのルールを変えると語る

Claude Code シニアユーザーが予告なしの使用制限に直面 Anthropic のコメントは曖昧

ザッカーバーグがメタAIチームを再編成　3400人規模の新アーキテクチャーが明らかに

LTX-Video 13Bがリリース！30倍速で高精細動画を生成オープンソースAIで創作に境界なし！

テスラのDojo 2チップが量産へ性能はインテルに迫るマスク氏はゲームのルールを変えると語る

Claude Code シニアユーザーが予告なしの使用制限に直面　Anthropic のコメントは曖昧