アマゾンウェブサービス(AWS)社は、同社の音声テキスト変換サービスであるAmazon Transcribeが、生成AI技術を採用し、100言語に対応したことを発表しました。低頻度言語のバランスの取れた学習データの使用を強調しており、転写精度の向上に加え、生成AI技術をCall Analyticsプラットフォームにも適用することで、レポート作成業務の軽減を実現しています。
これは、クラウドサービス分野における製品の継続的な最適化と、多言語音声認識能力の向上を競うトレンドを反映したものです。
モデルの訓練・評価・テスト用大規模データセット・ベンチマーク
ユーザーに各種文書のテキスト抽出・文書処理を提供、汎用・カスタムシーン対応の多様な文書処理をサポート
アマゾンウェブサービス(AWS)社は、同社の音声テキスト変換サービスであるAmazon Transcribeが、生成AI技術を採用し、100言語に対応したことを発表しました。低頻度言語のバランスの取れた学習データの使用を強調しており、転写精度の向上に加え、生成AI技術をCall Analyticsプラットフォームにも適用することで、レポート作成業務の軽減を実現しています。
これは、クラウドサービス分野における製品の継続的な最適化と、多言語音声認識能力の向上を競うトレンドを反映したものです。
【AIデイリー】へようこそ!ここは、毎日人工知能の世界を探求するためのガイドです。毎日、開発者に焦点を当て、技術トレンドを洞察し、革新的なAI製品アプリケーションを理解するのに役立つ、AI分野のホットなコンテンツをお届けします。
抖音SAILとLV-NUS Labが共同開発したSAIL-VL2は、2B/8Bパラメータで106データセットにおいて高性能を達成。MMMUやMathVistaなどの複雑タスクで大型モデルに匹敵する成果を示し、小規模モデルの可能性を拡大。....
Anthropicはインド政府と協力し、2026年2月にグローバルAIサミットを共同で主催する予定である。このサミットは、トップの専門家、研究者、および企業リーダーを集めて、AI技術の発展と応用トレンドを共有することを目的としており、機械学習や自然言語処理などの分野を取り上げる。多くの国からの参加者を集めると予想されている。
潞晨科技の動画生成モデルOpen-Sora2.0が「State of AI Report 2025」に選出。同社の技術革新が国際的に評価され、注目を集めている。....
OpenAIのGPT-5Proがスクリーンショットからエルデシュ問題#339が2003年以前に証明された論文を識別し、その発見は数学界を驚かせた。この数論の難問はポール・エルデシュによって提示され、自然数集合Aがr次元の基であるとき、その中からr個の要素を使って特定の数学的性質をカバーできるかどうかが核心であった。22年前に解決されていた謎は、AIが学術検索において持つ潜在的な突破力を見せてくれた。
現在、AI技術の発展が急速に進んでおり、市場にバブル懸念をもたらしている。独立研究機関の分析によると、AIバブルの規模は驚くほど大きく、90年代後半のインターネットバブルの17倍である。アナリストは、低金利環境がAIへの投資ブームを促進していると強調している。
AIコーディングアシスタントCursorの親会社Anysphereが、CoatueとAccelと10億ドル超の資金調達を協議中。投前評価額は270億ドル。前回調達時の99億ドルから約3倍に急騰。AccelはAIインフラプロジェクトへの投資を強化。Anysphereは資金十分だが新規調達を検討。....
Googleはサウスカロライナ州に90億ドル追加投資し、AIインフラ需要に対応するデータセンター拡張を発表。同州のデジタル経済転換を推進、雇用創出も見込む。....
テンセントユトゥラボはYoutu-Embeddingテキスト表現モデルを開源し、企業のスマートカスタマーサービスや知識ベース管理の効率を向上させます。このモデルは正確な情報抽出により、特定の分野での大規模モデルによる誤った回答の生成を避けており、一般的な語料による関係のない返答の問題を解決し、多分野にわたるパフォーマンスの悪化にも有効に対応します。
マイクロソフトは初めて自社開発した画像生成モデル「MAI-Image-1」をリリースし、LMArenaでトップ10にランクインし、優れた画像生成能力を示した。このモデルはマイクロソフト独自で開発したものであり、AI画像生成分野における重要な進展を意味している。
中国農業大学が神農モデル3.0を発表し、全国の農業分野と応用シナリオをカバーし、農業AIを新たな段階に突き進めました。モデルは36個の農業インテリジェントエージェントに焦点を当て、コンパクトなボディ、高知能、低コストの目標を達成し、32B、7Bおよび1Bの3つのバージョンを提供します。動的スパース性と増分圧縮技術を採用しており、計算力は50%削減されています。