Grok 3の音声機能が正式にリリース:10種類のモードをサポートし、18禁オプションも含まれる

AIbase基地
この記事はAIbaseデイリーからのものです
【AIデイリー】へようこそ!ここは、毎日人工知能の世界を探求するためのガイドです。毎日、開発者に焦点を当て、技術トレンドを洞察し、革新的なAI製品アプリケーションを理解するのに役立つ、AI分野のホットなコンテンツをお届けします。
【AIデイリー】へようこそ!ここは、毎日人工知能の世界を探求するためのガイドです。毎日、開発者に焦点を当て、技術トレンドを洞察し、革新的なAI製品アプリケーションを理解するのに役立つ、AI分野のホットなコンテンツをお届けします。
飛渡科技が「峥嵘大モデル」を発表、国際評価プラットフォームCity3Dで優れた性能を発揮。災害シミュレーションや文化遺産保護に応用可能。API開放で業界の智能化を推進。....
中科院計算所がStream-Omniマルチモーダル大規模モデルを発表。テキスト・画像・音声の3モーダルに対応し、モーダル間アライメント技術により大規模データ依存を低減。音声とテキストのリアルタイム変換を実現。任意のモーダル組み合わせが可能で、特に画像理解と音声対話に優れる。論文とコードは公開済み。....
2025年7月にオープンソースAIアシスタントGlassが人気に。Pickleチーム開発で、macOS対応、バックグラウンド動作が特徴。会議メモや学習ノートを自動整理し、プライバシー保護も。Apache2.0ライセンスでGitHubスター1.8k。Windows/Linux版や「デジタルクローン」機能の拡張予定。....
B站は動画作成支援AI「H」を発表。智元は双形態ロボット「霊犀X2-N」を公開。宇樹科技は科創板IPOで120億評価。EarthMindが地球データ分析を革新。Gemini CLIが音声/動画処理機能を更新。macOS助手Glassがオープンソース化。Claudeが数学特化モデル「Neptune v3」を発表予定。GPT-5はマルチモデル統合でブレークスルーを目指す。....
Anthropicが開発中のAIモデル「Claude Neptune v3」が注目を集めています。数学的推論能力に優れ、OpenAIやGoogleのトップモデルに匹敵する可能性があります。現在は内部テスト段階で、市場競争優位を目指しています。....
シリコンバレー企業でSoham Parekhが偽履歴で5社同時リモート勤務。AI面接支援ツール「CheatingDaddy」が話題に。同様の事例が他業界でも報告され、労働者の収入不安と職業倫理が議論されている。....
AIツールを使った有名人のイメージ動画作成と収益化方法を解説。企画から脚本作成、HeyGen等での動画生成、編集を経てSNSに投稿。広告収入や知識販売で収益化可能。肖像権に注意し、AI生成と明記が必須。編集スキルとSNS運用経験のある人向け。....
智元社が哪吒ロボット「霊犀X2-N」を発表。二形態デザインが特徴で、車輪形態は効率的な移動と耐衝撃性、足型形態は12kgの荷物を運びながら障害物を越えられる。複雑な地形に対応可能で、優れたバランスと環境適応力を備える。....
Figmaが2025年に上場予定で、最大規模のテクIPOとなる可能性。45万有料ユーザー、95%のフォーチュン500企業に利用される「デザイン界のGoogle Docs」。AI製品4種を計画、2024年売上7.49億ドル(+48%)。市場シェア90%まで急成長も、AIデザインツールとの競争が課題。....
Tencentの新言語モデル「混元-A13B」をオープンソース化。800億パラメータのMoEアーキテクチャで、動的推論を採用。STEMデータに特化し、AIME2024で87.3%の精度。主流モデルと同等性能だが、一部結果に議論あり。....