【AI日報】へようこそ!ここは、あなたが毎日人工知能の世界を探求するためのガイドです。毎日、AI分野のホットなコンテンツをご紹介し、開発者に焦点を当て、技術トレンドの把握や革新的なAI製品の応用について理解を深めるお手伝いをします。

最新のAI製品詳細はこちらhttps://top.aibase.com/

1、大学院レベルの推論!AnthropicがClaude 3.5 Sonnetモデルを発表 チャットウィンドウでコードを実行可能に

Anthropicは本日、Claude 3.5シリーズの最初の製品であるClaude 3.5 Sonnetを発表しました。このモデルは、複数の評価において競合他社やその前身であるClaude 3 Opusを上回り、ミドルレンジのモデルと同等の速度とコストを維持しながら、業界の新たな基準を打ち立てています。Claude 3.5 Sonnetは、大学院レベルの推論、学部レベルの知識、コーディング能力などで新たな業界基準を達成し、大幅な性能向上を実現しています。

【AiBase要約:】

⭐性能向上: 推論、知識の習得、コーディング能力など、複数の評価において優れたパフォーマンスを発揮。

⭐実行速度とコスト: 前世代のClaude 3 Opusの2倍の速度で、コストは5分の1。非常に高いコストパフォーマンスを実現。

⭐理解力の向上: グラフや図表などの視覚的推論を必要とするタスクで特に優れたパフォーマンスを発揮。不完全な画像からのテキスト転写も正確に行うことができます。

⭐新機能Artifactsにより、ユーザーはClaudeにコードスニペット、テキストドキュメント、ウェブサイトのデザインなどを生成するように要求できます。

詳細はこちら:https://mp.weixin.qq.com/s/GIh5YZwIyw2qIj2Mtjej4g

2、北京でAI顔交換ソフトウェアの著作権侵害事件が判決

北京インターネット法院で審理された初のAI顔交換ソフトウェアの著作権侵害事件で、裁判所は被告が原告の個人情報権利を侵害したと認定しましたが、原告の肖像権の侵害には当たらないと判断しました。この事件は、ディープ合成技術と個人情報保護法に関連しており、顔交換技術の合法性とプライバシー権保護に関する議論を引き起こしています。

image.png

【AiBase要約:】

🔍 裁判所は、被告が原告の個人情報権利を侵害したと認定しましたが、肖像権の問題には触れていません。

💡 顔交換テンプレートビデオは、肖像権上の識別性を持たないため、原告の肖像権の侵害には当たりません。

💻 被告の行為は個人情報の処理にあたり、原告の個人情報権利を侵害しています。

詳細:https://www.chinaz.com/ainews/9700.shtml

3、テンセント元宝が新バージョンを発表、微信検索に対応

テンセント元宝は最近、新バージョンを発表しました。超長文の処理能力とAI検索・解析機能が向上し、微信検索への対応も追加され、ユーザーにより効率的で便利な使用体験を提供します。今回のアップデートでは、超長文書の処理効率の向上だけでなく、ファイル形式のサポートの拡充、グラフの生成、画像の解析機能も追加されています。新バージョンでは検索機能も強化され、微信検索などの検索エンジンに対応し、より包括的なサービスを提供します。

image.png

【AiBase要約:】

🚀 超長文処理能力の向上、最大1000万文字の単一文書テキストに対応。

📊 複数ファイルの解析、最大50個のファイルを一度に解析可能。様々なファイル形式に対応。

🔍 検索機能の強化、微信検索などの検索エンジンを統合し、スマートな検索結果を提供。

詳細リンク:https://top.aibase.com/tool/tengxunyuanbao

4、知網がCNKI AI学術研究アシスタント4.0を発表

中国知網は最近、AI大規模モデル技術と高品質なデータを組み合わせたAI学術研究アシスタント4.0バージョンを発表しました。文献検索、精読、学術創作の効率を向上させます。制御可能な生成、文献拡張、学者検索、全文翻訳、学術拡張サービスなどが追加され、ユーザーの個別ニーズに対応します。特に、質問応答型の強化検索と学者検索サービスが強化されています。体験アドレス:https://top.aibase.com/tool/zhiwangcnki-ai-xueshuyanjiuzhushou

image.png

【AiBase要約:】

🔍 AI学術研究アシスタント4.0バージョンは、AI大規模モデル技術と高品質なデータを組み合わせ、文献検索、精読、学術創作の効率を向上させます。

🔄 新機能として、制御可能な生成、文献拡張、学者検索、全文翻訳、学術拡張サービスなどが追加され、ユーザーの個別ニーズに対応します。

🔗 質問応答型の強化検索と学者検索サービスが強化され、より正確な回答と詳細な学者情報が提供されます。

詳細リンク:https://top.aibase.com/tool/zhiwangcnki-ai-xueshuyanjiuzhushou

5、Groqがwhisper-large-v3モデルをリリース、音声転写と翻訳をサポート、無料で公開

Groqが最新リリースしたWhisper Large-V3モデルは、強力な音声転写と翻訳機能を提供し、PlaygroundまたはローカルプロジェクトでAPIを使用できます。高速転写が可能で、複数の言語を英語に翻訳できます。Whisper APIはOpenAI標準と互換性があり、音声テキスト変換と翻訳機能を提供し、アプリケーションへの統合が容易です。高度な「whisper-large-v3」モデルを採用し、優れた性能を実現しています。

image.png

【AiBase要約:】

🔊 高速転写:4分30秒のビデオを約3秒で転写。

🌐 多言語対応:複数の言語の転写と英語への翻訳に対応。

🛠️ APIインターフェース:音声テキスト変換と翻訳機能を提供し、アプリケーションに統合可能。

詳細リンク:https://console.groq.com/playground

6、復旦のオープンソースプロジェクトHalloがComfyUIプラグインに対応

Halloプロジェクトは、音声と画像から話すビデオを生成するオープンソースプロジェクトです。インストールのハードルは高いですが、転写やその他のプロセスにより多くの可能性と楽しみを提供します。エンドツーエンドの拡散パラダイムを採用し、階層的な音声駆動視覚合成モジュールを導入することで、音声入力と視覚出力のアライメント精度を実現し、自然な話すビデオを生成します。インストールが複雑であるものの、オープンソースエコシステムに新たな活力を注入し、将来的にはより多くの同様のプロジェクトが便利さと楽しみをもたらすと期待されています。

【AiBase要約:】

🔊 HalloプロジェクトはComfyUIプラグインに対応し、音声と画像から自然な話すビデオを生成します。

🎤 エンドツーエンドの拡散パラダイムを採用し、階層的な音声駆動視覚合成モジュールを導入することで、アライメント精度を向上させています。

😊 階層的な音声駆動モジュールにより、表情やポーズの多様性を制御し、パーソナライズされたカスタマイズが可能になり、自然な効果を生成します。

詳細リンク:https://github.com/AIFSH/ComfyUI-Hallo

7、AIツールPerplexityが禁止されている状況下でもウェブサイトのコンテンツを継続的に取得していると批判される

Perplexityは、革新的なネットワーク情報インタラクション方法でオンライン読書体験を刷新するAIスタートアップ企業です。しかし、彼らはRobots Exclusion Protocolを回避して制限されたネットワークコンテンツを取得しており、物議を醸しています。CEOは同社の行為を弁護していますが、著作権問題に関する批判に直面しています。Perplexityの行為は、デジタルメディア分野で倫理的および法的問題を引き起こしています。

【AiBase要約:】

🤖 PerplexityはRobots Exclusion Protocolを回避して制限されたネットワークコンテンツを取得しており、物議を醸しています。

💼 CEOは同社の行為を弁護していますが、著作権問題に関する批判に直面しています。

⚖️ Perplexityの行為は、デジタルメディア分野で倫理的および法的問題を引き起こしています。

8、ウクライナのインフルエンサーがAIによる顔盗用の被害を受けた後の状況:苦情の後、そのイメージを使用した企業は関連画像を削除

21歳のウクライナのYouTuber、オルガ・ロイエクは最近、AIによって自分の顔がクローン化され、そのクローン画像がオンラインで悪用されていることを発見しました。クローン作成者はAI技術を使用して大量のビデオを作成しただけでなく、ビデオ内のキャラクターがロシア人であると主張しており、これは明らかに虚偽です。この事件は、特に個人情報保護と肖像権保護において、AI技術の使用に関する法的および倫理的問題を引き起こしています。

【AiBase要約:】

🔍 クローン現象の悪用:4900以上のクローンビデオ、虚偽情報の拡散、詐欺行為の可能性。

🛡 肖像権の侵害:多様な画像の侵害、大衆を誤解させる可能性、法的議論を招く。

⚖ AI技術の課題:悪用リスクへの警戒、個人権利の保護、倫理的問題に関する議論を引き起こす。

詳細:https://www.chinaz.com/ainews/9707.shtml

9、強力な連携!ユニバーサルミュージックがAI音楽スタートアップSoundLabsと提携、歌手向けに独自のボイスクローンモデルをカスタマイズ

ユニバーサルミュージックグループとAI音楽技術企業SoundLabsは、MicDrop機能を共同で発表しました。アーティストはパーソナライズされた音声モデルをカスタマイズし、完全な制御権を持ち、言語の壁を乗り越え、アーティストの権利を保護します。この革新的な技術は、音楽創作を全く新しい創造的な空間へと導き、音楽分野におけるAIの応用と発展を促進します。

【AiBase要約:】

🎤 アーティストが音声モデルをカスタマイズし、完全な制御権を持ち、所有権と使用権の帰属を明確に確保します。

🎸 MicDrop機能は、音声を楽器に変換でき、音楽創作の柔軟性と創造的な空間を拡大します。

🌍 言語変換機能により、アーティストは言語の壁を乗り越え、世界中で音楽をリリースし、聴衆を拡大できます。

10、後悔は買えない?エージェントインテリジェンスが618の衝動買いの後のAI解毒剤になる可能性

エージェントインテリジェンスは、618の衝動買いをした人々の救済となり、消費者の意思決定に革新をもたらします。インテリジェンスプラットフォームが次々と登場し、ワンクリックでさまざまなインテリジェンスを連携させ、パーソナライズされたインテリジェントアシスタントを構築します。AIによる購買ガイドインテリジェンスとECを組み合わせることで、新しいビジネスモデルが生まれます。

【AiBase要約:】

🤖 エージェントインテリジェンスは、消費者の意思決定における新たな武器となり、衝動買いをする人の購買方法を変えます。

🔍 インテリジェンスプラットフォームが台頭し、ワンクリックでさまざまなインテリジェンスを連携させ、パーソナライズされたインテリジェントアシスタントサービスを提供します。

💡 AI購買ガイドインテリジェンスとECを組み合わせることで、より正確な消費提案を示し、新しいビジネスモデルが生まれます。

11、GaussianCube:高品質な3D生成モデリング、性能が74%向上!

3D生成モデリング分野で画期的な進歩が実現しました。GaussianCube技術は従来のNeRFを凌駕し、3Dモデリングに革命をもたらします。この技術は、密度制約付きガウス近似アルゴリズムを採用することで、モデリングプロセスを簡素化し、高精度な近似を実現します。実験結果によると、最大74%の性能向上を示し、その大きな可能性が証明されました。