【AI日報】へようこそ!ここは、あなたが毎日人工知能の世界を探求するためのガイドです。毎日、AI分野のホットな話題を、開発者に焦点を当ててお届けします。技術トレンドの把握、革新的なAI製品の応用に関する理解を深めるお手伝いをします。
最新のAI製品はこちらからご覧ください:https://top.aibase.com/
1、バイトダンスが豆包ビジュアル推論大規模モデルを発表:価格はわずか0.003元/千トークン
火山引擎FORCE原動力大会で、火山引擎の社長である譚待氏は、豆包ビジュアル理解大規模モデルを発表しました。このモデルは、テキストと画像情報を組み合わせることで、卓越したコンテンツ認識と推論能力を発揮します。新モデルの価格は大幅に削減され、企業ユーザーのスマート化への転換を後押しします。豆包大規模モデルの1日あたりのトークン使用量は4兆を超え、強力な市場需要と応用可能性を示しています。
【AiBase要約:】
🖼️ 新発表の豆包ビジュアル理解大規模モデルは、テキストと画像情報を同時に処理し、コンテンツ認識と推論能力を向上させます。
💰 今年5月以降、豆包大規模モデルの業界価格は99%削減され、企業ユーザーによる技術の利用が容易になりました。
📈 現在、豆包大規模モデルの1日あたりのトークン使用量は4兆を超え、33倍以上の増加を示し、市場需要の高さを示しています。
2、OpenAIがフルスペックのo1モデルAPIを公開:コスト60%削減、高度なビジュアル処理能力を追加
12日間にわたる連続ライブ配信イベントの9日目に、OpenAIは開発者向けにo1モデルのAPIを発表し、リアルタイムAPIの大幅なアップグレードを発表しました。WebRTCテクノロジーをサポートします。公開日より、OpenAIはAPI使用レベル5の開発者にo1 APIへのアクセス権を提供します。今回の更新されたo1モデルAPIは、以前のプレビューバージョンと比較して、思考コストを60%削減し、高度なビジュアル処理能力を追加しました。同時に、GPT-4oの音声処理コストも60%削減され、ミニバージョンの価格も10倍に大幅に削減されました。
【AiBase要約:】
🚀 o1モデルAPIが公開され、WebRTCテクノロジーをサポートし、リアルタイムインタラクション能力が向上しました。
💰 コストが60%削減され、高度なビジュアル処理能力が追加され、ユーザーエクスペリエンスが向上しました。
📈 週間アクティブユーザー数が3億人を超え、OpenAIのユーザー基盤の急速な成長を示しています。
3、Ideogramがバッチ画像生成ツールを発表:煩雑な操作に別れを告げ、大規模なクリエイティブ画像をワンクリックで生成
AI画像生成プラットフォームIdeogramは最近、表ファイルのアップロードによる画像生成プロセスの簡素化を目的としたバッチ画像生成ツールを発表しました。ユーザーはCSVファイルにプロンプトと設定を事前に記入でき、Ideogramはこれらの情報に基づいて自動的に画像を生成します。このイノベーションは、プロのデザイナーやクリエイターの作業効率を大幅に向上させ、1つずつ入力する煩雑な操作を削減します。この機能は現在、Ideogram Proユーザーのみに公開されており、デザイン分野におけるAIの可能性とインテリジェントな創作方法を示しています。
【AiBase要約:】
🚀 バッチ生成ツールにより、ユーザーはプロンプトを含む表をアップロードして、画像生成プロセスを簡素化できます。
🖼️ ユーザーは、テンプレートをダウンロードし、プロンプトを生成してCSVファイルをアップロードするだけで、自動的に画像を生成できます。
💼 この機能は現在、Ideogram Proユーザーのみに公開されており、デザイナーに効率的な創作体験を提供します。
4、即夢AIがポスター生成機能をリリース:静的ポスターを動的ポスターにワンクリック変換
即夢AIは2024年12月18日の火山引擎FORCE大会で、新しいポスター生成機能を発表しました。この技術の発表は、画像生成分野における重要な進歩を意味します。ユーザーは簡単な説明を入力するだけで、システムはすぐにクリエイティブなポスターを生成し、従来のデザインに必要な時間とスキルを大幅に削減します。さらに、新しく追加された動的ポスター生成機能は、コンテンツクリエイターにより豊かな表現方法を提供し、特にソーシャルメディアや広告に適しており、視聴者の注意を引きつけ、マーケティング効果を高めることができます。
【AiBase要約:】
🌟 ユーザーは一言の説明だけで、すぐにクリエイティブなポスターを生成でき、創作プロセスを簡素化できます。
🎥 動的ポスター生成機能が追加され、作品をより生き生きと表現でき、ソーシャルメディアや広告に適しています。
📈 即夢AIはユーザーの個性的なニーズを考慮し、柔軟なコンテンツ生成オプションを提供し、ブランドプロモーションを支援します。
5、扣子1.5版正式リリース:マルチモーダル機能をサポート、豆包新モデルをいち早く体験可能
扣子Cozeは火山引擎FORCE原動力大会で、新しいバージョンの扣子1.5を発表し、AIアプリケーション開発分野における重要な進歩を示しました。このバージョンはGUI構築インターフェースをサポートしており、ユーザーは簡単にさまざまな形式のアプリケーションを作成および公開でき、開発のハードルを大幅に下げます。同時に、扣子1.5はマルチモーダル機能を強化し、最新の豆包大規模モデルをサポートし、豊富なテンプレートとソリューションを提供することで、開発者の効率向上を支援し、100万人以上のアクティブ開発者を獲得しています。
【AiBase要約:】
🖥️ 扣子1.5はGUI構築インターフェースをサポートしており、ユーザーはワンクリックでさまざまな形式のアプリケーションを公開でき、開発のハードルを下げます。
🌐 マルチモーダル機能が大幅に強化され、豆包ビジュアル理解、音楽、画像生成モデルをサポートし、AIアプリケーションの範囲を拡大します。
📊 多様なビジネスシーンをカバーする大量の高品質テンプレートを提供し、開発効率を向上させ、100万人以上のアクティブ開発者を獲得しています。
詳細リンク:https://www.coze.cn/docs/guides/vlm
6、バイトダンス:豆包ビデオ生成モデルは2025年1月に正式に外部サービスとして公開
2024火山引擎FORCE原動力大会・冬で、火山引擎は豆包大規模モデルファミリーの新たなアップグレードを発表し、1日あたりのトークン使用量は4兆を超え、大幅な増加を見せています。大会では、ビジュアル理解モデルと複数のモデルのアップグレードを発表し、豆包汎用モデルproの総合的なタスク処理能力を向上させました。さらに、火山引擎はAIGC創作をサポートするveOmniverse+豆包・3D生成モデルを発表し、豆包・ビデオ生成モデルを2025年1月に正式に外部サービスとして公開すると発表しました。これは大規模モデル技術の深化を示しています。
【AiBase要約:】
🌟 豆包大規模モデルの1日あたりのトークン使用量は4兆を超え、33倍以上の増加を示し、幅広い応用を示しています。
🛠️ 新発表のveOmniverse+豆包・3D生成モデルは、高精細3Dアセットの生成と編集をサポートし、AIGC創作能力を向上させます。
📅 豆包・ビデオ生成モデルは2025年1月に正式に外部サービスとして公開され、ユーザーは体験を予約できます。
7、バイトダンス火山引擎が全域AI検索を発表:マルチモーダル検索をサポート
2024火山引擎FORCE原動力大会・冬で、バイトダンスは全域AI検索サービスを発表しました。これは、さまざまな情報とニーズを統合することで、企業の推奨の精度と情報の発見能力を向上させることを目的としています。このサービスは強力なA1搜推エンジンを基盤としており、マルチモーダル理解をサポートし、大量のコンテンツを迅速に処理してリアルタイムのホットな回答を提供することで、ユーザーエクスペリエンスを強化します。同時に、火山引擎は大規模モデルメモリソリューションを発表し、顧客が効率的なメモリシステムを構築する支援を行い、これは大規模モデル開発の重要な方向性です。
【AiBase要約:】
🌐 火山引擎全域AI検索は、シナリオベースの検索、企業のプライベートドメイン情報、およびオンラインQ&Aサービスを統合し、情報推奨の精度を向上させます。
⚙️ A1搜推エンジンは豆包大規模モデルファミリーの技術を利用し、テキスト、画像、音声、ビデオなどのマルチモーダル理解をサポートし、さまざまなアプリケーションシナリオに適しています。
💡 大規模モデルメモリソリューションは、コンテキストキャッシュとRAG技術を組み合わせることで、顧客が効果的なメモリシステムを構築し、大規模モデルのメモリ能力を向上させる支援をします。
8、微信が「作者朗読音色」の新機能をリリース
微信プラットフォームが発表した「作者朗読音色」機能により、公式アカウントの作者は個性的な音声で記事に吹き替えを行い、読書体験のインタラクティブ性とパーソナライズを向上させることができます。「購読者助手」APPをダウンロードして音声を録音し、個人の口調と感情を再現し、公式アカウントで利用できます。この機能は現在、段階的導入テスト段階にあり、まだ全面的に公開されていません。微信はクリエイターに辛抱強く待つよう促しています。これは、ユーザーエクスペリエンスの向上とクリエイターのニーズへの対応における微信の重要な進歩を示しており、公式アカウントのコンテンツ表現形式の多様化が期待されます。
【AiBase要約:】
🎧 作者は個性的な音声で記事に吹き替えを行い、インタラクティブ性を高めることができます。
📱 「購読者助手」APPをダウンロードして音声を録音し、個人のスタイルを再現する必要があります。
🔄 この機能は現在、段階的導入テスト段階にあり、まだ全面的に公開されていません。
9、NVIDIAが生成AIスーパーコンピューターを発表:価格はわずか249ドル、性能は1.7倍向上
NVIDIAが発表したJetson Orin Nano Superは、開発者向けの生成AIスーパーコンピューターで、価格は249ドル、性能が大幅に向上しており、さまざまなAIアプリケーションシナリオに適しています。このデバイスは、生成AIの性能を1.7倍向上させ、メモリ帯域幅と演算能力も大幅に向上しました。ジェンスン・フアン氏は、このデバイスがより低いコストで開発者に卓越した演算性能を提供し、スマートシティ、農業、ロボット開発などの分野での幅広い応用可能性を示しており、AI技術の普及と応用において重要な一歩を踏み出したことを強調しました。
【AiBase要約:】
🚀 性能向上:Jetson Orin Nano Superの生成AI性能は1.7倍向上し、メモリ帯域幅は50%向上しました。
💰 手頃な価格:このデバイスの価格は249ドルで、開発者向けに適しており、AI技術のハードルを下げます。
🌍 幅広い用途:さまざまな電力消費シナリオに対応し、スマートシティ、農業、ロボットなど複数の分野に適しています。
10、OpenAIが表明:Sora APIのリリースは現時点では計画なし、ビデオ生成需要は予想を超える
OpenAIは最近、ビデオ生成モデルSoraのAPIリリース計画はないと発表しました。その理由は、ユーザー需要が予想をはるかに上回っているためです。Soraはテキストまたは画像からリアルなビデオを生成できますが、申請ユーザーが急増したため、OpenAIは新規ユーザー登録を一時的に停止せざるを得ませんでした。CEOのサム・アルトマン氏はこれについて謝罪し、この問題の解決には時間がかかると強調しました。同時に、競合他社のGoogleとAWSはそれぞれビデオ生成APIを発表しており、OpenAIは市場のプレッシャーに直面しており、今後の戦略に注目が集まっています。
【AiBase要約:】
🌟 OpenAIは、需要が予想をはるかに上回っているため、Sora APIのリリース計画はないと述べています。
📈 ユーザーの申請が急増したため、Soraは一時的に登録を閉鎖しており、CEOは謝罪しています。
🤖 GoogleやAWSなどの競合他社はすでにビデオ生成APIを発表しており、OpenAIはプレッシャーに直面しています。
11、AIによる「魔改造」ペットダンスがネットで話題に:奇抜さ、ナンセンスさが流行のキーワードに
最近、AIが生成したペットダンス動画が抖音で話題となり、ナンセンスさとユーモアの完璧な組み合わせを示しています。これらの動画の猫や犬は、瞬間的にダンスの達人に変身し、強い視覚的衝撃と劇的な効果をもたらしています。一部の視聴者はこの奇妙な視覚体験に不快感を覚えるものの、これらの動画は間違いなく動物のイメージに対する私たちの固定観念に挑戦し、AI技術の無限の可能性と創造性を示しています。
【AiBase要約:】
🎉 AIが生成したペットダンス動画が抖音で急速に流行し、再生回数は8億8000万回に達しています。