AIツールを探す

AIツールを提出

AI モデル検索

MCPサーバー

MCPクライアント

MCPインスペクター

ケーススタディ

AI日刊要約

NVIDIA、トレーニング不要で一貫性のある画像生成が可能なテキストから画像へのモデルを発表

AIGC开放社区

公開日AIニュース · 1 分で読めます · Feb 21, 2024

NVIDIAの新テキスト画像生成モデル「ConsiStory」

NVIDIAは、一貫性のある画像生成という課題を解決する新しいテキスト画像生成モデル「ConsiStory」を発表しました。

SDSAや特徴注入などの新しい手法とモジュールを採用することで、このモデルは、被写体の一貫性と細部の整合性を維持し、従来の手法に見られた高額なトレーニングコストを回避します。

「ConsiStory」の登場は、テキスト画像生成モデルの発展に新たな可能性をもたらします。

テキストから画像へのモデル一貫性のある画像 AI

この記事はAIbaseデイリーからのものです

【AIデイリー】へようこそ！ここは、毎日人工知能の世界を探求するためのガイドです。毎日、開発者に焦点を当て、技術トレンドを洞察し、革新的なAI製品アプリケーションを理解するのに役立つ、AI分野のホットなコンテンツをお届けします。

—— AIbase デイリーグループによって作成

MiniMaxが世界初のAIエージェントの再創作市場をリリースサンダーボルト賞金プールで新たなクリエイティブスタイルを開く

MiniMaxが世界初のAIエージェント再創作プラットフォーム「Agent Remix Marketplace」を発表。既存AI作品をワンクリックでリミックス可能で、原作者には100Creditsの収益を還元。15万ドル規模のグローバルコンテストも開催。技術者以外の参加を促進し、AIエコシステムの発展を目指す。....

Aug 12, 2025

AIニュース：智譜の視覚推論モデルGLM-4.5Vがオープンソース化；アリババ・ダモ学院が3つのエンボディードインテリジェンスのコア技術をオープンソース化；360ジノーがLight-IFシリーズモデルを発表

【AIニュース】へようこそ！这里是あなたが毎日人工知能世界を探索するためのガイドです。毎日、AI分野におけるホットな情報をご提供し、開発者に焦点を当て、技術の傾向や新しいAI製品の応用を理解するお手伝いをします。新鮮なAI製品については以下から詳細をご確認ください:https://top.aibase.com/1、智譜GLM-4.5Vオープンソース化:世界最大規模100B級の最適な視覚推論モデル。智譜は、世界で最も効果的なオープンソースの視覚推論モデルGLM-4.5Vを公開しました。

Aug 12, 2025

230

宇樹テクノロジーが初の世界人形ロボットサッカー大会に参加、ハードウェアは多数のチームで採用される

宇樹テクノロジーの公式微信公衆号によると、会社は8月14日から17日にかけて初めての世界人形ロボットサッカー大会に参加する予定です。宇樹は、自社チームだけでなく、大会には複数のチームが宇樹のロボットハードウェアを使用して参加すると明らかにしましたが、それぞれが独自のアルゴリズムを組み合わせる予定です。大会の項目が密接で数が多く、宇樹チームは一部のプロジェクトのみに参加する予定であり、すべての大会に参加するわけではないと述べています。今回の登場は、宇樹が人形ロボットハードウェア分野での実力を示すとともに、他のチームでもそのデバイスが広く利用されていることを示しており、技術力の高さを反映しています。

Aug 12, 2025

650

Vibe Codingの戦いがエスカレート！Vercel V0が総合AIに進化し、フロントエンドとバックエンド、文章を自動で処理する！

人工知能がコーディング分野で急激に発展する中、Vibe Coding（雰囲気コーディング）ツールの競争はますます激しくなっています。Vercel傘下のAI駆動型のコード生成プラットフォームであるV0は最近、大きなアップデートを行い、単一のフロントエンド生成ツールから完全なAIエージェントへと進化しました。これは、自動計画、研究、構築、デバッグをサポートし、フロントエンド、バックエンド、文章、アプリケーションロジックを含む開発プロセスの全工程をカバーしています。AIbaseが独自に集めた最新情報を通じて、V0の革新的な進歩とVibe Coding分野における競争優位性について詳しくご案内いたします。

Aug 12, 2025

570

华为が新技術を発表し大規模モデルの推論を最適化：UCM技術がHBMへの依存を軽減

8月12日、華為は2025年の金融AI推論応用の実装と発展フォーラムで画期的なAI推論イノベーション技術であるUCM（推論メモリデータマネージャー）を発表する予定です。この技術は中国のAI推論におけるHBM（高帯域幅メモリ）への依存度を低下させ、国内の大規模モデルの推論性能を著しく向上させることが期待されています。UCMはKVキャッシュをコアとし、多様なキャッシュアクセラレーションアルゴリズムツールを統合し、推論プロセスで生じるメモリデータを階層的に管理することで、コンテキストウインドウを拡大し、高スループットで低遅延の推論を実現します。

Aug 12, 2025

410

高徳が通義大モデルを全面的に統合し、初の地図AIネイティブエージェントを発表

アリババグループ傘下の高徳マップは、通義ラボと深度的な協力を開始し、世界初のAIネイティブマップを共同開発することを発表しました。この協力の成果は、近日リリースされた高徳マップ2025バージョンに実装されています。高徳マップ2025バージョンの特徴の一つとして、「小高先生」というスマートエージェントが登場します。このエージェントは音声やテキストなどの多様な入力方法を通じてユーザーと自然なインタラクションを行うことができます。より正確でスムーズな対話体験を実現するために、高徳は通義ラボの音声チームと連携し、全フローの音声認識システムを構築しました。

Aug 12, 2025

580

クアルコムは、OpenAIが新たにオープンソース化したモデルgpt-oss-20bがスナップドラゴン端末でローカルで動作可能であることを発表

OpenAIが200億パラメータのオープンソースモデルgpt-oss-20bを公開。Snapdragon端末で初めてローカル実行可能。性能はo3-mini並みで、モバイル端末での高速処理とプライバシー保護を実現。開発者はHugging Face等で利用可。AI推論のエッジ化が進展。....

Aug 12, 2025

マスクがテスラ・ドージョプロジェクトの閉鎖を確認し、AI5とAI6チップの開発に焦点を移す

テスラはDojo AIスーパーコンピューターチームを解散。2026年予定の第2世代クラスタは中止。技術路線がAI6チップに転換され、一部技術は単板統合で継続。現在はTSMC/サムスン製AI5/AI6チップに注力。マスクは単一チップアーキテクチャへの集中を強調。....

Aug 12, 2025

有料ユーザー優先：Claude AI が履歴の会話メモリ機能をリリースし、複数の背景を切り替えることができます

AnthropicがClaude AIに「記憶機能」を追加。ユーザーの背景情報や作業進捗を自動保存し、セッションを跨いだ連続会話を実現。異なるプロジェクトごとに独立した背景設定が可能で、仕事とプライベートを分離可能。現在はClaude Max/Team/Enterpriseユーザーのみ利用可。Pro版も後日対応予定。ChatGPTの手動設定とは異なり、自動履歴抽出という独自メカニズムを採用。....

Aug 12, 2025

アップルが新世代のSiriをテスト：音声で複数のアプリを直接操作可能

Appleは新版Siriをテスト中で、音声によるアプリ間操作（写真編集後の送信やコメント投稿など）が可能に。App Intentsフレームワークの強化で開発者がより多くの機能を開放。UberやWhatsAppなどでテスト中だが、2024年予定のスマート版Siriは延期。2026年春に全面刷新版を発表予定。....

Aug 12, 2025

AIツールを探す

AIツールを提出

AI モデル検索

MCPサーバー

MCPクライアント

MCPインスペクター

ケーススタディ

最新AIニュース

AI日刊要約

NVIDIA、トレーニング不要で一貫性のある画像生成が可能なテキストから画像へのモデルを発表

AIGC开放社区

この記事はAIbaseデイリーからのものです

関連AIニュースの推奨

MiniMaxが世界初のAIエージェントの再創作市場をリリースサンダーボルト賞金プールで新たなクリエイティブスタイルを開く

AIニュース：智譜の視覚推論モデルGLM-4.5Vがオープンソース化；アリババ・ダモ学院が3つのエンボディードインテリジェンスのコア技術をオープンソース化；360ジノーがLight-IFシリーズモデルを発表

宇樹テクノロジーが初の世界人形ロボットサッカー大会に参加、ハードウェアは多数のチームで採用される

Vibe Codingの戦いがエスカレート！Vercel V0が総合AIに進化し、フロントエンドとバックエンド、文章を自動で処理する！

华为が新技術を発表し大規模モデルの推論を最適化：UCM技術がHBMへの依存を軽減

高徳が通義大モデルを全面的に統合し、初の地図AIネイティブエージェントを発表

クアルコムは、OpenAIが新たにオープンソース化したモデルgpt-oss-20bがスナップドラゴン端末でローカルで動作可能であることを発表

マスクがテスラ・ドージョプロジェクトの閉鎖を確認し、AI5とAI6チップの開発に焦点を移す

有料ユーザー優先：Claude AI が履歴の会話メモリ機能をリリースし、複数の背景を切り替えることができます

アップルが新世代のSiriをテスト：音声で複数のアプリを直接操作可能

AIツールを探す

AIツールを提出

AI モデル検索

MCPサーバー

MCPクライアント

MCPインスペクター

ケーススタディ

最新AIニュース

AI日刊要約

NVIDIA、トレーニング不要で一貫性のある画像生成が可能なテキストから画像へのモデルを発表

AIGC开放社区

この記事はAIbaseデイリーからのものです

関連AIニュースの推奨

MiniMaxが世界初のAIエージェントの再創作市場をリリース サンダーボルト賞金プールで新たなクリエイティブスタイルを開く

AIニュース：智譜の視覚推論モデルGLM-4.5Vがオープンソース化；アリババ・ダモ学院が3つのエンボディードインテリジェンスのコア技術をオープンソース化；360ジノーがLight-IFシリーズモデルを発表

宇樹テクノロジーが初の世界人形ロボットサッカー大会に参加、ハードウェアは多数のチームで採用される

Vibe Codingの戦いがエスカレート！Vercel V0が総合AIに進化し、フロントエンドとバックエンド、文章を自動で処理する！

华为が新技術を発表し大規模モデルの推論を最適化：UCM技術がHBMへの依存を軽減

高徳が通義大モデルを全面的に統合し、初の地図AIネイティブエージェントを発表

クアルコムは、OpenAIが新たにオープンソース化したモデルgpt-oss-20bがスナップドラゴン端末でローカルで動作可能であることを発表

マスクがテスラ・ドージョプロジェクトの閉鎖を確認し、AI5とAI6チップの開発に焦点を移す

有料ユーザー優先：Claude AI が履歴の会話メモリ機能をリリースし、複数の背景を切り替えることができます

アップルが新世代のSiriをテスト：音声で複数のアプリを直接操作可能

MiniMaxが世界初のAIエージェントの再創作市場をリリースサンダーボルト賞金プールで新たなクリエイティブスタイルを開く