ShutterstockとNvidiaは、Nvidia Edifyアーキテクチャに基づくテキストから3Dモデルを生成するサービスを共同で発表しました。これは、クリエイティブ分野に新たな可能性をもたらします。
Getty ImagesもEdifyを利用し、AIによる画像微調整オプションを提供しています。
この協業により、クリエイティブのプロフェッショナルは、より多くのコントロールと創作の機会を得ることになります。
ShutterstockとNvidiaは、Nvidia Edifyアーキテクチャに基づくテキストから3Dモデルを生成するサービスを共同で発表しました。これは、クリエイティブ分野に新たな可能性をもたらします。
Getty ImagesもEdifyを利用し、AIによる画像微調整オプションを提供しています。
この協業により、クリエイティブのプロフェッショナルは、より多くのコントロールと創作の機会を得ることになります。
【AIデイリー】へようこそ!ここは、毎日人工知能の世界を探求するためのガイドです。毎日、開発者に焦点を当て、技術トレンドを洞察し、革新的なAI製品アプリケーションを理解するのに役立つ、AI分野のホットなコンテンツをお届けします。
現代のメディア環境において、人工知能(AI)はニュースの入手方法を密かに変えつつあります。従来、ニュースを読むことは一方通行の体験で、読者は情報を受け取るだけで議論に参加することはありませんでした。しかし、チャットボットの台頭により、ニュース消費は双方向的なインタラクションへと進化し、読者の役割は受動的な受信者から能動的な参加者へと変化しています。ますます多くの読者が、AIツールやチャットボットを利用してニュースを精査、要約、解釈し、時には伝統的なメディアを完全に迂回するようになっています。このような「対話型ニュース」は、読者が記事を閲覧する際に…
英国のスタートアップ企業Synthesiaは、人工知能技術を用いてリアルなアバターを生成する企業です。最近、アメリカのストックビデオ企業Shutterstockとライセンス契約を締結し、Shutterstockの豊富なビデオライブラリを活用して、同社の技術のリアルさを向上させることを目指しています。契約金額は公表されていませんが、Synthesiaは、これにより最新のAIモデルが人間の表情、声の調子、ボディランゲージをより正確に捉えるのに役立つと述べています。Synthesiaはデジタル…
アップル社が最近発表したAIニュース要約機能が、速報ニュースの要約において重大な誤りを繰り返し、ユーザーに大量の虚偽情報が伝わる事態を引き起こしている。この機能の発表以来、多くの報道機関やユーザーから、アップルの技術が未成熟であり、正確な情報を効果的に提供できないとして強い反発を受けている。ワシントンポスト紙のテクノロジーコラムニスト、ジェフリー・ファウラー氏がソーシャルメディアで、アップルのAIがニュース要約において事実を歪めたと投稿したと報じられている。
現在のメディア業界がAIに対して慎重な姿勢をとる中、ParticleというAIニュース閲覧アプリがその状況を変えようとしています。元Twitterのエンジニアが開発したこのアプリは、ユーザーがニュースをより深く理解するのを支援するとともに、従来のメディア機関とのウィンウィン関係を模索しています。Particleは、元Twitterプロダクトマネジメント上級ディレクターのSara Beykpour氏と、元Twitterおよびテスラの上級エンジニアであるMarcel Molina氏によって共同設立されました。同社は、
スタートアップ企業Meshyが、最新のモデリングツールMeshy-4を発表しました。16ヶ月にわたる開発を経て、デザイナーや開発者が仮想環境を作成する方法に革新をもたらします。Meshy-4は出力品質の問題を解決し、より鮮明な表面と強化されたジオメトリの詳細により、モデルの品質を大幅に向上させ、プロレベルに近づけました。新バージョンでは、テキストから3Dモデルを生成するプロセスをモデリングとテクスチャリングの2段階に分けることで、ユーザーにより細かい制御を可能にしました。新たに搭載された再試行オプションは、結果の変動性への対処を支援し、新しいモデルを迅速に生成します。強力な機能により、M
ElevenLabsが開発したモバイルリーダーアプリがAndroidプラットフォームに登場。テキスト読み上げ、PDF/ePubファイルの閲覧、高品質なAI音声合成技術を一体化し、場所を選ばずに文章を音声で楽しめる画期的なアプリです。テキストの読みやすさに関わらず、快適な読書体験を提供します。アメリカ、イギリス、カナダの3ヶ国語と、今後32言語への対応を予定しており、グローバル展開を間近に控えています。Judy GarlandやJames Deanなど、伝説的著名人の声を模倣するAI技術も搭載し、パーソナライズされた読書体験を提供します。
日本のイオン系のスーパーマーケットが、AIシステム「Smile-Kun」を使って従業員の笑顔を監視していることが明らかになった。従業員の笑顔や声の分析を通じて接客スキル向上を目指しているという。システムは特定のあいさつ方法を要求し、450個の微表情のポイントで100点満点で採点、リアルタイムでフィードバックする。さらに、音量や滑らかさ、トーンについても分析し、改善点を提案する。従業員の反応では笑顔の割合が大幅に増加したという。しかし、この取り組みは物議を醸しており、一部のネットユーザーからは従業員の個性や感情を過度に数値化しており、真心のこもったサービスとは程遠いとの批判が出ている。批判意見では、上下関係や
マイクロソフト研究所と北京航空航天大学の研究チームは、マルチモーダル大規模言語モデル(MLM)開発における課題解決を目指し、高効率なマルチモーダル埋め込みフレームワークE5-Vを発表しました。この革新的なフレームワークは、単一モーダル学習によってマルチモーダル学習プロセスを簡素化し、従来のモデルに見られた独立したエンコーダーへの依存と、それに伴う入力統合の非効率性を克服します。E5-Vはテキストと画像情報を統合することでトレーニングコストを削減し、テキスト-画像検索、画像検索など、複数の複雑なタスクにおいて優れた性能を示しました。特にゼロショット学習において…