微软在 Windows 11 画图软件中测试文字转图像工具

站长之家
本文来自AIbase日报
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
Meta 公司正在进行一项重大的内部重组,决定将所有人工智能相关的团队整合到一个名为 “超级智能实验室”(Meta Superintelligence Labs)的新单位。该消息由彭博社披露,来自 Meta 的一份内部备忘录显示,Meta 首席执行官马克・扎克伯格(Mark Zuckerberg)希望通过这次重组,将公司的重点放在开发 “超级智能” 人工智能上。“超级智能实验室” 将由前 Scale AI 首席执行官亚历山大・王(Alexandr Wang)担任首席人工智能官,负责整体方向与管理。同时,前 GitHub 首席执行官纳特・弗里德曼(Nat Friedman)将
近日,TEN Agent团队宣布将其企业级实时语音活动检测器(TEN VAD)正式开源,这一突破性举措引发行业热议。TEN VAD以帧级精度的语音检测能力和优于WebRTC VAD及Silero VAD的性能表现,成为构建实时对话语音助手的强力引擎。TEN VAD:帧级精度的企业级语音检测TEN VAD是一款基于深度学习的轻量级、低延迟语音活动检测(VAD)模型,专为企业级应用设计。它能够精确识别音频帧中的人类语音,过滤背景噪音、沉默等非语音内容。相较于业界常用的WebRTC VAD和Silero VAD,TEN VAD在多样化场景测试中展现出更
Chai Discovery于2025年6月30日推出全新AI模型Chai-2,标志着抗体设计领域的重大突破。Chai-2以零样本抗体设计能力著称,实验命中率达16-20%,远超传统方法的0.1%行业标准,为生物制药研发注入新动力。Chai-2采用多模态生成架构,整合全原子结构预测与生成式建模,可在仅提供目标结构和表位的情况下,从头设计抗体的互补决定区(CDR)。AIbase分析显示,该模型无需模板或高通量筛选,仅需两周即可完成从设计到验证的流程,生成具有纳摩尔级亲和力和药物特性的抗体。在52个未解决抗原测试中
2025年6月26日,字节 正式发布其最新图像合成技术 ——XVerse,旨在提供高精度的多主体图像生成解决方案。这项创新的技术使得用户能够对多个个体进行独立且精确的控制,极大地提升了个性化和复杂场景生成的能力。XVerse 的核心在于其独特的 DiT 调制方法,能够在不影响整体图像潜在特征的情况下,对每个主体的身份和语义属性进行调控。通过将参考图像转化为特定于令牌的文本流偏移量,XVerse 使得图像合成更加灵活和直观,用户只需简单的文字描述,即可生成符合预期的高保真图像。
人工智能驱动的编程工具Cursor近日迎来重大更新,正式推出Web版与移动版支持,为开发者带来全新的移动端编程体验。这一突破性进展打破了传统桌面端限制,让编程工作更加灵活高效。以下是AIbase整理的最新资讯,带您深入了解Cursor手机版的亮点与影响。Cursor作为一款深受程序员喜爱的AI辅助编程工具,此前主要依赖桌面应用程序运行。最新发布的Web版与移动版支持,让开发者可以通过手机浏览器或PWA(渐进式Web应用)随时随地访问Cursor。用户只需访问官方链接并将页面添加至主屏幕,
近日,一款名为Qwen-TTS的语音合成模型有了新进展,其通过Qwen API完成了最新版本的更新,为用户带来了更加丰富的语音合成体验。 此次更新中,Qwen-TTS新增了对三种中文方言的支持,分别是北京话、上海话和四川话,进一步拓宽了其应用场景。该模型依托超过300万小时的大规模语料库进行训练,合成效果达到了人类级别的自然度和表现力。Qwen-TTS不仅能精准合成语音,还能根据输入文本自动调整韵律、节奏和情绪变化,让生成的语音更加真实、富有表达力。
欢迎来到AIbase【AI日报】栏目!每天三分钟了解当日AI大事件,助你洞悉AI行业趋势、创新AI产品应用。更多AI资讯访问:https://www.aibase.com/zh1.百度重磅开源文心大模型4.5系列,十款新模型亮相!百度正式发布文心大模型4.5系列并完全开源,包含多种参数配置的十款新模型,使用飞桨框架训练推理,FLOPs利用率47%,在文本多模态基准测试中表现优异,提供一站式使用指南和工具,方便开发者精调部署,已上传至Hugging Face、GitHub等平台。体验地址:https://yiyan.baidu.com Hugging Face:https://huggingface.co/baidu)Gi
英国政府近期启动了 “人工智能机遇行动计划”,该计划投资20亿英镑,旨在提升国家在人工智能领域的领导地位。然而,伴随人工智能的快速发展,电力需求也在急剧上升。政府需要确保未来五年内,计算能力增长二十倍的目标能够实现,确保电网能够支持这一庞大的需求,否则英国可能会面临人工智能发展放缓、运营成本增加以及对不可持续能源的依赖。图源备注:图片由AI生成,图片授权服务商Midjourney为了解决人工智能行业的电力需求,英国能源和技术部长召开了人工智能能源委员
在气候变化和自然现象模拟的研究中,强大的计算能力至关重要。为此,位于德国的于利希超级计算中心(Jülich Supercomputing Center)近日推出了欧洲首台百万兆次级超级计算机 JUPITER(木星)。这台计算机的强大处理能力为科学研究带来了全新的可能性。图源备注:图片由AI生成,图片授权服务商MidjourneyJUPITER 于2025年6月首次亮相于全球最强大计算机系统的 TOP500排行榜上,位列第四。它拥有5900个加速计算节点,配备了约24000颗 Nvidia Grace-Hopper 超级芯片和1300个使用 Rhea1处理器的节点。此外,JUPIT
近日,北京人工智能研究院推出了全新的开源系统 ——OmniGen2。这一系统专注于文本到图像的生成、图像编辑和上下文图像创作。与2024年发布的第一代 OmniGen 相比,OmniGen2采用了两条独立的解码路径:一条用于文本生成,另一条用于图像生成,且各自拥有独立的参数和解耦的图像标记器。这种设计让模型在保持文本生成能力的同时,有效地提升了多模态语言模型的表现。OmniGen2的核心是一个基于 Qwen2.5-VL-3B 变换器的大型多模态语言模型(MLLM)。在图像生成方面,该系统使用了一种自定义的扩