您的当前位置:首页 >综合 >腾讯混元图像2.0发布 实时生图毫秒级速度与超写实画质 正文
时间:2025-07-11 08:01:07 来源:网络整理编辑:综合
5月16日消息,今天腾讯正式发布了业内首个毫秒级响应的实时生图大模型——混元图像2.0(Hunyuan Image2.0)。目前已在腾讯混元官方网站上线,并对外开放注册体验,该模型主要有两大特点:实时
5月16日消息,腾讯图像今天腾讯正式发布了业内首个毫秒级响应的混元毫秒画质实时生图大模型——混元图像2.0(Hunyuan Image2.0)。目前已在腾讯混元官方网站上线,发布并对外开放注册体验,实时生图该模型主要有两大特点:实时生图、度超超写实画质。写实
相比前代模型,腾讯图像腾讯混元图像2.0模型参数量提升了一个数量级,混元毫秒画质得益于超高压缩倍率的发布图像编解码器以及全新扩散架构,其生图速度显著快于行业领先模型。实时生图
在同类商业产品每张图推理速度需要5到10秒的度超情况下,腾讯混元可实现毫秒级响应,写实支持用户可以一边打字或者一边说话一边出图,腾讯图像改变了传统“抽卡—等待—抽卡”的混元毫秒画质方式。
除了速度快以外,发布腾讯混元图像2.0模型图像生成质量提升明显,通过强化学习等算法以及引入大量人类美学知识对齐,生成的图像可有效避免AIGC图像中的“AI味”,真实感强、细节丰富、可用性高。
在图像生成领域专门测试模型复杂文本指令理解与生成能力的评估基准GenEval(Geneval Bench)上,腾讯混元图像2.0模型准确率超过95%,远超其他同类模型。
提示词:人像摄影,爱因斯坦,背景是东方明珠,自拍视角
腾讯表示,腾讯混元图像2.0引入多模态大语言模型(MLLM)作为文本编码器,配合自研的结构化caption系统,不仅能理解你在说什么,更能推测出你希望画面「怎么表达」。
哪怕你一句话里埋了三层含义,它也能一一拆解,再一笔一笔画出来。
除了文字输入,腾讯混元图像2.0还可以通过语音直接输入提示词,系统将语音自动转写为文字,并在识别后即时生成图像,适用于直播讲解、移动创作等场景。
也可以上传草图作为参考,模型能自动识别线稿的结构与构图逻辑,再结合提示词内容补全光影、材质、背景等细节,迅速扩展成图。
腾讯混元图像2.0模型生成的图片:
人像摄影风格
动物特写
复古摄影
动漫风格
真实人物风格
全国耕地总量连续三年实现净增加2025-07-11 07:32
《影之刃零》两张新截图公布!游戏将缺席夏日游戏节2025-07-11 07:17
2025奇迹mu官网手游版 官网奇迹手游最新版推荐2025-07-11 06:58
ShadPS4模拟器更新至0.9.0版本:兼容性有了重大升级2025-07-11 06:53
宣布开通,黄茅海跨海通道举行通车活动2025-07-11 06:36
愿望清单突破30w!《超级幻想王国》体验版即将推出2025-07-11 06:02
《上古卷轴4:湮灭 重制版》首个补丁发布!内容介绍2025-07-11 05:56
《F1 25》IGN 8分:自《F1 2020》以来系列最出色的作品!2025-07-11 05:51
《最后的生还者2》PC版很棒 Steam在线峰值30690人2025-07-11 05:37
《艾尔登法环:黑夜君临》销量突破350万!还不到一周2025-07-11 05:22
厦门翔安区打造就业“红娘”队伍 多渠道开发就业岗位2025-07-11 07:56
《哆啦A梦》胖虎生日要来了!新周边产品即将推出2025-07-11 07:46
系列新作《消逝的光芒:困兽》将亮相夏日游戏节!2025-07-11 07:21
并未陷入开发地狱!曝《波斯王子:时之沙重制版》仍在开发中2025-07-11 07:20
厦门双胞胎摘得全国创新大奖 作品是缓解交通拥挤方案2025-07-11 07:18
主机优化太糟糕!数毛社怒批《艾尔登法环:黑夜君临》2025-07-11 06:12
序章开启《赤痕:绯红契约》预告片首曝2025-07-11 05:51
PlayStation 618限时优惠宣传片:PS5数字版2799元!2025-07-11 05:42
一些小区正酝酿新“停车规定”:车位禁止卖给“外人”2025-07-11 05:32
联想Legion Go S掌机现已上市!海量掌机美图欣赏2025-07-11 05:17