10月5日,国际大模型竞技场LMArena最新文生图榜单显示,混元图像 3.0在全球26个大模型中,高居第一位。这一结果来自全球所有用户的“盲测”,这也标志着混元在多模态生成方面达到全球领先水平。
LMArena官方社交平台也第一时间发文祝贺:“文生图排行榜大洗牌!腾讯混元图像3.0登顶竞技场——同时被评为最佳综合文生图模型与最佳开源文生图模型。这款图像生成模型已超越Seedream 4,以及代号"nano-banana"的Gemini 2.5 Flash Image Preview。重大突破,恭喜腾讯混元。”
9 月初,腾讯混元开源的图像2.1已是当时效果最佳的开源生图模型。此次混元图像3.0更上一层楼,首次夺得文生图榜单冠军,超越众多顶级闭源模型,展现出强大的技术实力。
LMArena是美国加州大学伯克利分校推出的创新AI模型评估平台,评测核心方法是基于人类真实偏好的“盲测”机制,让用户对不同AI模型的回答进行匿名投票,衡量模型的表现。用户输入问题后,平台提供两个模型的回答,用户根据偏好选择更优答案,投票结果直接塑造公共排行榜。 由于该平台访问量巨大,并且评测机制贴近实际体验,是目前国际上最权威的竞技场榜单。
混元图像3.0是腾讯9月28日发布并开源的原生多模态生图模型。这是首个开源工业级原生多模态生图模型,也是目前效果最好的开源生图模型。混元图像3.0具备常识并能够利用知识进行推理;同时语义理解准确度高,并具备极致美学质感,能生成真实的高质感图片;支持中英文文字生成,长文本文字渲染。
混元图像3.0模型也同样受到开发者的欢迎,发布后不久即登上了Hugging Face开源社区模型热榜的第一名,持续一周稳居第一;如今又登上了LMarena榜单的榜首,反映了用户与社区对模型的关注与认可。
腾讯混元团队透露,混元图像3.0目前的版本已开放了文生图能力,图生图、图像编辑、多轮交互等版本将于后续发布。
理解世界知识,可基于简单提示词自主推理生成
精确生成文字,支持长文本渲染
准确理解复杂语义
多格表情包生成
写实感与美学提升
多模态正在成为混元大模型的核心竞争力之一,混元3D与图像生成模型均处于行业顶尖水平。在3D生成领域,8月上海人工智能实验室的全球3D生成模型评测榜单显示,混元3D模型在图生3D和文生3D任务中均位列第一;混元世界模型Voyager在斯坦福大学WorldScore基准测试中综合能力排名首位。
混元目前已形成语言、图像、视频、3D模型的多尺寸、多模态开源矩阵,提供接近商业模型性能的开源基座。图像、视频衍生模型数量总数达到3000个,混元3D系列模型社区下载量超过260万,是全球最受欢迎的3D开源模型。