阿里开源图像大模型,实测中文渲染能力绝了!精准搞定复杂字体排版,硬刚字节OpenAI
原文

2025-08-05 19:00
141
阿里开源了Qwen-Image图像生成基础模型,该模型具备强大的中文文本渲染能力,能够准确生成不同语种、风格的文字,包括毛笔字书法和带有文本的PPT页面。Qwen-Image采用MMDiT架构,支持多种艺术风格,并在多个公开基准测试中表现优异,特别是在中文文本渲染方面大幅领先现有模型。模型已在魔搭、Hugging Face等社区开源,普通用户可通过QwenChat体验。

全部评论