ai-svg ai-svg ai-svg ai-svg ai-svg ai-svg ai-svg ai-svg ai-svg ai-svg ai-svg
Z-ImageLogo
首页 > AI绘画 > 文图生图

Z-Image

Z-Image是阿里巴巴通义实验室(Tongyi Lab)推出的开源图像生成与编辑模型,参数规模为6B(60亿),于2025年11月正式发布。

标签: 开源图像生成与编辑模型

Trae

Z-Image是什么?

Z-Image是阿里巴巴通义实验室(Tongyi Lab)推出的开源图像生成与编辑模型,参数规模为6B(60亿),于2025年11月正式发布。其核心目标是通过高效架构和算法设计,在低资源设备上实现高质量的图像生成能力,同时支持精准的双语文本渲染和复杂指令编辑。

Z-Image(图1)

Z-Image核心特点

  • 高效生成与低资源适配
    • 仅需8步推理(NFEs)即可生成高质量图像,在H800 GPU上实现亚秒级延迟(<1秒)。
    • 支持消费级显卡(如16GB显存的RTX 5060 Ti),通过优化技术(如FP8量化)可进一步降低显存需求至8GB甚至6GB。
  • 多语言文本渲染能力
    • 精准生成含中英文混合文本的图像,适用于海报设计、多语言广告等场景,且文字清晰、排版自然。
  • 多版本模型适配不同需求
    变体 功能 适用场景
    Z-Image-Turbo 蒸馏优化版,8步快速生成 实时应用、低显存设备
    Z-Image-Base 基础模型,支持微调与自定义开发 开发者社区、二次训练
    Z-Image-Edit 图像编辑专用,支持自然语言指令编辑 创意修改、风格调整
  • 技术创新
    • 单流DiT架构(S3-DiT):整合文本、视觉语义和图像标记,提升参数效率。
    • 解耦DMD与DMDR技术:分离CFG增强与分布匹配机制,结合强化学习优化图像细节和语义对齐。

Z-Image性能表现

  • 图像质量:在开源模型中达到领先水平,细节还原度高(如皮肤纹理、光影效果)。
  • 语义理解:通过"提示词增强器"处理复杂指令(如逻辑题"鸡兔同笼"、古诗意境可视化)。
  • 编辑一致性:Z-Image-Edit支持复合指令(如"让人物微笑+换背景+添加标语"),避免失真。

Z-Image(图2)

如何获取与部署Z-Image

Z-Image应用场景

  • 创意设计:生成艺术作品、广告素材(如社交媒体海报)。
  • 影视与游戏:快速创建虚拟场景、角色或特效元素。
  • 教育:生成教学插图(如历史场景、科学现象)。
  • 图像编辑:通过自然语言指令修改图像(如换背景、调整人物表情)。



特别声明: AI资源导航站提供的Z-Image等网址链接均来源于网络或用户投稿,本站不保证其准确性和完整性,同时该外部链接的指向,不受AI资源导航站的实际控制。如果链接出现违规,请直接反馈或联系网站管理员进行删除处理。
博思 AIPPT

热门应用