简介

官方地址:
https://github.com/Tongyi-MAI/Z-Image
https://huggingface.co/Tongyi-MAI/Z-Image-Turbo

阿里开源的Z-Image是一款轻量级文生图模型,参数仅6B,主打“低步数、低显存、高质量”。其视觉质量被报道为可接近约20B级商业模型,同时提供Turbo / Base / Edit三大变体,覆盖高效推理与图像编辑两大场景,并强调中英双语文字渲染与复杂指令理解能力。模型以Apache 2.0许可开放,面向开发者与创意从业者降低门槛。
排名

测试效果(真的强👍)
提示词 | 生成内容 |
超写实摄影风格(扩写版) 提示词: “超写实微距摄影,清晨金色柔光透过薄雾洒在一片沾满晶莹露珠的深红色玫瑰花瓣上,花瓣边缘泛着细微的水光折射,背景是虚化的绿叶与朦胧光斑,浅景深 f/1.4 大光圈,佳能微距镜头拍摄,焦点精准落在露珠内部映出的微小世界,纹理纤毫毕现——可见细胞状脉络与绒毛,肤色般的自然色彩过渡,影棚级布光结合环境散射光,整体呈现静谧而富有生命力的质感。” 测试点:微观细节、光影折射与水珠表现、景深与焦外虚化、色彩自然过渡、质感真实感。 | 
|
赛博朋克未来都市(扩写版) 提示词: “夜幕下的赛博朋克巨型都市,无数摩天楼体覆盖全息广告与流动数据屏,霓虹灯光以青紫、品红、电蓝交织泼洒在积水的街道,雨滴在地面形成瞬生瞬灭的光圈;空中悬浮车道上有流线型飞行汽车拖曳光尾疾驰,远处巨型球形能量塔脉动光芒穿透雾霾;街道上人群身着反光材质服饰,与机械义肢的细节相呼应;整体高对比度、饱和色彩与阴影浓重并存,带有电影《银翼杀手2049》般的潮湿冷冽氛围与未来疏离感。” 测试点:复杂城市场景构建、动态光影反射、人群与载具细节、色彩饱和度控制、情绪氛围渲染。 | 
|
黑白素描 / 线稿艺术(扩写版) 提示词: “精细的黑白铅笔素描,描绘一座残缺的古希腊大理石雕像,肌肉线条精准流畅,衣褶随姿态自然垂坠;采用交叉排线与点刻法塑造明暗,从亮部的高光到暗部的深邃渐变层次分明;背景留白处点缀速写式的建筑柱式与陶罐轮廓,暗示古典场景;纸张纹理与铅笔颗粒清晰可辨,局部有轻擦痕迹营造柔和过渡,整体散发米开朗基罗研究手稿的专注与力量美感。” 测试点:线条掌控、灰度层次与体积感、材质肌理表现、艺术技法的还原度、虚实节奏安排。 | 
|
电影级光影概念图(扩写版) 提示词: “电影级科幻概念艺术,远景两颗不同大小的恒星正缓缓沉入异星赤红与橙金的复合地平线,天空布满尘埃云与散射光束;前景一名身穿重型宇航服的探索者立于金属探测平台,肩甲反射双阳光辉,脚下沙地因温差微微蒸腾热气;空气中漂浮着细密金色尘粒,被体积光勾勒出可视轨迹;背景散落着奇异晶岩与废弃的机械残骸,整体高动态范围呈现强烈冷暖对比与史诗孤独感,宛如《沙丘》与《星际穿越》融合的视觉震撼。” 测试点:复杂多光源模拟、大气透视与尘埃粒子、材质反射与细节刻画、情绪氛围与电影质感。 | 
|
混合媒介拼贴艺术(扩写版) 提示词: “混合媒介拼贴作品,以1920年代繁华街市为主题:底层铺陈泛黄破损的老照片——人力车、报童与街头艺人;中层叠加透明水彩晕染的暖橙与赭石色块,表现阳光与蒸汽的氤氲;前景嵌入数字绘制的夸张漫画式招牌与飞鸟剪影;细节处有撕纸纹理、布料纤维扫描与金属箔闪光点缀;人物姿态生动交错,有舞者、商贩与围观孩童,形成时空错位的超现实对话,整体触觉丰富、层次鲜明,兼具怀旧温度与当代视觉实验性。” 测试点:多材质融合与层次构建、跨时代元素混搭、纹理与质感多样性、创意叙事与视觉冲击力。 |
|
极简主义几何抽象(扩写版) 提示词: “极简抽象构图,纯白背景中央悬浮数个半透明几何形体——正圆、椭圆、三角与不规则多边形,彼此交叠处产生柔和的色彩渗透,渐变色调由浅桃粉过渡到薄荷绿再到淡钴蓝;部分形体边缘泛出微弱内发光,令形状在空间中似有浮动感;构图严格遵循黄金比例与视觉平衡,无多余装饰,仅以形状、透明度与色彩关系传递宁静、秩序与现代感,呈现当代平面设计的精炼美学。” 测试点:形状与色彩抽象表达、透明叠加与光效、空间平衡与构图精度、简约而不单调的视觉张力。 |
|
奇幻史诗场景(扩写版) 提示词: “宏大的奇幻史诗风景,天空被双轮彩虹与流动极光切割成瑰丽色块,数座浮空岛屿由水晶与藤蔓编织的发光桥相连,岛缘瀑布倾泻成银河般的光带坠入云海;近景悬崖上矗立着哥特式尖顶城堡,城墙镶嵌符文石,旗帜在魔法风中猎猎作响;天际三头巨龙盘旋,鳞甲反射晨曦,吐息化作蒸汽云雾;地面森林深处隐约可见精灵聚落与古代石阵,空气中弥漫微光粒子与悠远钟声回荡的氛围,呈现磅礴、神秘与生命交织的幻想世界。” 测试点:多层级场景搭建、生物与建筑细节、光影特效(极光、瀑布光带)、幻想元素的合理性、宏大构图的叙事感。 |
|
印象派油画风格(扩写版) 提示词: “印象派风格油画,阳光透过繁茂的法国梧桐洒进一片无边薰衣草田,紫色花海随风起伏形成波浪般的光影律动;前景一位戴宽檐草帽的少女坐在木栅栏边,手中捧着刚采的花束,裙摆染上暖黄阳光与淡紫阴影;中景小径蜿蜒通向远方农舍,屋顶闪烁金辉;笔触松散且富有呼吸感,色彩以柔和的粉紫、鹅黄、天蓝为主,画布肌理清晰可见,仿佛颜料在光影里融化,整体捕捉午后慵懒与芬芳的瞬间。” 测试点:人物与环境的融合、笔触表现力、色彩氛围与光影变化、场景层次与动态感。 |
|
总结
直接就是turbo模型,不用加载4步,8步的LoRA 默认9步出图。速度确实是起飞的。5秒一张。
Base 版本,非蒸馏基础版,开放核心检查点,可以微调,能二开。
更加期待的是它的 edit 模型。目前还没开源。不过块了。已经在路上了。
显存占用

