智谱推出CogView4,首个支持生成汉字的开源文生图模型

CogView4的核心亮点

性能卓越:CogView4具备强大的复杂语义对齐和指令跟随能力,支持任意长度的中英双语输入,并能生成任意分辨率的图像。

中文理解与生成:作为首个支持生成汉字的文生图模型,CogView4能够将中英文字符自然融入画面,满足广告、短视频等创意领域的需求。

技术突破:模型采用二维旋转位置编码(2D RoPE)和多阶段训练策略,支持长文本提示词输入,显著提升了训练效率和创作自由度。

开源与生态支持:CogView4遵循Apache 2.0协议,后续将增加ControlNet、ComfyUI等生态支持,并推出微调工具包。

智谱推出CogView4,首个支持生成汉字的开源文生图模型
© 版权声明

相关文章

暂无评论

none
暂无评论...