C114
通信人家园
English
公众号矩阵

投稿
举报

量子大观

通信人家园

C114通信网

光通信观察

DVBCN中广5G

2024/10/14 11:29

智谱开源文生图模型CogView3-Plus，相关功能上线智谱清言App

IT之家清源

0

0

智谱技术团队今天宣布开源文生图模型CogView3 及 CogView3-Plus-3B ，该系列模型的能力已经上线“智谱清言”App。

据介绍，CogView3 是一个基于级联扩散的 text2img 模型，其包含如下三个阶段：

第一阶段：利用标准扩散过程生成 512x512 低分辨率的图像。

第二阶段：利用中继扩散过程，执行 2 倍的超分辨率生成，从 512x512 输入生成 1024x1024 的图像。

第三阶段：将生成结果再次基于中继扩散迭代，生成 2048×2048 高分辨率的图像。

官方表示，在实际效果上，CogView3 在人工评估中比目前最先进的开源文本到图像扩散模型 SDXL 高出 77.0%，同时只需要 SDXL 大约 1/10 的推理时间。

CogView3-Plus 模型则在 CogView3（ECCV'24）的基础上引入了最新的 DiT 框架，以实现整体性能的进一步提升。据介绍，其采用 Zero-SNR 扩散噪声调度，并引入了文本-图像联合注意力机制。与常用的 MMDiT 结构相比，它在保持模型基本能力的同时，有效降低训练和推理成本。CogView-3Plus 使用潜在维度为 16 的 VAE。

附地址如下：

开源仓库地址：

https://github.com/THUDM/CogView3

Plus 开源模型仓库：

https://huggingface.co/THUDM/CogView3-Plus-3B

https://modelscope.cn/models/ZhipuAI/CogView3-Plus-3B

免责声明：本文仅代表作者个人观点，与C114通信网无关。其原创性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。

给作者点赞

0 VS 0

写得不太好

相关链接

特别策划

热门文章

烽火通信董事长曾军辞职，总裁蓝海接任

6/16

从消费电子切入光通信：蓝思科技收购空芯光纤厂商同昇光电

6/16

罗博特科：全资子公司ficonTEC正与英伟达合作开发CPO技术

6/17

Grok项目遇挫后，SpaceX将Colossus 1算力租赁给Anthropic

6/15

C114京沪高铁5G-A×AI探访：从“连得上”到“用得好”，中国移动打造高铁通信服务新范式

6/18

最新视频

中国移动5G新通话，是“夯”还是“拉”？

6/16

人事变动 | 邵新华出任中国电信集团总工程师

6/16

余承东：我的字典里只有第一，盘古大模型是全球大模型的先驱者

6/12

看世界杯「舅」用中国移动

6/12

中国移动深耕浙江打造产业升级新标杆

6/12

为您推荐

C114简介联系我们网站地图

Copyright©1999-2025 c114 All Rights Reserved 沪ICP备12002291号-4

C114通信网版权所有举报电话：021-54451141 用户注销