新京报贝壳财经讯(记者罗亦丹)3月4日,智谱发布了“2025开源年”的第一个模型:首个支持生成汉字的开源文生图模型——CogView4,其在DPG-Bench基准测试中的综合评分排名第一,该模型也是首个遵循Apache 2.0协议的图像生成模型。
CogView4支持中英双语提示词输入,擅长理解和遵循中文提示词,是一款能够在画面中生成汉字的开源文生图模型,能更好地满足广告、短视频等领域的创意需求。在技术实现上,CogView4将文本编码器从纯英文的T5 encoder换为具备双语能力的GLM-4 encoder,并通过中英双语图文进行训练,使CogView4模型具备双语提示词输入能力。

CogView4生成的图片
校对 穆祥桐
相关文章:
广东:推动政府等公共服务机构率先接入人工智能大模型04-30
当教育遇见未来——看绥阳这所乡镇学校的科艺融合教育04-24
晨会观点速递:宁德时代快充、钠电等新品发布,打开负极材料新空间04-22
天工机器人获首个人形机器人半马冠军04-19
机器人开跑!全球首个人形机器人半马开赛04-19
广东英德:以数字检察助力法律监督提质增效04-17
首个云超算国标正式发布04-17