快讯网首页 |资讯 |财经 |娱乐 |汽车 |时尚 |房产 |健康 |数码 |社会 |图片 |消费 |大盘 |互联网金融 |新车 |试驾 |化妆品 |奢侈品 |二手房 |两性 |曝光台

腾讯混元文生图大模型宣布全面开源:业内首个中文原生DiT架构,弥补了开源社区的空白

发布时间:2024-05-15 09:46:27  来源:快科技 游览:
  5月15日,今日,腾讯旗下混元文生图大模型(混元DiT,Diffusion Models with Transformers)宣布全面开源。

  目前已在Hugging Face、Github上发布,包含模型权重、推理代码、模型算法等完整模型,供企业与个人开发者免费商用。

首个中文原生DiT架构!腾讯混元文生图大模型宣布全面开源

  据媒体报道,腾讯混元文生图负责人卢清林表示,混元DiT开源的价值有两方面。

首个中文原生DiT架构!腾讯混元文生图大模型宣布全面开源

  一方面这是业内首个中文原生DiT架构,弥补了开源社区的空白,另一方面混元DiT为全面开放,与现网版本完全一致。

首个中文原生DiT架构!腾讯混元文生图大模型宣布全面开源

  据介绍,此次开源的混元DiT采用了与Sora同样的背后关键技术——DiT架构,还支持256字中文理解,不仅支持文生图,也可作为视频等多模态视觉生成的基础。

  腾讯方面表示,为了构建混元DiT设计了Transformer结构、文本编码器和位置编码,构建了完整的数据管道,用于更新和评估数据,为模型优化迭代提供帮助。

  为了实现细粒度的文本理解,还训练了多模态大语言模型来优化图像的文本描述。

  最终,混元DiT能够与用户进行多轮对话,根据上下文生成并完善图像。

首个中文原生DiT架构!腾讯混元文生图大模型宣布全面开源

首个中文原生DiT架构!腾讯混元文生图大模型宣布全面开源

首个中文原生DiT架构!腾讯混元文生图大模型宣布全面开源

32.8K
猜您喜欢
热点图片/ Hot picture
排行搒/ The total ranking
热点推荐/ Hot recommendation
  • Copyright © 2012-2024 www.kxnews.cn, All Rights Reserved 版权所有:快讯网 冀ICP备08108040号 冀公网安备 13108202000311号
    欢迎广大网友来本网站投稿,网站内容来自于互联网或网友提供 邮箱:jU6RR2GMQ1@outlook.com