腾讯混元生图是腾讯公司开发的一种基于人工智能的图像生成模型。该模型采用了DiT(Diffusion With Transformer)架构,这是一种结合了扩散技术和变换器(Transformer)的先进架构,类似于Sora和Stable Diffusion 3 。
混元生图模型支持中英文双语输入及理解,具有15亿参数量,使其在处理中文内容时表现出色,能够理解和生成与输入相关的高质量图像内容 。此外,该模型还具备多轮对话能力,增强了其在实际应用中的灵活性和实用性。
自2023年10月首次对外开放以来,混元生图经历了多次版本更新迭代,不断提升其代码能力和图像生成能力。据报道,其代码能力已达到业界领先水平,提升了20% 。
2024年5月14日,腾讯宣布混元生图大模型全面升级并对外开源,该模型已在Hugging Face平台及Github上发布,包含模型权重、推理代码、模型算法等完整模型,可供企业与个人开发者免费商用 。
相关导航
暂无评论...