金融界2024年2月24日消息,据国家知识产权局公告,阿里巴巴(中国)有限公司申请一项名为“图像生成方法、模型训练方法及对应装置“,公开号CN117593400A,申请日期为2023年11月。
专利摘要显示,本申请实施例公开了一种图像生成方法、模型训练方法及对应装置,涉及计算机视觉技术领域。主要技术方案包括:获取输入的提示文本和N个控制条件,所述N为正整数;利用驱动控制层对所述N个控制条件进行编码,得到各控制条件的特征表示;利用控制融合层对所述各控制条件的特征表示进行融合,得到融合特征表示;将所述提示文本、所述融合特征表示和噪声图像输入图像生成模型,获取所述图像生成模型生成的结果图像,其中所述图像生成模型基于扩散模型实现。本申请的图像生成不仅能够得到提示文本的引导,还能够在N个控制条件的指导下更加精细化地控制图像生成,提高图像生成的灵活性。