金融界2024年3月16日消息,据国家知识产权局公告,神思电子技术股份有限公司申请一项名为“一种基于大模型的文档问答的训练样本构造方法和装置“,公开号CN117709429A,申请日期为2023年12月。
专利摘要显示,本发明提供了一种基于大模型的文档问答的训练样本构造方法和装置,属于人工智能自然语言生成技术领域。本发明利用大模型海量先验知识,通过构造prompt集和链式推理过程,自动构造一批高质量训练样本,包括:准备基础文档集,构造问答对生成的prompt生成指令指定的问答对格式的数据集,对基于数据集进行蕴含关系判断、质量判断和泛化判断构造相似问题集,对问题集进行质量判断和扩充得到训练样本。此过程无需人工编写样本,可生成质量与人工编写相媲美的样本,大大了降低构造训练样本的门槛,提升了研发人员的工作效率和工作质量。