金融界2024年1月11日消息,据国家知识产权局公告,腾讯科技(深圳)有限公司取得一项名为“文本对抗样本的生成方法、装置、电子设备和存储介质”,授权公告号CN116911374B,申请日期为2023年9月。
专利摘要显示,本申请涉及文本处理技术领域,尤其涉及一种文本对抗样本的生成方法、装置、电子设备和存储介质,用以解决目前对抗样本生成方法所存在的局限性,提出一种在句子粒度上的对抗样本的生成方法。其中,方法包括:获取预先构建的句子样本检索库,句子样本检索库中包含多个候选句子,以及每个候选句子各自对应的语义特征;对于每个原始句子,提取原始句子的语义特征;将原始句子分别与句子样本检索库中各个候选句子,进行语义特征匹配;根据特征匹配结果,从各个候选句子中筛选出至少一个目标候选句子;以每个原始句子各自对应的目标候选句子作为相应原始句子的对抗样本,构建训练样本集。本申请提出了一种在句子粒度上的对抗样本的生成方法。