金融界2024年3月16日消息,据国家知识产权局公告,深圳云天励飞技术股份有限公司申请一项名为“文本纠错方法、装置、电子设备及存储介质“,公开号CN117709335A,申请日期为2023年12月。
专利摘要显示,本发明实施例提供一种文本纠错方法,该方法包括:获取待纠错文本;将待纠错文本输入至预设的大规模语言模型内进行文本纠错处理,得到已纠错文本;基于待纠错文本以及已纠错文本,确定待纠错文本至已纠错文本之间的编辑距离矩阵,编辑距离矩阵包括待纠错文本中各字符与已纠错文本中各字符之间的编辑操作数;基于编辑距离矩阵中的编辑操作数,确定待纠错文本的纠错结果。通过大规模语言模型的文本纠错能够统一纠错不同纠错方式的文本错误,综合考量了编辑操作数与各文本之间的编辑相关性,从而在进行文本纠错时效率更高,且通过纠错结果能够更直观的展示文本错误的问题所在以及纠错方式。