金融界2024年1月6日消息,据国家知识产权局公告,杭州安恒信息技术股份有限公司申请一项名为“一种短文本匹配方法、装置、设备及存储介质“,公开号CN117349487A,申请日期为2023年11月。
专利摘要显示,本申请公开了一种短文本匹配方法、装置、设备及存储介质,涉及文本分类技术领域,包括:对为目标业务数据编写的各正则表达式进行预处理,并对预处理后表达式进行分类得到多个分类后表达式组,并对各分类后表达式组中的正则表达式进行相似度计算得到第一相似度值;判断第一相似度值是否超过第一阈值,若是则从超过第一阈值的第一相似度值对应的分类后表达式组中确定出任意一个正则表达式得到目标表达式,并删除各分类后表达式组中除目标表达式外的所有表达式得到第一删除后表达式组;利用优化后的DBSCAN算法对所有第一删除后表达式组中的表达式进行聚类得到聚类后表达式簇以对短文本进行匹配。本申请能够提高短文本匹配的准确率和效率,降低误报率。