金融界2024年1月2日消息,据国家知识产权局公告,腾讯科技(深圳)有限公司申请一项名为“网页处理方法、装置、设备、存储介质及程序产品“,公开号CN117332759A,申请日期为2023年9月。
专利摘要显示,本申请提供了一种网页处理方法、装置、电子设备、计算机可读存储介质及计算机程序产品;方法包括:从网页中提取待处理文本,并获取符合信息抽取需求的指令文本;对所述待处理文本以及所述指令文本进行拼接处理,得到融合文本;对所述融合文本进行字符预测处理,得到所述待处理文本中符合所述指令文本的预测答案;对所述预测答案进行文本解析处理,得到所述网页的且符合所述信息抽取需求的信息抽取结果。通过本申请,能够提高网页中信息抽取的准确度。