- 積分
- 21673
- 威望
- 21673
- 金錢
- 21910
- 最後登錄
- 2024-11-24
|
1、词表穷举法:
最简单直接的方法,通过词表癿直接匹配来获取查询意图,也可加入适用于较为简单且查询较为集中的类别,比如电视台节目查询,节假日查询,餐馆查询等。
优缺点:
简单易实现,能很好癿解决高频词,但召回比较低,人工比例较高,且无法解决长尾查询词。
2、规则解析法:
适用于一些查询虽然不集中但非常符合规则的类别,通过规则解析查询来做意图识别和关键信息提取癿,比如汇率查询,计算器,度量衡等。
优缺点:
信息提取准确,配合简单类别识别模型可以得到较不错的识别精度,只适用规则性较强的类别。
3、统计模型分类法:
查询词分类:基于查询词本身的分类,也就是建立基于字面意思的统计分类模型。
查询词扩展分类:基于查询词的扩展信息的分类,也就是基于真是社会知识的分离,通常是搜索结果扩展。
优缺点:
实现较为复杂,数据获取困难,数据更新困难,但效果较好,稳定性好,通用性好,在持续更新语料的条件下,可以通过流程自动更新 |
-
1
評分人數
-
|