- 问题相似度计算,即给定客服里用户描述的两句话,用算法来判断是否表示了相同的语义。
- 示例:
- “花呗如何还款” --“花呗怎么还款”:同义问句
- “花呗如何还款” -- “我怎么还我的花被呢”:同义问句
- “花呗分期后逾期了如何还款”-- “花呗分期后逾期了哪里还款”:非同义问句
对于例子a,比较简单的方法就可以判定同义;对于例子b,包含了错别字、同义词、词序变换等问题,两个句子乍一看并不类似,想正确判断比较有挑战;对于例子c,两句话很类似,仅仅有一处细微的差别 “如何”和“哪里”,就导致语义不一致。
见比赛官网
基于Python2.7
updated 6 April 2019.