![]() |
一种结合相似度和图匹配的老-汉双语句子对齐方法 |
![]() |
周兰江,李思卓,张建安 |
![]() |
发明专利 |
![]() |
已授权 |
![]() |
201810225609.7 |
![]() |
2018-03-19 |
![]() |
2018-09-18 |
![]() |
2021-06-18 |
![]() |
本发明涉及一种结合相似度和图匹配的老?汉双语句子对齐方法,属于自然语言处理和机器学习技术领域。本发明首先依据构建的老?汉双语词典计算出老挝语和汉语句子的相似度值,然后充分考虑双语句子长度信息,计算出老挝语和汉语句子长度比例值,综合两个值计算出老挝语和汉语句子相似度值,使得老?汉双语句子相似度计算具有较高的可靠性,这样就能在对齐过程中将相似度较高的老挝语和汉语句子进行对齐,简化句子对齐的流程。本发明能够有效地从双语语料库中挖掘出平行句对,老?汉双语句子相似度的计算和二部图的最佳匹配算法充分结合,能够有效提高句子对齐的准确率,因此本发明具有一定的研究意义。 |