您好!欢迎访问云南省人工智能重点实验室
科研成果
当前位置:首页>科研成果>专利

专利


名称: 基于组块的越南语短语树构建方法 
作者: 郭剑毅,李英,余正涛,线岩团,毛存礼,陈玮 
类型: 发明专利  
状态: 已授权  
专利号/登记号: 201610497061.2 
申请日/受理日: 2016-06-30 
公告日: 2016-12-07 
授权日: 2019-05-14 
简介: 本发明涉及基于组块的越南语短语树构建方法,属于自然语言处理技术领域。本发明首先对越南语短语树标注集进行上层组块和基层组块标注;选取上层组块和基层组块的特征集,再构建基于组块的越南语短语树库构建模型;利用组块分析工具对分词后的越南语句子进行组块分析,得到基于组块构建的初级越南语短语树库;利用短语树库校正器对基于组块构建的初级越南语短语树库进行校正,最后得到校正后的终级越南语短语树库。本发明避免了人工收集和标注越南语短语树库的过程,节省了人力和构建树库的时间;本发明提出的构建短语树的方法相比采用上下文无关文法构建越南语短语树库和最大熵构建越南语短语树库方法准确率明显提高。