您好!欢迎访问云南省人工智能重点实验室
科研成果
当前位置:首页>科研成果>专利

专利


名称: 一种基于条件随机场的越南语分词方法 
作者: 余正涛,熊明明,郭剑毅 
类型: 发明专利  
状态: 已授权  
专利号/登记号: 201510412992.3 
申请日/受理日: 2015-07-15 
公告日: 2015-10-14 
授权日: 2018-08-31 
简介: 本发明涉及一种基于条件随机场的越南语分词方法,属于自然语言处理技术领域。本发明包括首先对提取出的越南语语料进行分词建模,再把待分词的句子级测试语料通过建好的模型进行分词。本发明提出的基于条件随机场的越南语分词方法,对越南语句子实现了有效的切分,为词性标注、句法分析和机器翻译等工作做铺垫;通过与现有的越南语分词工具VnTokenizer比较,本文的越南语分词方法在准确率、召回率和F值上都有1%左右的提高;本文的越南语分词方法在同样的测试语料上分词的速度要比VnTokenizer快。