![]() |
一种结合序列和主题信息的无监督方面词提取方法 |
![]() |
相艳,殷润达 |
![]() |
发明专利 |
![]() |
已授权 |
![]() |
202110151682.6 |
![]() |
2021-02-03 |
![]() |
2021-06-08 |
![]() |
2022-08-02 |
![]() |
本发明涉及结合序列和主题信息的无监督方面词提取方法。本发明包括:获得具有上下文表征的词向量、评论中每一个单词所对应序列信息;使用序列注意力对序列信息进行滤除获得新的序列信息;使用ETM对评论进行编码获得整体评论的主题信息;使用主题注意力将获得的新的序列信息和获得的整体评论的主题信息进行结合获得含有序列信息的主题信息:获得的含有序列信息的主题信息通过softmax分类器得到主题分布;使用神经网络获得有关评论的类别向量;使用得到的词向量和类别向量,通过softmax分类器获得方面词分布,再通过方面词分布得到评论中的方面词;本发明具有较好的性能;本发明能够获得含有潜在语义信息的方面词。 |