corenlp斯坦福大学开发的基于java语言的自然语言处理工具,能够为文本多种语言学标注,包括分词,句子边界,词性标注,命名实体识别,数字与时间,句法解析(dependency and constituency parses),指代消解,情感,引用归因,关系。目前支持6种语言:阿拉伯语、汉语、英语、法语、德语和西班牙语。

一个原始句子,会经过上图一系列的标注处理,产生标注集合。
词性标注:

命名实体识别:

依存句法解析:

指代消解:

使用流程:
(0)需要java环境,提前安装好JDK,运行jave -version,有结果,即为安装好。
(1)从官网下载并解压 CoreNLP 4.2.2
(2)根据所要处理的语言,下载相应的jar包,放

6405

被折叠的 条评论
为什么被折叠?



