识别给定文本中出现的命名实体(Named Entity),并映射到特定的知识库中唯一的实体。包括命名实体识别、消歧等工作。
主要涉及内容包括:
(1) 服务器CGI支持;
(2) LDA文本主题提取,尝试进行实体消歧;
(3) 搭建Solr索引;
最终结果以Chrome插件(Chrome extension)的形式展示,用户可以在浏览网页时选择网页一段文本,直接点击插件,识别选中文本中出现的entity。
效果如下:
说明请参看:介绍文档.pdf
效果演示参看:演示Demo.mov