随着搜索引擎的飞速发展,将互联网文本内容结构化,从中抽取有用的概念、实体,建立这些实体间的语义关系,从而构建海量知识图谱,对于文本内容的语义理解以及搜索结果的精准化有着重要的意义。本报告将结合研究组近些年的研究工作,介绍我们在海量知识挖掘(半结构化文本的属性挖掘、非结构化文本的实体关系分类)、知识问答(自然语言问句到结构化知识库查询语句映射)等方面的研究工作。
刘康
博士,中科院自动化所模式识别国家重点实验室助理研究员,中国计算机学会会员,中国中文信息学会青年工作委员会执行委员。先后于2002年、2005年获得西安电子科技大学学士、硕士学位。2010年于中科院自动化所获得博士学位后留所工作。研究领域包括信息抽取、网络挖掘、问答系统等。在自然语言处理、知识工程等领域国际重要会议和期刊发表论文二十余篇(如TKDE、ACL、IJCAI、EMNLP、COLING、CIKM等),获得COLING 2014最佳论文奖。同时,作为项目技术负责人,主持了中文百科知识问答、百科知识抽取平台等多个系统的研发,这些系统已经在中国大百科全书出版社、华为等多个企事业单位得到应用。
2014年9月23日星期二,14:30.