互联网信息的爆炸性增长给用户带来了信息过载的问题。例如,互联网上关于某一热点新闻事件通常有成百上千篇新闻报道,关于某个研究问题通常存在大量的相关学术文献,这些海量信息通常让用户疲于应对。信息摘要技术则能对海量内容进行提炼与总结,以简洁、直观的摘要来概括用户所关注的主要内容,方便用户快速了解与浏览海量内容。与传统的文档摘要任务相比,目前的信息摘要技术的范畴和应用面均得到了极大的延伸和扩展。本报告将首先回顾信息摘要技术的发展历程,并总结自己在信息摘要方面的研究体会,最后对大数据时代的信息摘要技术进行展望。
万小军,北京大学计算机科学技术研究所研究员(教授),研究方向为文本挖掘与自然语言处理,当前主要研究兴趣包括信息摘要与文本生成、情感分析与观点挖掘、信息关联与推荐等。已发表学术论文70多篇,其中在SIGIR/ACL/AAAI/IJCAI/TOIS/TKDE/TASLP/CL等顶级国际会议与期刊上发表论文30多篇。担任相关领域国际顶级与一流学术会议(ACL、SIGIR、CIKM、COLING、EMNLP、NAACL等)程序委员会委员,并担任多个国际权威与一流学术期刊(TALIP、TOIS、TKDE、TALSP、TIST、TACL等)审稿人。担任自然语言处理领域顶级国际会议ACL2011领域主席(情感分析),并受邀担任ACL2015领域主席(摘要与生成)。参加文本推理、语义分析等多项国际评测任务均取得第一名的优异成绩,长期担任NLPCC会议评测主席。个人信息详见:https://sites.google.com/site/wanxiaojun1979。
2014年9月30日(二)14:00-16:00
中信所419会议室