历届MUC会议的召开推进了信息抽取技术的发展:首届MUC会议虽然是探索性的,但是它拉开了信息技术蓬勃发展的序幕;MUC2开始有了明确的任务定义,规定了模板槽的填充规则,信息抽取的过程被定义为一个模板填充的过程;MUC3开始引入正式的评测规则,并借用信息检索领域的准确率和召回率等概念对抽取结果进行评测;从MUC4开始,MUC系列会议被纳入了美国国防高级研究计划委员会组织的TIPSTER文本项目;MUC5会议中,组织者引入平均填充错误率(error per response fill,ERRF)作为主要评测标准,在MUC5中还引入了嵌套的模板结构,信息抽取模板借助面向对象的思想,可以由若干个子模板组成;MUC6会议中,除了原有的场景模板填充任务外,又引入了三个评测任务:命名实体识别、共指关系确定和模板元素填充;*后一届MUC会议MUC7中又增加了一项评测任务:关系抽取(模板关系,template relation)任务,用来确定实体与特定领域无关的关系。
随着MUC会议的停办,美国国家标准技术研究院(NIST)组织了自动内容抽取(automatic content extraction,ACE)评测会议,它从1999年开始继续进行信息抽取方面的评测。
ACE评测从1999年7月开始酝酿,2000年12月正式开始启动。其研究的主要内容是自动抽取新闻语料中出现的实体、关系、事件等信息。目前ACE评测主要有两大任务:实体识别与跟踪(entity detection and tracking,EDT)和关系识别与描述(relation detection and characterization,RDC)。ACE评测不针对具体的领域或场景,采用基于漏报和误报为基础的一套评价体系,还对系统跨文档处理能力进行评测。