面向web数据的信息抽取及融合技术研究 pdf下载
限时特惠
00:00:00
活动结束后恢复原价
纸质书参考价
¥23
电子版限时价
¥5.99
省 18 元
选择版本
内容简介
本篇主要提供面向web数据的信息抽取及融合技术研究电子书的pdf版本下载,本电子书下载方式为百度网盘方式,点击以上按钮下单完成后即会通过邮件和网页的方式发货,有问题请联系邮箱ebook666@outlook.com
编辑推荐
本书以“事件”为切入点,通过介绍事件抽取、事件类型及元素识别、事件信息融合等领域发展状况,将信息抽取领域的代表性处理手段进行了系统的介绍,形成有机的整体。同时,本书在模型和技术的介绍之外,还以实际的网络舆情监测分析系统为案例,介绍在实际生产环境中对于各种模型和技术的应用。
内容简介
随着Web数据的不断扩充,如何从Web数据中抽取信息并融合成指导决策的情报,已成为广泛关注的领域。面向Web数据的信息抽取和融合可以通过统计、在线分析处理、情报检索、机器学习、专家系统、模式识别等诸多方法来实现上述目标。
本书是信息抽取领域的学术著作,旨在从情报检索的视角介绍面向非限定领域的Web数据分析及处理方法。本书从基本概念讲解信息抽取以及融合,涉及词、句、篇章等层面的分析和处理策略,特别是针对情报处理的需要,以“事件”为切入点,将包括中文分词、词性标注、组块划分、句法分析、*大熵模型、条件随机域模型、马尔科夫模型等各类相关的处理模型和技术融入事件抽取、事件类型及元素识别、事件信息融合等领域的具体处理任务中加以介绍,并对信息抽取及融合等领域的发展状况及代表性处理手段进行介绍。
本书是信息抽取领域的学术著作,旨在从情报检索的视角介绍面向非限定领域的Web数据分析及处理方法。本书从基本概念讲解信息抽取以及融合,涉及词、句、篇章等层面的分析和处理策略,特别是针对情报处理的需要,以“事件”为切入点,将包括中文分词、词性标注、组块划分、句法分析、*大熵模型、条件随机域模型、马尔科夫模型等各类相关的处理模型和技术融入事件抽取、事件类型及元素识别、事件信息融合等领域的具体处理任务中加以介绍,并对信息抽取及融合等领域的发展状况及代表性处理手段进行介绍。
作者简介
王君泽,1982年生,工学博士,管理学博士后,华中科技大学公共管理学院硕士生导师。2010年毕业于华中科技大学电子与信息工程系,获博士学位。主要研究方向为网络舆情、国家信息安全、公共情报管理等。目前已经在IEEE Intelligent Systems、《新闻与传播研究》、《管理世界》、《情报学报》等国内外权威刊物上发表论文多篇。主持自然科学基金项目一项。
精彩书评
历届MUC会议的召开推进了信息抽取技术的发展:首届MUC会议虽然是探索性的,但是它拉开了信息技术蓬勃发展的序幕;MUC2开始有了明确的任务定义,规定了模板槽的填充规则,信息抽取的过程被定义为一个模板填充的过程;MUC3开始引入正式的评测规则,并借用信息检索领域的准确率和召回率等概念对抽取结果进行评测;从MUC4开始,MUC系列会议被纳入了美国国防高级研究计划委员会组织的TIPSTER文本项目;MUC5会议中,组织者引入平均填充错误率(error per response fill,ERRF)作为主要评测标准,在MUC5中还引入了嵌套的模板结构,信息抽取模板借助面向对象的思想,可以由若干个子模板组成;MUC6会议中,除了原有的场景模板填充任务外,又引入了三个评测任务:命名实体识别、共指关系确定和模板元素填充;*后一届MUC会议MUC7中又增加了一项评测任务:关系抽取(模板关系,template relation)任务,用来确定实体与特定领域无关的关系。
随着MUC会议的停办,美国国家标准技术研究院(NIST)组织了自动内容抽取(automatic content extraction,ACE)评测会议,它从1999年开始继续进行信息抽取方面的评测。
ACE评测从1999年7月开始酝酿,2000年12月正式开始启动。其研究的主要内容是自动抽取新闻语料中出现的实体、关系、事件等信息。目前ACE评测主要有两大任务:实体识别与跟踪(entity detection and tracking,EDT)和关系识别与描述(relation detection and characterization,RDC)。ACE评测不针对具体的领域或场景,采用基于漏报和误报为基础的一套评价体系,还对系统跨文档处理能力进行评测。
随着MUC会议的停办,美国国家标准技术研究院(NIST)组织了自动内容抽取(automatic content extraction,ACE)评测会议,它从1999年开始继续进行信息抽取方面的评测。
ACE评测从1999年7月开始酝酿,2000年12月正式开始启动。其研究的主要内容是自动抽取新闻语料中出现的实体、关系、事件等信息。目前ACE评测主要有两大任务:实体识别与跟踪(entity detection and tracking,EDT)和关系识别与描述(relation detection and characterization,RDC)。ACE评测不针对具体的领域或场景,采用基于漏报和误报为基础的一套评价体系,还对系统跨文档处理能力进行评测。