本站支持尊重有效期内的版权/著作权,所有的资源均来自于互联网网友分享或网盘资源,一旦发现资源涉及侵权,将立即删除。希望所有用户一同监督并反馈问题,如有侵权请联系站长或发送邮件到ebook666@outlook.com,本站将立马改正
语音识别技术得益于深度学习的发展,已经走进了我们的生活。但是,复杂开放环境下的语音交互是目前语音识别技术发展中无法回避的挑战性难题。本书面向这个主题,从物理层的信号与噪声分离、神经生理层的听觉流分离以及心理认知层的听觉空间注意,进行了全方位地分析;从信号处理的技术实现、计算建模以及听障应用的角度进行了详细地阐述。
语音识别技术得益于深度学习的发展,已经走进了我们的生活。但是,“鸡尾酒会问题”是目前语音识别技术发展中无法回避的挑战性难题。本书从物理层的信号与噪声分离、神经生理层的听觉流分离以及心理认知层的听觉空间注意的方面,对“鸡尾酒会问题”进行了全方位分析;从信号处理的技术实现、计算建模以及听障应用的角度,对听觉系统建模进行了详细阐述。本书对促进语音技术从感知智能到认知智能的发展有着重要的参考价值。目前,涉及此类内容的中文参考书籍极缺,本书的出版弥补了这一缺憾。译者长期从事该领域的技术研究工作,全书用词准确、行文流畅,是一本难能可贵的前沿性技术书籍,特此予以推荐。
——党建武,天津大学智能与计算学部教授,天津市认知计算与应用重点实验室主任
日本北陆先端科学技术大学院大学兼职教授,中国计算机学会语音对话与听觉专业组主任
本书对近年来鸡尾酒会问题相关的听觉心理学、生理学和认知神经科学的*新研究进展进行了仔细的梳理和系统性的组织,无论从投入精力还是难度上看,这在听觉研究领域都是一项大工程,是一件可喜可贺的大事。通览全书将使你对听觉客体、选择注意、能量掩蔽、信息掩蔽等概念,以及听觉流形成和听觉场景分析计算框架等,形成一个深入全面的认识。重新审视目前语音工程中的基本模块和系统框架,将会激发出新的思想火花和有效的解决思路。
——吴玺宏,北京大学教授,信息科学技术学院副院长,智能科学系主任
言语听觉研究中心主任
听觉处理是言语认知的重要基础,对语音识别、语音增强和认知科学的发展具有重要作用,而鸡尾酒会场景的听觉处理技术是其中具有挑战性的难题。本书从信号层和神经认知层等多个不同的维度,详细阐述了听觉形成的机理和听觉场景的计算框架,以及针对鸡尾酒会问题的详细解决思路,对选择注意、信息掩蔽等现象也进行了深入分析,将能够帮助研究人员系统性地掌握听觉处理的理论与方法,对从事听觉处理技术、语音识别技术、认知科学等方面的研究具有重要的参考价值。译者在该领域有很高的造诣,对原文中的原理性描述,尤其是涉及认知科学的听觉场景计算方法,均能够以准确易懂的方式进行阐述。
——陶建华,中国科学院自动化研究所研究员,模式识别国家重点实验室副主任
中欧信息自动化应用数学联合实验室中方主任,国家杰出青年科学基金获得者
国家万人计划领军人才