书籍详情
《 大型语言模型实战指南:应用实践与场景落地 刘聪 沈盛宇 李特丽 杜振东》[96]百度网盘|亲测有效|pdf下载
  • 大型语言模型实战指南:应用实践与场景落地 刘聪 沈盛宇 李特丽 杜振东

  • 出版社:机械工业出版社
  • 作者:刘聪 沈盛宇 李特丽 杜振东
  • 出版时间:2024-08-20
  • 热度:2584
  • 上架时间:2025-03-08 06:13:50
  • 价格:0.0
书籍下载
书籍预览
免责声明

本站支持尊重有效期内的版权/著作权,所有的资源均来自于互联网网友分享或网盘资源,一旦发现资源涉及侵权,将立即删除。希望所有用户一同监督并反馈问题,如有侵权请联系站长或发送邮件到ebook666@outlook.com,本站将立马改正

内容介绍

产品特色

编辑推荐

(1)作者资深,质量有保障作者是NLP和AI领域的资深专家,大模型领域的先驱者,实战经验丰富。(2)理论扎实,让你透彻理解大模型核心技术深入解析大模型的基础理论、算法实现、数据构造流程、模型微调方法、偏好对齐方法等,并提供大量代码及注解。(3)注重实战,手把手教你开发大模型应用手把手教你如何构建简单但强大的应用程序,如角色扮演、信息抽取、知识问答、AI Agent等。(4)指导行业实战,让你将大模型真正落地深入探讨了领域特定大模型的应用,如法律、医疗、金融和教育等。

 
内容简介

内容简介 这是一本系统梳理并深入解析大模型的基础理论、算法实现、数据构造流程、模型微调方法、偏好对齐方法的著作,也是一本能手把手教你构建角色扮演、信息抽取、知识问答、AI Agent等各种强大的应用程序的著作。本书得到了零一万物、面壁智能、通义千问、百姓AI、澜舟科技等国内主流大模型团队的负责人的高度评价和鼎力推荐。具体地,通过本书你能了解或掌握以下知识:(1)大型语言模型的基础理论,包括常见的模型架构、领域大型语言模型以及如何评估大模型的性能。(2)大模型微调的关键步骤:从数据的收集、清洗到筛选,直至微调训练的技术细节。(3)大模型人类偏好对齐方法,从基于人工反馈的强化学习框架到当前主流的对齐方法。(4)通过GPTs快速搭建个性化的专属ChatGPT应用。(5)通过开源模型在多种场景下搭建大模型应用,包括:表格查询、角色扮演、信息抽取、知识问答、AI Agent等。(6)掌握大模型Agent方法以及Agent常用框架。(7)基于LangChain框架构建一个AutoGPT应用。本书集大模型理论、实践和场景落地于一体,提供大量经详细注释的代码,方便读者理解和实操。总之,不管里是想深入研究大模型本身,还是进行大模型相关应用搭建,本书都应该能给你颇具价值的技术启发与思考,让你在大模型的路上快速前行,少走弯路。

作者简介
刘聪
资深NLP技术专家和AI技术专家,南京云问科技首席算法架构师,MLNLP(机器学习算法与自然语言处理)社区学术委员。主攻文本向量表征、问答系统、AIGC等技术方向,是大模型领域的先驱者和布道者。开源了首个中文Unilm预训练模型、中文GPT2、夸夸闲聊机器人(ChatBot)、大模型微调等项目。作为主要负责人,在多项自然语言处理比赛中获得前三名,在中文核心期刊和SCI发表多篇论文,有多项发明专利。知乎ID“刘聪NLP”,拥有公众号“NLP工作站”,撰写书籍《ChatGPT原理与实战》。
沈盛宇
资深算法工程师,南京云问网络技术有限公司算法组负责人。擅长结合用户业务场景,针对性设计知识图谱、问答、检索、多模态、AIGC等的相关算法和落地方案。在结合客户现有产品体系,推动数据中台和算法平台结合,从而提升服务质量方面,有丰富实战经验。曾获得多项国家专利,参与制定和撰写《IDP术语标准》《人工智能-智能助理能力等级评估标准》《人工智能标准化与开源研究报告》《ChatGPT原理与实战》等多项国家级人工智能标准和书籍。
李特丽
目  录
CONTENTS
目  录

前言
第1章 大型语言模型基础 1
1.1 Transformer基础 1
1.2 常用的大型语言模型 4
1.2.1 GPT系列模型 4
1.2.2 OPT模型 11
1.2.3 Bloom模型 12
1.2.4 GLM系列模型 12
1.2.5 LLaMA系列模型 14
1.2.6 Baichuan系列模型 16
1.2.7 Qwen系列模型 18
前  言
PREFACE
前  言
为什么要写本书
2022年11月30日,ChatGPT模型问世后,立刻在全球范围内掀起了轩然大波。无论是AI从业者还是非AI从业者,都在热议ChatGPT极具冲击力的交互体验和惊人的生成内容。各大厂纷纷入局大型语言模型,“百模”甚至“千模”大战的帷幕慢慢被拉开。很多企业和高校也随之开源了一些表现优异的大型语言模型,例如GLM系列模型、LLaMA系列模型、CPM系列模型、Yi系列模型、Baichuan系列模型、Qwen系列模型、Mistral系列模型、DeepSeek系列模型、Moss模型等。但是大型语言模型距离真正落地,还有一段艰难的路要走,例如:如何优化通用大型语言模型在领域上的效果,如何在某些场景中合理运用大型语言模型,如何确保生成内容的稳定性和安全性,如何确保大型语言模型可以在生产环境下稳定使用等。

相关推荐