[荷] 马尔滕·格鲁滕多斯特(Maarten Grootendorst)
人物简介:
Jay Alammar
Cohere总监兼工程研究员,知名大模型技术博客Language Models & Co作者,DeepLearning.AI和Udacity热门机器学习和自然语言处理课程作者。
Jay的图解系列文章“The Illustrated Transformer”“The Illustrated DeepSeek-R1”全网疯传,累积了几百万专业读者。
Maarten Grootendorst
IKNL(荷兰综合癌症中心)高级临床数据科学家,知名大模型技术博客博主,BERTopic等开源大模型软件包作者(下载量超百万),DeepLearning.AI和Udacity热门机器学习和自然语言处理课程作者。
图解大模型书籍相关信息
- ISBN:9787115670830
- 作者:[沙特] 杰伊·阿拉马尔(Jay Alammar) / [荷] 马尔滕·格鲁滕多斯特(Maarten Grootendorst) / 李博杰
- 出版社:中国工信出版集团 人民邮电出版社
- 出版时间:2025-5
- 页数:350
- 价格:159.8元
- 纸张:暂无纸张
- 装帧:平装
- 开本:暂无开本
- 语言:暂无语言
- 适合人群:对人工智能、机器学习感兴趣的技术爱好者,计算机科学专业的学生,以及想要了解大模型和深度学习基础的非专业人士
- TAG:人工智能 / 深度学习 / 图解 / 技术入门 / 算法原理 / 大模型
- 豆瓣评分:暂无豆瓣评分
- 更新时间:2025-05-15 00:05:17
内容简介:
本书全程图解式讲解,通过大量全彩插图拆解概念,让读者真正告别学习大模型的枯燥和复杂。
全书分为三部分,依次介绍语言模型的原理、应用及优化。第一部分 理解语言模型(第1~3章),解析语言模型的核心概念,包括词元、嵌入向量及Transformer架构,帮助读者建立基础认知。第二部分 使用预训练语言模型(第4~9章),介绍如何使用大模型进行文本分类、聚类、语义搜索、文本生成及多模态扩展,提升模型的应用能力。第三部分 训练和微调语言模型(第10~12章),探讨大模型的训练与微调方法,包括嵌入模型的构建、分类任务的优化及生成式模型的微调,以适应特定需求。
本书适合对大模型感兴趣的开发者、研究人员和行业从业者。读者无须深度学习基础,只要会用Python,就可以通过本书深入理解大模型的原理并上手大模型应用开发。书中示例还可以一键在线运行,让学习过程更轻松。
编辑推荐
1.【直观】300幅全彩插图,极致视觉化呈现
2.【全面】涵盖大模型原理、应用开发、优化
3.【实操】真实数据集,实用项目,典型场景
4.【热点】18幅图深度解读DeepSeek底层原理
5.【附赠】一键运行代码+大模型面试题200问
6.【视频】大量线上拓展资料,包括文章、视频
全格式电子版 - 免费下载