用微信扫描二维码

从零开始写大模型

从零开始写大模型

作者:王双 编著

2025.6.1 出版

可语音朗读

开通电子书VIP
47.46得到贝

主编推荐语

本书全面、系统地介绍从神经网络到Transformer的相关知识。

内容简介

本书共20章。 第1、2章介绍神经网络的基础与典型神经网络,带领读者手推前向与反向传播、写一个神经网络; 第3、4、5章介绍编解码-神经网络架构、Tokenlization与数学基础; 第6、7、8、9章详细介绍Transformer各模块的基本原理;第10章介绍Transformer模型的超参数,并在第11章给出Transformer实现代码; 第12、13、14章介绍Transformer面试常见问题、最新模型及Transformer模型的各种变体; 第15到20章是GPT模型构建实战,包括MiniMind大模型案例构建、MiniMind代码详解、MiniMind安装、MiniMind训练、MiniMind微调、Minimind推理。

出版方

清华大学出版社