用微信扫描二维码

Transformer原理解析及中文项目实践(微课视频版)

Transformer原理解析及中文项目实践(微课视频版)

作者:沈志龙 编著

2025.8.1 出版

可语音朗读

开通电子书VIP
48.30得到贝

主编推荐语

本书旨在帮助读者从理论基础到实战应用,全面掌握Transformer技术。

内容简介

本书深入浅出地介绍了深度学习中的序列模型及其发展历程,重点讲解了Transformer架构及其变体的原理与实战应用。 全书共5章。第1章详细介绍RNN和LSTM的原理、代码实战及存在的问题与挑战。第2章全面剖析了Transformer的总体架构、核心思想及各组成部分的实现方法。 第3章从自定义代码出发,详细地讲解了词嵌入、多头注意力层、前馈网络层、编码器层和解码器层的构建方法,以及如何训练Transformer模型。第4章介绍Transformer变体与进阶部分。 第5章介绍利用Hugging Face实践Transformer,首先介绍了Hugging Face社区和Transformers库,然后通过实际应用案例,如文本分类、情感分类、命名实体识别等,展示了如何使用Transformers库进行项目开发。最后,讲解了模型微调的各种方法,以及Transformer的影响和未来展望。

出版方

清华大学出版社