
主编推荐语
系统解读Transformer架构,丰富案例玩转NLP应用开发。
内容简介
本书系统解析Transformer的核心原理,从理论到实践,帮助读者全面掌握其在语言模型中的应用,并通过丰富案例剖析技术细节。全书共12章,内容涵盖Transformer模型的架构原理、自注意力机制及其相对于传统方法的优势,并详细剖析BERT、GPT等经典衍生模型的应用。 书中围绕数据预处理、文本分类、序列标注、文本生成、多语言模型等核心任务,结合迁移学习、微调与优化技术,展示Transformer在语义匹配、问答系统和文本聚类等场景中的实际应用。针对企业级开发需求,还特别介绍了ONNX与TensorRT优化推理性能的最佳实践,为大规模数据处理及低资源部署提供了解决方案。
出版方
清华大学出版社