
主编推荐语
系统阐述DeepSeek大模型的技术架构、开发实践与行业应用。
内容简介
全书分为3部分11章。 第1~4章深入介绍大模型的理论基础与核心技术,包括大模型的核心概念、Transformer与MoE机制,以及DeepSeek架构的关键设计思想、优化策略与开发基础等。 第5~7章聚焦于实际应用开发,详细讲解如何在DeepSeek平台上构建智能开发工具,包括编程智能助手的技术实现、智能代码生成、调试、多任务跨领域应用以及Prompt设计等。 第8~10章深入探讨了大模型在行业中的定制化应用,通过多个案例展示了大模型如何解决零售、制造等行业中的具体业务问题,帮助读者掌握从需求分析到模型部署的全流程。 第11章详细介绍了DeepSeek-R1的关键技术。
出版方
清华大学出版社