DeepSeek大模型高性能核心技术与多模态融合开发

作者：王晓华

2025.3.1 出版

可语音朗读

开通电子书VIP

80.92得到贝

主编推荐语

深入剖析国产之光DeepSeek多模态大模型的核心技术。

内容简介

本书从高性能注意力机制切入，深入揭示DeepSeek的技术精髓与独特优势，详细阐述其在人工智能领域成功的技术秘诀。本书循序渐进地讲解深度学习注意力机制的演进，从经典的多头注意力（MHA）逐步深入DeepSeek的核心技术—多头潜在注意力（MLA）与混合专家模型（MoE）。此外，本书还将详细探讨DeepSeek中的多模态融合策略、技术及应用实例，为读者提供全面的理论指导与应用实践。

出版方

清华大学出版社