
主编推荐语
深入剖析国产之光DeepSeek多模态大模型的核心技术。
内容简介
本书从高性能注意力机制切入,深入揭示DeepSeek的技术精髓与独特优势,详细阐述其在人工智能领域成功的技术秘诀。 本书循序渐进地讲解深度学习注意力机制的演进,从经典的多头注意力(MHA)逐步深入DeepSeek的核心技术—多头潜在注意力(MLA)与混合专家模型(MoE)。此外,本书还将详细探讨DeepSeek中的多模态融合策略、技术及应用实例,为读者提供全面的理论指导与应用实践。
出版方
清华大学出版社
深入剖析国产之光DeepSeek多模态大模型的核心技术。
本书从高性能注意力机制切入,深入揭示DeepSeek的技术精髓与独特优势,详细阐述其在人工智能领域成功的技术秘诀。 本书循序渐进地讲解深度学习注意力机制的演进,从经典的多头注意力(MHA)逐步深入DeepSeek的核心技术—多头潜在注意力(MLA)与混合专家模型(MoE)。此外,本书还将详细探讨DeepSeek中的多模态融合策略、技术及应用实例,为读者提供全面的理论指导与应用实践。
清华大学出版社