用微信扫描二维码

DeepSeek大模型高性能核心技术与多模态融合开发

DeepSeek大模型高性能核心技术与多模态融合开发

作者:王晓华

2025.3.1 出版

可语音朗读

开通电子书VIP
80.92得到贝

主编推荐语

深入剖析国产之光DeepSeek多模态大模型的核心技术。

内容简介

本书从高性能注意力机制切入,深入揭示DeepSeek的技术精髓与独特优势,详细阐述其在人工智能领域成功的技术秘诀。 本书循序渐进地讲解深度学习注意力机制的演进,从经典的多头注意力(MHA)逐步深入DeepSeek的核心技术—多头潜在注意力(MLA)与混合专家模型(MoE)。此外,本书还将详细探讨DeepSeek中的多模态融合策略、技术及应用实例,为读者提供全面的理论指导与应用实践。

出版方

清华大学出版社