万本电子书0元读

万本电子书0元读

顶部广告

DeepSeek实战:从提示词到部署和实践电子书

DeepSeek实战:高质量提示词、*率部署和高水平实践快速上手、掌握核心、应用实战结合DeepSeek实训平台,让您轻松获得DeepSeek进阶技能包

售       价:¥

纸质售价:¥53.70购买纸书

283人正在读 | 0人评论 6.5

作       者:张成文

出  版  社:电子工业出版社

出版时间:2025-04-01

字       数:11.3万

所属分类: 科技 > 计算机/网络 > 计算机理论与教程

温馨提示:数字商品不支持退换货,不提供源文件,不支持导出打印

为你推荐

  • 读书简介
  • 目录
  • 累计评论(0条)
  • 读书简介
  • 目录
  • 累计评论(0条)
本书旨在提供一份全面、易懂的DeepSeek大模型实战内容,通过深浅出的讲解,帮助读者快速掌握DeepSeek的核心技术和应用场景。本书不仅涵盖了DeepSeek的技术原理、架构设计和训练方法,还详细介绍了如何通过API调用、本地部署和云服务等方式将DeepSeek集成到实践项目中。此外,本书通过大量实例和案例分析,展示了DeepSeek在不同领域的应用实践,帮助读者更好地理解和应用这一强大的工具。本书图文并茂,理论翔实,案例丰富,适合从事DeepSeek发的科研人员以及广大的发者作为技术参考和培训资料,亦可作为高校本科生和研究生的教材。<br/>【作者】<br/>张成文,北京邮电大学副教授,中国人工智能学会高级会员、中国教育发展战略学会人工智能与机器人专委会理事、中国生物医学工程学会医学人工智能分会委员、中国人工智能产业发展联盟产学研工作组副组长<br/>
目录展开

内容简介

前 言

第1章 DeepSeek初探

1.1 大模型的定义

1.2 从GPT到DeepSeek

1.2.1 GPT模型的发展脉络

1.2.2 DeepSeek模型的发展脉络

1.2.3 技术突破:从全球竞速到本土创新

1.2.4 应用生态的进化:从工具到生态伙伴

1.3 DeepSeek的核心能力和独特优势

1.3.1 核心能力

1.3.2 独特优势

1.4 DeepSeek的应用场景

1.4.1 智能客服

1.4.2 辅助办公

1.4.3 智能家居

1.4.4 医疗诊断

1.4.5 教育学习

1.4.6 金融投资

1.4.7 智能政务

1.5 DeepSeek带来的机遇

1.5.1 DeepSeek模型带给个人的机遇

1.5.2 DeepSeek带给中小企业的机遇

小 结

第2章 DeepSeek的模型架构

2.1 DeepSeek-V3/R1模型的架构

2.2 混合专家

2.2.1 稠密MoE架构和稀疏MoE架构

2.2.2 DeepSeekMoE

2.2.3 无辅助损耗负载均衡

2.3 多头潜在注意力

2.3.1 键值缓存简介

2.3.2 RoPE简介

2.3.3 传统MHA的缓存机制的不足

2.3.4 低秩键值联合压缩的注意力机制

2.4 多Token预测

2.4.1 块级并行解码策略

2.4.2 Meta的MTP方法

2.4.3 DeepSeek的MTP方法

小 结

第3章 DeepSeek的训练架构

3.1 DeepSeek的训练

3.1.1 基础技术

3.1.2 训练过程

3.2 DeepSeek在硬件层面的训练亮点

3.2.1 FP8混合精度训练

3.2.2 DualPipe算法

3.3 DeepSeek在算法层面的训练亮点

3.3.1 组相对策略优化

3.3.2 知识蒸馏

3.4 DeepSeek的数据优化手段

小 结

第4章 高质量提示词

4.1 提示词概述

4.1.1 提示词的定义

4.1.2 提示词的种类

4.2 新手常见误区和陷阱

4.3 提示词的设计技巧

4.3.1 STAR法则:让问题更有条理

4.3.2 5W2H法则:全面提问的利器

4.3.3 CO-STAR框架:精准表达需求

4.3.4 CRISPE框架:激发创意和拓展深度

4.3.5 BROKE框架:目标导向和持续优化

4.3.6 借助大模型优化提示词

4.4 企业层面的提示词应用场景

4.4.1 传播策略制定

4.4.2 执行发展制定

4.4.3 品牌故事生成

4.4.4 产品定位

小 结

第5章 面向个人的DeepSeek部署

5.1 DeepSeek的模型

5.1.1 DeepSeek模型的常见版本

5.1.2 DeepSeek模型的版本说明

5.1.3 DeepSeek模型的开源协议

5.2 硬件需求和配置建议

5.2.1 存储精度

5.2.2 显存占用估算

5.3 软件环境安装和配置

5.3.1 Ollama安装

5.3.2 使用Ollama部署DeepSeek模型

5.3.3 Ollama常用API

5.4 DeepSeek模型下载和部署

5.4.1 Hugging Face社区简介

5.4.2 模型下载

5.4.3 常见大模型文件类型

5.5 使用Web UI构建对话界面

5.5.1 Open-WebUI

5.5.2 Hollama

5.5.3 ChatBox

小 结

第6章 面向企业的DeepSeek API调用

6.1 API调用的优势

6.2 常用DeepSeek API调用方式

6.2.1 DeepSeek官方开放平台

6.2.2 DMXAPI

小 结

第7章 面向企业的DeepSeek云服务部署

7.1 本地部署与云服务部署的对比

7.1.1 本地部署的特点

7.1.2 云服务部署的特点

7.2 模型推理加速框架

7.2.1 推理加速框架的必要性

7.2.2 BladeLLM

7.2.3 SGLang

7.2.4 vLLM

7.3 常用DeepSeek云服务部署方式

7.3.1 阿里云

7.3.2 腾讯云

7.3.3 华为云

7.3.4 火山引擎

7.3.5 AutoDL

小 结

第8章 DeepSeek模型训练

8.1 常用训练框架

8.1.1 Unsloth

8.1.2 TRL

8.2 DeepSeek模型的SFT训练

8.2.1 算力租用

8.2.2 模型下载和部署

8.2.3 数据预处理

8.2.4 模型训练

8.2.5 模型推理

8.3 DeepSeek模型的GRPO训练

8.3.1 加载模型

8.3.2 配置PEFT模型

8.3.3 数据集准备

8.3.4 模型训练

8.3.5 模型推理

小 结

第9章 DeepSeek的RAG实战

9.1 用LangChain构建简单的RAG本地系统

9.1.1 RAG管道构建

9.1.2 向量数据库构建

9.1.3 Web页面启动

9.2 开源DeepSeek RAG应用案例

9.2.1 Local PDF Chat RAG

9.2.2 RAG Flow

小 结

第10章 DeepSeek的Agent实战

10.1 基于LlamaIndex项目构建简单的智能体应用

10.1.1 软件安装和模型下载

10.1.2 构建本地知识库

10.1.3 实现基于本地知识库的智能体问答

10.2 基于Swarm框架构建智能体应用

10.2.1 Swarm框架介绍

10.2.2 DeepSeek模型接入

10.2.3 调用外部工具

10.3 开源Agent应用框架

10.3.1 Browser Use

10.3.2 Camel

小 结

参考文献

累计评论(0条) 0个书友正在讨论这本书 发表评论

发表评论

发表评论,分享你的想法吧!

买过这本书的人还买过

读了这本书的人还在读

回顶部