DeepSeek 使用全指南

DeepSeek 使用全指南(2025年更新版)

一、DeepSeek 核心认知

1.1 公司与技术定位
DeepSeek(深度求索)是由中国量化投资机构幻方量化于2023年创立的人工智能企业,专注于大语言模型(LLM)与多模态技术研发。其核心产品包括推理模型DeepSeek-R1和通用模型DeepSeek-V3,技术特性体现在三方面:

  • 低成本训练:通过FP8混合精度、强化学习替代监督微调等技术,模型训练成本仅为国际同行的1/10(如V3模型仅需557万美元和2048块GPU);

  • 中文场景优化:在中文语义理解、古诗词解析等任务中,性能超越GPT-3.5

  • 开源生态建设:代码库采用MIT协议开源,配套技术文档覆盖FlashMLA加速器、DeepEP并行通信等底层工具。

1.2 核心功能框架

功能类型

典型应用场景

适配模型

智能对话

客服咨询、知识问答

DeepSeek-V3

复杂推理

数学证明、商业决策

DeepSeek-R1

多模态处理

文件扫描、图像文字提取

通用模型+附件功能

代码工程

代码生成/纠错、API文档撰写

DeepSeek-Coder


二、基础操作指南

2.1 设备与入口

  • 网页端:访问 https://chat.deepseek.com(支持Chrome/Edge浏览器)

  • 移动端:应用商店搜索“DeepSeek”下载安装(iOS/Android全适配)

  • API接口:开发者可通过 https://platform.deepseek.com 接入企业系统

2.2 账号注册流程

  1. 点击右上角“注册”按钮,选择手机号/邮箱验证

  2. 设置8-16位密码(建议字母+数字组合,如Deep2025)

  3. 阅读并勾选《用户协议》与《隐私政策》

  4. 完成实名认证(企业用户需提交营业执照)

2.3 核心功能开关
在对话框下方工具栏可启用四大增强模块:

  • 深度思考(R1):激活逻辑推理链,适合解决复杂问题(如数学证明)

  • 联网搜索:实时获取2025年3月后的最新数据(注:服务存在间歇性中断)

  • 文件上传:支持PDF/Word/图片等格式,单文件上限100MB

  • 多模态输出:生成Markdown表格/SVG流程图/LaTeX公式


三、高阶应用策略

3.1 模型选择逻辑

任务类型

推荐模型

提示语设计要点

创意写作

DeepSeek-V3

提供风格范例(如“鲁迅杂文风”)

数据分析

DeepSeek-R1

明确分析维度与验证标准

代码审查

DeepSeek-Coder-V2

标注编程语言与异常样本

学术研究

R1+联网搜索

限定参考文献年限与领域

3.2 提示语设计模板

  • 分析类任务
    “作为[角色],请分析[数据/现象],要求:①列出3个核心影响因素 ②用SWOT模型对比方案 ③输出Markdown表格”

  • 创作类任务
    “以[文体]格式撰写[主题],需包含:开头悬念+3个案例佐证+金句总结,字数控制在800字”

  • 代码任务
    “用Python编写[功能],要求:①添加类型注释 ②异常处理模块 ③生成API使用文档”

3.3 多工具联用方案

  • PPT制作:DeepSeek生成大纲 → Kimi自动排版 → Canva添加视觉元素

  • 短视频创作:R1模型输出脚本 → 剪映图文成片 → 即梦AI生成封面图

  • 数据分析:上传Excel文件 → R1模型生成结论 → Matplotlib输出可视化图表


四、教育领域专项指南

4.1 教学场景解决方案

  • 备课辅助
    输入“作为初中语文教师,针对《散步》设计教学方案,需包含:①学情分析 ②5分钟互动游戏 ③分层作业”,R1模型将输出带注释的教案框架

  • 试题生成
    提示语示例:“生成10道勾股定理应用题,难度梯度为3:5:2,附答案解析” → 自动生成Latex格式试卷。

4.2 学生能力训练

  • 逻辑思维:使用R1模型的“分步推导”功能练习数学证明题

  • 论文写作:上传参考文献 → 联网搜索最新数据 → 生成论文提纲与查重报告


五、开发者生态共建

5.1 开源工具链

  • FlashMLA:针对英伟达H100 GPU优化的注意力解码内核,推理速度提升40%

  • DeepEP:MoE模型专用并行通信库,降低多显卡训练时的负载失衡问题

  • 3FS分布式系统:结合SSD与RDMA技术,实现6.6TB/秒的数据读取速度

5.2 硬件适配现状

国产芯片厂商

已适配技术模块

典型应用场景

华为昇腾

FlashMLA/DeepGEMM

政务系统部署

摩尔线程

全栈支持开源周工具

企业私有云

壁仞科技

FP8低精度训练加速

金融风控模型


六、常见问题与优化

6.1 效果提升技巧

  • 复杂任务拆解:将“写行业分析报告”拆分为“数据收集→竞品对比→趋势预测”分步提交

  • 结果校准指令:追加“请检查第三段数据与图表的逻辑一致性”减少事实性错误

6.2 成本控制方案

  • 中小型企业可选择DeepSeek一体机(售价150-200万元),支持本地化部署满血版模型

  • API调用采用“异步批处理”模式,较实时请求成本降低60%


七、伦理与风险提示

  • 隐私保护:避免上传含个人隐私的文件,敏感数据需先做匿名化处理

  • 学术诚信:论文辅助功能不得直接用于代写,建议仅用于文献综述与格式校对

  • 内容审核:商业文案生成后需人工复核,防止违反《生成式AI服务管理暂行办法》