
DeepSeek
智能对话与模型体验平台,提供多版本模型与应用入口,帮助用户获取高效便捷的 AI 交互能力。
评分:
访问官网5
DeepSeek V3DeepSeek R1 模型DeepSeek CoderAI 对话助手免费 AI 聊天工具AI 编程模型大语言模型使用DeepSeek 开放平台
DeepSeek
DeepSeek 模型全景介绍与使用指南
本文档汇总了 DeepSeek(深度求索)截至 2025 年初的最新模型矩阵,重点补充了最新的 R1 推理系列、V3 旗舰系列以及 Janus 多模态系列,并附带详细的 API 调用与本地部署教程。
一、 DeepSeek 核心模型矩阵
1. 旗舰通用与推理系列 (当前主力)
这是目前 DeepSeek 性能最强、关注度最高的系列,代表了开源模型的最高水平。
-
DeepSeek-R1 系列 (2025年1月发布)
- 定位:专注于强化推理能力 (Reasoning) 的模型,具备类似 OpenAI o1 的“思维链 (CoT)”能力,擅长复杂逻辑、数学证明和深度思考。
- DeepSeek-R1:基于 V3 架构训练的完全体模型(671B参数,激活37B),性能对标 GPT-4o 和 o1-mini,是目前开源界最强的推理模型。
- DeepSeek-R1-Zero:第一代未经监督微调(SFT)的纯强化学习模型,展现了模型自我进化的能力,输出风格较为原始(适合研究)。
- DeepSeek-R1-Distill (蒸馏版):为了适配消费级显卡,官方将 R1 的推理能力“蒸馏”到了小参数模型上,基于 Qwen2.5 和 Llama3 微调:
- 1.5B / 7B / 8B:轻量级,适合笔记本或普通台式机。
- 14B / 32B:中量级,32B 是性价比之王,在 24GB 显存显卡上表现极佳。
- 70B:重量级,性能接近满血版。
-
DeepSeek-V3 (2024年12月发布)
- 定位:第三代旗舰通用模型,也是 R1 的基础底座。
- 特点:采用 MoE(混合专家)架构,支持 128K 上下文。通过 FP8 混合精度训练,生成速度高达 60 TPS(比 V2 快 3 倍)。
- 表现:在知识问答、长文本处理和代码生成领域超越其他开源模型,API 价格极低,是目前通用对话的首选。
2. 多模态与视觉系列 (最新突破)
-
Janus-Pro 系列 (2025年1月发布)
- 定位:新一代统一多模态模型,既能“看图”也能“画图”。
- 特点:解耦了视觉编码,使得理解和生成任务互不干扰。
- Janus-Pro-7B:基于 DeepSeek-LLM-7B 和 SigLIP 打造,在多模态理解基准测试中表现优异,同时支持高质量的文生图功能。
- Janus-Pro-1B:轻量化版本,适合边缘设备。
-
DeepSeek-VL2
- 定位:视觉语言模型,专注于图像与文本的深度融合理解,适用于 OCR、图表分析等任务。
3. 代码与专业领域系列
-
DeepSeek-Coder V2
- 定位:代码智能领域的标杆。
- 特点:支持 338 种编程语言,在代码生成、补全、Bug 修复及数学编程任务上表现卓越。虽然 V3 通用能力很强,但在特定代码场景下 Coder V2 仍具参考价值。
-
DeepSeekMath & DeepSeek-Prover
- DeepSeekMath:早期的数学专项模型。
- DeepSeek-Prover V1.5:结合强化学习与蒙特卡洛树搜索(MCTS),专用于形式化定理证明。
4. 历史版本 (归档)
- DeepSeek-V2.5:2024年9月发布,合并了 V2-Chat 和 Coder-V2,是 V2 到 V3 的过渡版本。
- DeepSeek-V2:引入 DeepSeekMoE 架构,优化了训练成本。
- DeepSeek LLM (7B/67B):早期的基础大模型系列。
二、 使用教程:如何使用 DeepSeek
方式 1:官方网页/APP (最简单)
适合普通用户,无需任何技术背景。
- Web 端:访问 chat.deepseek.com
- 注册即可免费使用 V3 模型。
- 点击输入框下方的“深度思考 (R1)”按钮,即可切换到 R1 推理模型。
- APP 端:在应用商店搜索“DeepSeek”下载官方应用。
方式 2:API 调用 (开发者推荐)
DeepSeek API 完全兼容 OpenAI 格式,可直接平替。
Python 调用示例:
# 前置:pip install openai
from openai import OpenAI
client = OpenAI(
api_key="你的_API_KEY", # 在 platform.deepseek.com 申请
base_url="https://api.deepseek.com"
)
response = client.chat.completions.create(
# 模型选择:
# "deepseek-chat" 对应 DeepSeek-V3 (通用对话)
# "deepseek-reasoner" 对应 DeepSeek-R1 (深度推理)
model="deepseek-chat",
messages=[
{"role": "system", "content": "你是一个专业的助手"},
{"role": "user", "content": "用Python写一个贪吃蛇游戏"},
],
stream=False
)
print(response.choices[0].message.content)
三 可视化界面(可选)
推荐使用 Chatbox AI,可获得类似 ChatGPT 的本地聊天界面体验。
设置方式:
- 模型提供方:
Ollama - API Host:http://localhost:11434
📌 模型选择总结
根据不同用途选择对应模型:
| 需求类型 | 推荐模型 | API 名称 | 本地运行建议 |
|---|---|---|---|
| 日常对话、翻译、写文章 | DeepSeek-V3 | deepseek-chat | 显存需求大,推荐使用 API |
| 复杂数学、逻辑推理、科研 | DeepSeek-R1 | deepseek-reasoner | 推荐本地运行 deepseek-r1:32b |
| 写代码、Bug 修复 | DeepSeek-V3 Coder | deepseek-coder-v2 | 可使用本地蒸馏模型 |
| 看图、画图 | Janus-Pro | 暂未开放 API | 需使用 HuggingFace 部署 |
DeepSeek 主要功能
提供 DeepSeek 多版本模型体验,支持快速开启智能对话
提供官方移动端 App,便于随时访问 AI 助手功能
提供开发者开放平台,可查看 API 文档与模型访问能力
展示模型价格与调用方式,方便开发者评估成本
支持查看服务状态,保障模型使用的稳定性
DeepSeek 适用场景
在需要快速获取 AI 解答时,通过网页即时开启对话
移动办公场景下使用官方 App 与模型进行沟通
开发者接入 API 构建聊天、编程助手等应用
在评估大模型方案时对比不同版本功能与价格
教育学习场景中用于获取知识解释与练习辅导
DeepSeek 常见问题
QDeepSeek 提供哪些模型?
网站展示了包括 DeepSeek V3、R1、Coder、V2 等多种模型,覆盖通用对话与编程等场景。
Q如何在手机上使用 DeepSeek?
可以下载官方 DeepSeek App,在移动端随时访问对话与相关功能。
Q开发者可以使用 API 吗?
可以,通过开放平台查看 API 文档、价格和调用方式并进行集成。
QDeepSeek 网页版可以免费使用吗?
网页支持体验 DeepSeek V3.2 等模型,可直接开始对话。
Q在哪里查看模型服务状态?
可在网站的服务状态页面查看模型运行情况与接口稳定性。