晨平安

岁岁平，岁岁安，岁岁平安

1454 字

7 分钟

DeepSeek 大模型深度评测：国产之光还是营销大于实力？

2026-05-30

原创

DeepSeek

/

大模型

/

评测

/

AI

DeepSeek 大模型深度评测：国产之光还是营销大于实力？#

🔥 开场白：DeepSeek 这个名字，2025 年之前可能还没几个人知道。但到了 2026 年，如果你想讨论 AI 大模型却不提 DeepSeek，那基本等于去火锅店不吃毛肚——外行！今天我就来给 DeepSeek 来个全身 CT 扫描，看看它到底是真有两把刷子，还是营销吹出来的泡沫。

一、DeepSeek 是谁？#

DeepSeek（深度求索）是一家来自中国的 AI 公司，专注于大语言模型的研发。他们的核心卖点有三个：

性能炸裂 —— 多项基准测试超越 GPT-4o
价格屠夫 —— API 价格只有 OpenAI 的 1/10
开源精神 —— 模型权重完全开源

这三个卖点，每一个都戳中开发者的 G 点，想不火都难。

二、实测表现#

我搞了个小型的评测矩阵，用同一批 Prompt 测试 DeepSeek 最新模型 vs GPT-4o vs Claude Sonnet 4：

2.1 代码能力#

先来一个硬核的——写一个简单的 WebSocket 服务：

1
# DeepSeek 生成的代码
2
import asyncio
3
import websockets
4
import json
5
from typing import Set, Dict, Any
6

7
class WebSocketChatServer:
8
    """一个轻量级的 WebSocket 聊天服务器"""
9

10
    def __init__(self):
11
        self.clients: Set[websockets.WebSocketServerProtocol] = set()
12
        self.rooms: Dict[str, Set] = {}
13

14
    async def register(self, websocket):
15
        self.clients.add(websocket)
16
        print(f"客户端连接: {websocket.remote_address}")
17

18
    async def unregister(self, websocket):
19
        self.clients.discard(websocket)
20
        # 从所有房间中移除
21
        for room in self.rooms.values():
22
            room.discard(websocket)
23

24
    async def broadcast(self, message: str, room: str = None):
25
        if room and room in self.rooms:
26
            targets = self.rooms[room]
27
        else:
28
            targets = self.clients
29

30
        if targets:
31
            await asyncio.gather(
32
                *[client.send(message) for client in targets],
33
                return_exceptions=True
34
            )
35

36
    async def handler(self, websocket):
37
        await self.register(websocket)
38
        try:
39
            async for message in websocket:
40
                data = json.loads(message)
41
                if data["type"] == "join":
42
                    room = data["room"]
43
                    if room not in self.rooms:
44
                        self.rooms[room] = set()
45
                    self.rooms[room].add(websocket)
46
                    await self.broadcast(
47
                        json.dumps({"type": "system", "msg": f"用户加入房间 {room}"}),
48
                        room
49
                    )
50
                elif data["type"] == "message":
51
                    await self.broadcast(
52
                        json.dumps({"type": "chat", "user": data["user"], "msg": data["msg"]}),
53
                        data.get("room")
54
                    )
55
        finally:
56
            await self.unregister(websocket)
57

58
async def main():
59
    server = WebSocketChatServer()
60
    async with websockets.serve(server.handler, "localhost", 8765):
61
        print("WebSocket 服务器启动在 ws://localhost:8765")
62
        await asyncio.Future()
63

64
if __name__ == "__main__":
65
    asyncio.run(main())

结论：三个模型都能写出可运行的代码。但 DeepSeek 在代码注释的细节和错误处理的完善度上，跟 Claude Sonnet 4 不相上下，比 GPT-4o 还略胜一筹。

2.2 中文理解能力#

这可能是 DeepSeek 最强的领域。毕竟是中国团队做的，中文语料训练得那叫一个地道：

1
Prompt: "用'格局打开'这个梗，写一段程序员开会时的场景"
2

3
DeepSeek 回复：
4
会议室里，产品经理正激情澎湃地描绘新功能。
5
"这个需求很简单，怎么实现我不管——"
6
程序员老王缓缓抬起头，推了推眼镜：
7
"格局打开，你说的这个功能，让我用 AI Agent 全自动搞定。不但不用写代码，还能顺便把你下次的需求也预测了。"
8
全场沉默。
9
产品经理看了看自己的 Jira 看板，陷入了沉思。

对比 GPT-4o 的回复（中文翻译腔明显），DeepSeek 在中文网络梗和文化语境的理解上明显更胜一筹。

2.3 推理能力#

经典的”鸡兔同笼”变体题：

1
Prompt: 一个笼子里有鸡和兔子共35个头，94只脚，问鸡和兔子各多少只？
2

3
DeepSeek 推理过程：
4
设鸡有 x 只，兔子有 y 只。
5
鸡有 1 个头 2 只脚，兔子有 1 个头 4 只脚。
6

7
x + y = 35  (1)  头数方程
8
2x + 4y = 94 (2)  脚数方程
9

10
由 (1) 得 x = 35 - y
11
代入 (2):
12
2(35 - y) + 4y = 94
13
70 - 2y + 4y = 94
14
70 + 2y = 94
15
2y = 24
16
y = 12
17

18
x = 35 - 12 = 23
19

20
答案：鸡 23 只，兔子 12 只。
21

22
验证：23 + 12 = 35 个头 ✅
23
23×2 + 12×4 = 46 + 48 = 94 只脚 ✅

这一步其实三个模型都能算对，真正的差距体现在多步推理场景——比如复杂的数学证明或逻辑链很长的代码 Debug。

三、API 对比#

特性	DeepSeek	GPT-4o	Claude Sonnet 4
价格（每百万 token）	$0.5	$5	$3
上下文窗口	128K	128K	200K
编程能力	⭐⭐⭐⭐	⭐⭐⭐⭐	⭐⭐⭐⭐⭐
中文能力	⭐⭐⭐⭐⭐	⭐⭐⭐⭐	⭐⭐⭐⭐
推理速度	很快	快	中等
开源	✅ 完全开源	❌	❌

性价比之王当之无愧。

四、接入方式#

1
# 1. 通过 API 调用
2
curl -X POST https://api.deepseek.com/v1/chat/completions \
3
  -H "Content-Type: application/json" \
4
  -H "Authorization: Bearer $DEEPSEEK_API_KEY" \
5
  -d '{
6
    "model": "deepseek-chat",
7
    "messages": [{"role": "user", "content": "用 Python 写一个快速排序"}],
8
    "temperature": 0.7
9
  }'
10

11
# 2. 在 Hermes Agent 中配置 DeepSeek
12
hermes config set provider custom
13
hermes config set custom_providers.deepseek.api_base https://api.deepseek.com/v1
14
hermes config set custom_providers.deepseek.model deepseek-chat
15

16
# 3. 甚至可以在 VS Code 的 Continue 插件里用

五、我的真实使用感受#

我高强度使用了 DeepSeek 两个月，总结一下：

👍 优点#

性价比无敌：一个月 API 费用从 200 刀降到了 20 刀
中文理解深刻：写中文技术文章、做中文翻译、理解中文梗，都非常地道
长文本处理不错：128K 上下文，处理一个中型代码库没问题
响应速度快：比 Claude 快不少，体验很好

👎 缺点#

复杂指令跟随不如 Claude：三层以上的嵌套逻辑偶尔会跑偏
创意写作偏保守：让它写段子可以，写小说就不如 GPT-4o 有想象力
英文在某些偏门领域不如 GPT-4o：比如某些特定的西方文化概念
偶尔会有”幻觉”：一本正经地胡说八道，需要人工校验

六、总结#

DeepSeek 不是营销产物，它是真有两把刷子的国产之光。它的出现直接把大模型 API 的价格打到了地板价，让个人开发者也能用得起顶级 AI 能力。

如果说 2023 年是 ChatGPT 的元年，2024 年是 Claude 崛起之年，那 2025-2026 年，毫无疑问是 DeepSeek 的爆发之年。

我的建议是：主力模型用 DeepSeek（省钱又够用），复杂代码任务切 Claude，创意类任务切 GPT-4o。这样搭配，年省几万块 API 费不是梦。

💰 省到就是赚到，各位打工人，且用且珍惜。

DeepSeek 大模型深度评测：国产之光还是营销大于实力？

https://www.oferry.com/posts/a92/

作者

晨平安

发布于

2026-05-30

许可协议

CC BY-NC-SA 4.0

Hermes Agent 深度评测：173k Star 的 AI Agent 到底有多强？

AI 编程工具三国杀：Claude Code vs Cursor vs Hermes，2026 年怎么选？