文档详情

一份写给普通人的 DeepSeek 速成指南.pdf

发布：2025-02-18约4.98千字共15页下载文档

文本预览下载声明

今年春节期间，一颗来自杭州的“AI新星”悄然崛起，它的名字叫DeepSeek。它

就像一道突如其来的闪电，不仅点亮了全球AI的夜空，更为开源社区带来了一

股神秘的“东方力量”。

随着DeepSeek火出圈，越来越多的人开始使用这个AI神器。那怎么才能用好

它，发挥出它强大的实力呢？

这得从认识它、了解它开始——它就像我们身边博学但有时会不自觉“脑补”的朋友。

它可能会自信满满地编造不存在的数据，还会把不相关的信息联系在一起，又或者生成看

似合理但实际错误的内容。所以在使用的时候，我们时刻保持警惕，避免错信AI的“胡

说八道”。

另外，我们也要不断学习“如何与AI交流”。毕竟即使强大如Deepseek这样的

AI，如果我们说不清楚自己想要什么，它也只能给出模糊不清的答案。

今天，我们整理了一份写给普通人的DeepSeek速成指南，希望能帮助大家用

好这个强大的AI神器。

本图由DeepSeek指导生成

DeepSeek到底是如何“思考”的？

如果用一个比喻来描述DeepSeek，它大概就像是你的一位非常博学多才的朋友，

不仅读过浩如烟海的书籍，更神奇的是，他能瞬间在脑海中建立起各种知识之间

的联系，然后对你知无不答，答无不尽（当然，违法的事情除外）。这就是现代

大语言模型的工作方式，而支撑这种能力的核心，是2017年Google团队开创

的Transformer架构。

Transformer最厉害的本事，就是它的“注意力机制”。打个比方，当你在看一本

书时，普通人需要从头读到尾，而Transformer就像是一个“超级读者”，能够一

眼就找到文本中最关键的信息，并迅速理解它们之间的关联。

DeepSeek在成长过程中仿佛一个求知若渴的学霸，它“阅读”人类积累的海量知识

——从枯燥的维基百科到优美的文学作品，从前沿的学术论文到专业的技术文档，

通过不断预测句子中缺失的词，逐渐掌握了语言的规律。这个过程与婴儿通过听

说来学习母语的过程类似，大模型就是在这样的过程中，慢慢地学会了听到提问

去预测并生成我们想要的内容。

不过，DeepSeek的“思考”方式也有其独特之处，它就像是一位即兴演讲大师，

每说出一个词都经过精密计算，既要保证内容连贯，又要富有创意。但正因为

这种即兴性，它的回答也会像人类一样，每次都略有不同。有时候可能妙语连珠，

有时候也可能词不达意，甚至经常会犯错误，这就是“AI幻觉”。

其实在DeepSeek之前，国外的ChatGPT、Claude早已璀璨夺目，而国内的文

心一言、通义千问、Kimi也各放异彩。为什么偏偏是DeepSeek在这个春节后

来居上惊艳了全球呢？

答案可以用三个关键词概括：硬实力、性价比、开源共享。

实力过硬：AI界的“技术流”高手

DeepSeek最与众不同的是它的“推理脑”。与传统的指令模型相比，DeepSeek在

模型设计上特别强化了推理能力，借助于通过强化学习等先进技术，它更像是一

位善于思考的学者，不仅会听懂你说什么，更懂得如何深入思考和创新。

目前，DeepSeekR1已经成为开源大模型中的“最强王者”，它的实力直追OpenAI的王牌选

手，也成为了开源阵营中唯一能与闭源豪门掰手腕的实力派

“”。

价格实惠：AI界的“性价比之王”

DeepSeek不仅技术出众，而且在成本控制上更是令人叹为观止。通过优化训练

方式，他们将V3模型的训练成本压缩到了557.6万美元——这个数字甚至比

不少大模型公司高管的年薪还要低。

这种高效率直接带来了超低价格，现在百万tokens的输入只需4元，输出仅

需16元，有人戏称它是“大模型界的拼多多”！

图源：作者提供

开源共享：AI界的“武林盟主”

在其他大模型出于商业利益考虑，纷纷设置重重壁垒的时候，DeepSeek选择了

完全开放代码，并允许免费商用。这就像一位武林大侠不藏私地公开了毕生绝学，

让整个江湖都能借此提升武艺。

这种开放共享的理念引发了全球共鸣。正如网上流传的一句妙语，大概意思是：

“2025年的魔幻现实：我们在公益组织（OpenAI）那里买到了月付200美元的

模型，却在量化机构那里得到了免费开源的AI。”

如何真正用好DeepSeek？

和AI打交道的核心关键在于“沟通”。AI就像是一个被蒙住眼睛的天才，它懂

很多，但无法直接感知这个世界。只有通过我们的描述，它才能理解现

显示全部

相似文档