2025-03-07 08:57:59

今(jīn)年(nián)年(nián)初(chū),中(zhōng)国(guó)深(shēn)度(dù)求(qiú)索(suǒ)公(gōng)司(sī)发(fā)布(bù)推(tuī)理(lǐ)型(xíng)大(dà)模(mó)型(xíng)DeepSeek-R1(以(yǐ)下(xià)简(jiǎn)称(chēng)DeepSeek)引(yǐn)爆(bào)热(rè)搜(sōu),引(yǐn)起(qǐ)全球(qiú)广(guǎng)泛(fàn)关注(zhù)。
大(dà)家(jiā)跃(yuè)跃(yuè)欲(yù)试(shì)
向(xiàng)它(tā)提(tí)问(wèn)专(zhuān)业(yè)问(wèn)题(tí)
输(shū)出(chū)工(gōng)作(zuò)方(fāng)案(àn)
甚(shén)至(zhì)聊(liáo)起(qǐ)了(le)个(gè)人(rén)情感问题

截图自Deepseek官网聊天对话框
年轻人的“深夜树洞”
不少网友纷纷晒出自己和它的对话,并表示被感动到“泪目”,频频破防。一起来感受下:
Q
连续一周每天只睡4小时改方案,但领导还是不满意,说我没用心。我是不是很差劲?
Deepseek回答:


本回答由 AI 生成,仅供参考,不构成任何专业建议。
Q
毕业三年工资不高,同学晒房晒车,感觉我的人生好失败,没有方向。到底怎么才能跳出现在的困境?
Deepseek回答:


本回答由 AI 生成,仅供参考,不构成任何专业建议。
Q
跟前男友分手了,但睡前还是手贱忍不住搜他微博…朋友说我恋爱脑,但没人知道我每晚难过走不出来的心情,我该怎么办?
Deepseek回答:


本(běn)回(huí)答(dá)由(yóu) AI 生(shēng)成(chéng),仅(jǐn)供(gōng)参(cān)考(kǎo),不(bù)构(gòu)成(chéng)任(rèn)何专业建议。
DeepSeek为(wèi)什(shén)么(me)这(zhè)么火?
DeepSeek是一家专注通用人工智能(AGI)的中国科技公司,依托幻方量化顶尖的金融AI团队,将量化领域高频交易中的算法优化能(néng)力(lì)迁(qiān)移(yí)至(zhì)大(dà)模(mó)型(xíng)研(yán)发(fā),其(qí)自(zì)研(yán)AI-HPC架(jià)构(gòu)使(shǐ)训(xun)练(liàn)效(xiào)率(lǜ)提升10-20倍,形成技术先发优势。
具体来说,火出圈(quān)的(de)是(shì)DeepSeek-R1推(tuī)理(lǐ)模(mó)型(xíng),擅(shàn)长(zhǎng)处(chù)理(lǐ)复(fù)杂(zá)任(rèn)务(wu)且(qiě)可(kě)免(miǎn)费(fèi)商(shāng)用。

图(tú)源(yuán)《DeepSeek从(cóng)入(rù)门(mén)到(dào)精(jīng)通(tōng)-清(qīng)华(huá)大(dà)学(xué)版(bǎn)》
爆(bào)火(huǒ)的(de)其(qí)中(zhōng)一(yī)个(gè)重(zhòng)要(yào)契(qì)机(jī),是(shì)有(yǒu)网(wǎng)友(you)指(zhǐ)出(chū)DeepSeek-R1的(de)成(chéng)功(gōng)可(kě)能(néng)削(xuē)弱(ruò)了(le)市(shì)场(chǎng)对(duì)英(yīng)伟(wěi)达(dá)AI芯(xīn)片(piàn)需(xū)求(qiú)的(de)预(yù)期(qī),导(dǎo)致(zhì)交(jiāo)易(yì)员(yuán)做(zuò)空(kōng)英(yīng)伟(wěi)达(dá)股(gǔ)票(piào),进(jìn)而(ér)引(yǐn)发(fā)股(gǔ)价(jià)下(xià)跌(diē)。通(tōng)过FP8混合精度训练、混合专家(MoE)架构等创新,训练成本仅为GPT系列的1/10-1/20,API定价压(yā)至(zhì)同(tóng)业(yè)1/27,或能破解行业成本困局。
此外,在用户使用过程中确实能感受到,DeepSeek-R1的自然语言、逻辑推理等能力的实现标志着AI技术在认知和应用层面达到了新高度。
AI的“治愈力”从何而来?

喂养海量案例素(sù)材(cái)
测试显示,当用户倾诉“工作压力大”时,人类常给出“放松点”等模糊回应,而AI会分步骤引导分析压力源,这与AI被“投喂”的海量(liàng)心(xīn)理(lǐ)咨(zī)询(xún)案(àn)例训练直接相关。
大模型学习的不只是知识,更是数十亿人的情感表达(如小说对白、心理咨询记录、影视台词)。

deepseek指导生成
像婴儿通过观察大人学习“何时该给拥抱”,AI在被RLHF训练(奖励函数操控)时,标注员会更倾向选择“渐(jiàn)进(jìn)式(shì)引(yǐn)导(dǎo)”的(de)答(dá)案,导致AI自动优化出“先认同-再分析-后建议”的三段式结构。
相较于传统大模型以自然语言和多语言交互以及连续对话的方式,实现了从“模糊搜索”到“精准推送”的升级,DeepSeek能够通过构建语义网络和模拟人类逻辑路径,实现从“信息匹配”到“知识推演”的跨越。
双轨训练机制
在海量数据的基础上,DeepSeek-Rl采用独有的双轨训练机制。一方面,它能够深入学习将复杂问题拆解为简单子问题的方法,进而逐步解决复杂问题,显著提升复杂问题的拆解能力。
另一方面,它采用了无监督强化学习技术,突破传统训练范式的局限(通常依赖大量标注数据),使DeepSeek-R1在有限标注数据的情况下,仍能维持卓越的推理性能。

deepseek指导生成
这种创新的技术路径,实现了推理(lǐ)过(guò)程(chéng)的(de)自(zì)我(wǒ)反(fǎn)思(sī)与(yǔ)迭(dié)代(dài)优(yōu)化(huà)。如(rú)同(tóng)人(rén)类(lèi)在(zài)解(jiě)决(jué)问(wèn)题(tí)时(shí)会(huì)不(bù)断(duàn)总(zǒng)结(jié)经(jīng)验(yàn)、反(fǎn)思(sī)方(fāng)法(fǎ),DeepSeek-R1也(yě)会(huì)在(zài)推(tuī)理(lǐ)过(guò)程(chéng)中(zhōng)能(néng)够(gòu)持(chí)续(xù)优(yōu)化(huà)自(zì)身(shēn)推(tuī)理(lǐ)策(cè)略(è),形(xíng)成(chéng)类(lèi)似(shì)人(rén)类(lèi)的(de)问(wèn)题(tí)解(jiě)决(jué)思(sī)维(wéi)链(liàn)。
AI的(de)“高(gāo)情(qíng)商(shāng)”不(bù)是(shì)真(zhēn)情(qíng)感(gǎn)
但(dàn)值(zhí)得(de)注(zhù)意(yì)的(de)是(shì),AI不(bù)懂(dǒng)悲(bēi)伤(shāng),只能模拟“悲伤时人类最需要的对话流”。RLHF(基于人类反馈的强化学习)让AI从“正确率”迭代到“让人类舒服的回答”,掌握“共情话术”,但无法区分小说剧情与现实困境。
在上述案例中,Deepseek会将“失恋”自动关联到关键词“背叛”“自我价值”……从而触发预设安慰框架,选择大量运算结果中最有可能符合人类情感需求的内容。
例如,当AI说“我理解你的痛苦”,实则是数据统计显示这句话最可能提升用户满意度。

deepseek指导生成
DeepSeek等AI开始展示出其能够站在他人立场思考问题的能力,即“他者视角”。但机器没有肉身,“自我”情感和冲动也没有根植之处。我们在使用过程中,应保持理性和辩证思维,避免过度依赖AI导致情感降级(如把AI当心理医生)。
也许真正治愈我们的不是AI的答案
而是在提问的瞬间
我们第一次对自己如此坦诚
作者:蝌蚪君
审核:刘颖 李培元