DeepSeek如何赋能科普内容创作？一文解锁N种方法-科技

DeepSeek如何赋能科普内容创作？一文解锁N种方法 2025-02-25 17:14:47 科技

DeepSeek公(gōng)司(sī)背(bèi)景(jǐng)与(yǔ)发(fā)展(zhǎn)

DeepSeek于(yú)2023年(nián)成(chéng)立(lì)，其(qí)母(mǔ)公(gōng)司(sī)幻(huàn)方(fāng)量(liàng)化(huà)在(zài)量(liàng)化(huà)投(tóu)资(zī)领(lǐng)域成(chéng)绩(jī)斐(fěi)然(rán)，是(shì)国(guó)内(nèi)顶(dǐng)尖(jiān)的(de)量(liàng)化(huà)投(tóu)资(zī)公(gōng)司(sī)，管(guǎn)理(lǐ)规(guī)模(mó)曾(céng)一(yī)度(dù)突(tū)破(pò)千(qiān)亿(yì)大关。2020年3月，幻方量化建立萤火一号算力集群，紧接着在2021年建立萤火二号，二者共同构成了当时亚洲规模最大的私有化AI算力池，拥有近万张A100 卡。当时，幻方量化出于自身量化投资对算力的需求建立此算力池，同时面向公众开放使用。这一举措为后来大模型的发展奠定了坚实基础，也展现了幻方量化在技术布局上的前瞻性。

DeepSeek模型发展历程

DeepSeek在模型研发上稳步推进，2024年初推出首个大模型版本，起初在行业内并未引起较大轰动。然而，2024年5月推出的V2版本开始崭露头角，性能对标GPT-4，而价格仅为GPT-4的百分之一。在国外学术圈和工业圈，它早早受到关注，特别是在代码开发领域表现突出，成为国外众多AI Coding软件中(zhōng)唯(wéi)一(yī)集成(chéng)的(de)国(guó)产(chǎn)大(dà)模(mó)型(xíng)。去(qù)年(nián)年(nián)底(dǐ)推(tuī)出(chū)的(de)V3和(hé)R1版(bǎn)本(běn)更(gèng)是(shì)引(yǐn)起(qǐ)了(le)国(guó)内(nèi)外(wài)的(de)广(guǎng)泛(fàn)关注(zhù)，其(qí)模(mó)型(xíng)性(xìng)能(néng)对(duì)标(biāo)国(guó)外(wài)最(zuì)顶(dǐng)尖(jiān)的(de)OpenAI-o1模(mó)型(xíng)，充(chōng)分(fēn)展(zhǎn)示(shì)了(le)DeepSeek在(zài)技(jì)术(shù)研(yán)发(fā)上(shàng)的(de)实(shí)力(lì)。

DeepSeek技(jì)术(shù)优(yōu)势(shì)剖(pōu)析(xī)

基(jī)于(yú)强(qiáng)化(huà)学(xué)习(xí)的(de)训(xun)练(liàn)方(fāng)式(shì)

DeepSeek-R1的(de)Zero版(bǎn)本(běn)基(jī)于(yú)大(dà)规(guī)模(mó)强(qiáng)化(huà)学(xué)习(xí)进(jìn)行(xíng)训(xun)练(liàn)，抛弃了传统的基于人类标注反馈数据训练的奖励模型，选择了客观评价指标作为奖励模型。这种奖励模型主要基于两个核心要点：一是回答的答案是否准确，即是否可通过计算规则进行检验；二是答案格式是否符合要求，即是否包含了思考的过程。以回答(dá)数(shù)学(xué)问(wèn)题为例，若模型简单回答正确记1分，若通过逻辑推理得出正确答案则记2分，答案错误记0分；在代码生成任务中，通过编译器运行结果判断，符合预期记1分，编译失败或结果错误记0分，有思考过程会额外加分。与传统依赖人类标注的方式相比，DeepSeek的评价方式更加客观，有效避免了人类标注存在的效率和准确率问题，同时也规避了人工反馈带来的主观和价值观因素影响。

创新的模型架构

在模型架构方面，DeepSeek有诸多创新。DeepSeek采取目前流行的混合专家（MoE）架构，MoE借鉴了人类大脑的工作原理。大脑的不同区域负责不同功能，如前额叶负责逻辑推理，颞叶中的梭状回面孔区负责人脸识别、而海马体负责记忆等。MoE架构下参数量虽大，但特定任务仅由特定的一小部分参数处理，这极大地降低了计算消耗，同时也便于对参数权重进行定向优化。此外，DeepSeek自主创新的MLA模型通过算法(fǎ)调(diào)整(zhěng)，减(jiǎn)少(shǎo)了(le)推(tuī)理(lǐ)过(guò)程(chéng)的(de)KV Cache，降(jiàng)低(dī)了(le)显(xiǎn)存(cún)消(xiāo)耗(hào)，进(jìn)而(ér)提(tí)高(gāo)了(le)推(tuī)理(lǐ)效(xiào)率(lǜ)。这(zhè)两(liǎng)种(zhǒng)架(jià)构(gòu)的(de)结(jié)合(hé)，为(wèi)DeepSeek的(de)高(gāo)性(xìng)能(néng)表(biǎo)现(xiàn)提(tí)供(gōng)了(le)有(yǒu)力(lì)支(zhī)持(chí)。

软硬件协同优化策略

虽然DeepSeek很早就建设了万卡集群，但是与国外同行相比，规模依然不足。面对算力资源的限制，DeepSeek采用了精细的调度算法，压榨硬件的每一分算力。传统方式在训练时，参数权重更新(xīn)需(xū)一(yī)层(céng)一(yī)层(céng)按(àn)顺(shùn)序(xù)处(chù)理(lǐ)，存(cún)在(zài)排(pái)队(duì)等(děng)待(dài)的(de)情(qíng)况(kuàng)，导(dǎo)致(zhì)算(suàn)力(lì)利(lì)用(yòng)率(lǜ)不(bù)高(gāo)。而(ér)DeepSeek的(de)DualPipe调(diào)度(dù)算(suàn)法(fǎ)类(lèi)似(shì)于(yú)流(liú)程(chéng)优(yōu)化(huà)，通(tōng)过(guò)合(hé)理(lǐ)安(ān)排(pái)前(qián)向(xiàng)过(guò)程(chéng)、后(hòu)向(xiàng)过(guò)程(chéng)以(yǐ)及(jí)层(céng)间(jiān)通(tōng)讯(xùn)，使(shǐ)有(yǒu)前(qián)后(hòu)依(yī)赖(lài)的(de)任(rèn)务(wu)紧(jǐn)密(mì)协(xié)作(zuò)，从(cóng)而(ér)在(zài)最(zuì)短(duǎn)时(shí)间(jiān)内(nèi)完(wán)成(chéng)一(yī)轮(lún)迭(dié)代(dài)训(xun)练(liàn)。这(zhè)种(zhǒng)软(ruǎn)硬(yìng)件(jiàn)协(xié)同(tóng)的(de)方(fāng)式(shì)，在(zài)国(guó)产(chǎn)GPU算(suàn)力(lì)与(yǔ)英(yīng)伟(wěi)达(dá)GPU存(cún)在(zài)差(chà)距(jù)的(de)情(qíng)况(kuàng)下(xià)，通(tōng)过(guò)软(ruǎn)件(jiàn)优(yōu)化(huà)弥(mí)补(bǔ)了(le)硬(yìng)件(jiàn)的(de)不(bù)足(zú)，为(wèi)AI产(chǎn)业(yè)的(de)发(fā)展(zhǎn)开(kāi)辟(pì)了(le)新(xīn)的(de)路径。

DeepSeek的(de)特(tè)点(diǎn)

DeepSeek的(de)以(yǐ)下(xià)几(jǐ)个(gè)特(tè)点(diǎn)，使(shǐ)其(qí)成(chéng)为(wèi)独(dú)树(shù)一(yī)帜(zhì)的(de)标(biāo)杆(gān)。

首(shǒu)先(xiān)，其(qí)训(xun)练(liàn)成(chéng)本(běn)大(dà)幅(fú)下(xià)降(jiàng)，外(wài)媒(méi)报(bào)道(dào)仅(jǐn)需(xū)几(jǐ)百(bǎi)万(wàn)美(měi)元(yuán)，与(yǔ)之(zhī)前(qián)动(dòng)辄(zhé)上亿的训练成本相比成本显著降低。同时，通过蒸馏DeepSeek生成高质量的推理数据，再利用这些数据微调像千问、Llama等开源小模型，用极低成本大幅提升了这些小模型的性能。

其次，DeepSeek将最大规模的671B模型参数完全公开，且开源协议非常宽松，允许自由修改、复制和商业化，这消除了企业在数据安全方面的顾虑，使企业能够放心地在自己的环境内部署私有化版本，将企业内部的文档、技术资料甚至财务数据用于大模型的问答和应用，扫除了大模型应用的最大障碍。

因此，DeepSeek彻底颠覆了AI产业原有的商业模式，原来通过商用模型部署的业务模式因DeepSeek的出现而发生巨大改变。

DeepSeek使用经验分享

访问与替代方案

目前，DeepSeek提供了官网和APP供用户使用，但是因用户量爆棚，在使用时可能会出现不稳定的情况。在这种情况下，有一些替代方案可供选择，如腾讯元宝和纳米搜索等。这些平台支持全尺寸模型的问答功(gōng)能(néng)，还(hái)具(jù)备(bèi)联(lián)网(wǎng)搜(sōu)索(suǒ)和(hé)文件(jiàn)上(shàng)传(chuán)等(děng)功(gōng)能(néng)，在(zài)DeepSeek官(guān)网(wǎng)不(bù)稳(wěn)定(dìng)时(shí)能(néng)为(wèi)用(yòng)户(hù)提(tí)供(gōng)备(bèi)用(yòng)方(fāng)案(àn)。

使(shǐ)用技巧与注意事项

使用DeepSeek时，打开“深度思考”开关至关重要，因为该开关关闭时使用的是V3非推理模型，而打开后则调用R1推理模型，能获得更强大的功能。在提问方式上，相比以往复杂的提示词工程，DeepSeek推荐使用更自然的表达方式。用户只需(xū)专(zhuān)注(zhù)描(miáo)述(shù)问题的背景信息、明确自己的目标以及添加风格提示等，例如要求“面向初中生以鲁迅风格写一篇食品类科普文章”。此外，强烈推荐用户阅读清华大学出版的关于(yú)DeepSeek使(shǐ)用(yòng)介(jiè)绍的 PPT，其中详细介绍了向DeepSeek提问的技巧，有助于用户更好地与模型进行交互。

如何将DeepSeek用于科普创作？

科普主题发掘

DeepSeek在科普主题发掘方面具有很大的潜力。它可以在特定领域，如前沿科技、城市生活常识、当下流行的伪科学等方向，为创作者提供科普主题。同时，还能根据不同的受众群体，生成相应的主题。例如，针对60~70岁的老人，DeepSeek会提供围绕健康管理方面的三高管理、科学饮食，以及退休后的心理健康指南等主题；而针对青少(shǎo)年(nián)破(pò)除(chú)伪(wěi)科(kē)学(xué)的(de)需(xū)求(qiú)，DeepSeek会(huì)提(tí)供(gōng)星(xīng)座(zuò)算(suàn)命(mìng)、手(shǒu)机(jī)致(zhì)癌(ái)、外(wài)星(xīng)人(rén)绑(bǎng)架(jià)等(děng)新(xīn)奇(qí)有趣的主题。此外，结合近期热点新闻，DeepSeek能从热点话题中筛选出有价值的科普主题，如(rú)根(gēn)据(jù)近(jìn)期(qī)小(xiǎo)行(xíng)星(xīng)撞(zhuàng)地(de)球(qiú)的(de)热(rè)点(diǎn)话(huà)题(tí)，为(wèi)科普创作提供灵感。

科普内容生成

基于给定的科普主题，DeepSeek能够为不同受众生成针对性的科普内容。以人造太阳的科普为例，当要求为小学三年级学生创作科普文章时，它会避免使用专业术语，尽量用浅显易懂的语言描述人造太阳的价值和功能；而当为高中三年级学生创作时，则会包含科学专业术语和相关数据，适合高中学生作为课外拓展阅读。DeepSeek还可以生成短视频脚本，为科普短视频的制作提供便利。同时，在科普分级读物方面，它具有生成不同难度文章的能力，通过难度设定可以精确匹配不同阅读水平的需求，这对于中文科普分级读物的发展具有重要意义。

此外，在科普访谈方面，DeepSeek可以根据访谈对象和主题，结合互联网上的相关材料，生成定制化的访谈提纲。访谈结束后，还能根据访谈文字稿辅助生成总结文章，提高工作(zuò)效率。在处理国外前沿论文时，DeepSeek可以将论文内容转化为有趣(qù)的(de)科(kē)普(pǔ)文章(zhāng)，在(zài)内(nèi)容(róng)风(fēng)格(gé)上(shàng)并(bìng)非(fēi)机(jī)械(xiè)解(jiě)读(dú)，而(ér)是(shì)结(jié)合(hé)科(kē)普(pǔ)宣(xuān)传(chuán)的(de)需(xū)求(qiú)，吸(xī)引(yǐn)读(dú)者(zhě)的(de)注(zhù)意(yì)力(lì)。

拓(tà)展(zhǎn)应(yīng)用(yòng)场(chǎng)景(jǐng)

DeepSeek结(jié)合(hé)其(qí)他(tā)技(jì)术(shù)，能(néng)够(gòu)拓(tà)展(zhǎn)科(kē)普(pǔ)内(nèi)容(róng)创(chuàng)作(zuò)的(de)边(biān)界(jiè)。例(lì)如(rú)，结(jié)合(hé)简(jiǎn)易(yì)AI自(zì)动(dòng)化(huà)匹(pǐ)配(pèi)视(shì)频(pín)素(sù)材(cái)并(bìng)进(jìn)行(xíng)剪(jiǎn)辑(ji)，再(zài)结(jié)合(hé)文本(běn)生(shēng)成(chéng)语(yǔ)音(yīn)（TTS）技(jì)术(shù)，可(kě)以(yǐ)制(zhì)作(zuò)完(wán)整(zhěng)的(de)科(kē)普(pǔ)短(duǎn)视(shì)频(pín)；结(jié)合(hé)豆(dòu)包(bāo)进(jìn)行(xíng)文本(běn)生(shēng)成(chéng)，实(shí)现(xiàn)图(tú)文混(hùn)排(pái)，使(shǐ)科(kē)普(pǔ)内(nèi)容(róng)更(gèng)具(jù)吸(xī)引(yǐn)力(lì)；结(jié)合(hé)Kimi等(děng)相(xiāng)关工(gōng)具(jù)可(kě)以(yǐ)制(zhì)作(zuò)科(kē)普(pǔ)PPT，用(yòng)于(yú)展(zhǎn)示(shì)科(kē)普(pǔ)知(zhī)识(shi)；结(jié)合(hé)数(shù)字(zì)人(rén)技(jì)术(shù)生(shēng)成(chéng)科(kē)普(pǔ)数(shù)字(zì)人(rén)，为(wèi)中(zhōng)小(xiǎo)学生或特定用户群体介绍科普内容，这种应用在科普基地、博物馆等场所具有广阔的发展空间。

AI时代不缺好答案，而是缺好问题。提出好问题可能是人们未来需要学习、提高的重要素质。期待人工智能未来在科普内容创作领域发挥更大的价值，助力全民科学素质水平提升。

（作者：董霖，浙江省科普联合会副会长、每日互动创始团队成员、首席数据官）

本文根据浙江省科普联合会周四夜学内容整理

官方网站-首页

DeepSeek如何赋能科普内容创作？一文解锁N种方法

产品&技术

解决方案&服务

投资者关系

新闻中心

关于我们