全国科技工作者日 | 仰望星空的“AI巨脑”：中国科研者在路上-科技

全国科技工作者日 | 仰望星空的“AI巨脑”：中国科研者在路上 2025-05-30 12:00:49 科技

【导语】在智能助手、ChatGPT和文心一言等AI技术的背后，隐藏着大语言模型的强大力量。这些“超级语言大脑”能读、能写、能答题，甚至能“讲故事”，代表着人工智能的最前沿。然而，在它们顺畅回应我们的背后，是中国科研工作者在无顶级算力、无完整生态条件下，从零构建属于中国自己的“AI语言大脑”的艰辛历程。本文将带您深入了解大语言模型的炼成之路、国产大模型的破局挑战、科研者的动人故事，以及AI如何融入中国语言和文化。在第九个“全国科技工作者日”之际，让我们向这些时代的记录者、文化的守望者致敬。

“你好，我是你的智能助手，请问有什么可以帮您？”

也许你早已习惯了和智能手机、客服机器人“对话”的场景；也许你用过ChatGPT、文心一言这样的AI生成文字、翻译、写代(dài)码(mǎ)。它(tā)们(men)背(bèi)后(hòu)的(de)核(hé)心(xīn)技(jì)术(shù)，叫(jiào)做(zuò)大(dà)语(yǔ)言(yán)模(mó)型(xíng)。这(zhè)是(shì)当(dāng)今(jīn)人(rén)工(gōng)智(zhì)能(néng)最(zuì)前(qián)沿(yán)的(de)代(dài)表(biǎo)之(zhī)一(yī)——能(néng)读(dú)、能(néng)写(xiě)、能(néng)答(dá)题(tí)，甚(shén)至(zhì)能(néng)“讲(jiǎng)故(gù)事(shì)”，像(xiàng)一(yī)个(gè)永(yǒng)不(bù)疲(pí)倦(juàn)的(de)智(zhì)慧(huì)图(tú)书(shū)馆(guǎn)。

图(tú)片(piàn)来(lái)源(yuán)：百(bǎi)度(dù)文心(xīn)一(yī)言(yán)首(shǒu)页(yè)

而(ér)你(nǐ)或(huò)许(xǔ)不(bù)知(zhī)道(dào)，在(zài)它(tā)们(men)顺(shùn)畅(chàng)回(huí)应(yīng)你(nǐ)的(de)那(nà)一(yī)刻(kè)，藏(cáng)着(zhe)成(chéng)千(qiān)上(shàng)万(wàn)名中(zhōng)国(guó)科(kē)研(yán)工(gōng)作(zuò)者(zhě)夜(yè)以(yǐ)继(jì)日(rì)的(de)努(nǔ)力(lì)。他(tā)们(men)在(zài)没(méi)有(yǒu)顶(dǐng)级(jí)算(suàn)力(lì)、没(méi)有(yǒu)完(wán)整(zhěng)生(shēng)态(tài)的(de)条(tiáo)件(jiàn)下(xià)，从(cóng)零(líng)构(gòu)建(jiàn)出(chū)属(shǔ)于(yú)中(zhōng)国(guó)自(zì)己(jǐ)的(de)“AI语(yǔ)言(yán)大(dà)脑(nǎo)”，用(yòng)技(jì)术(shù)和(hé)汗(hàn)水(shuǐ)书(shū)写(xiě)下(xià)这(zhè)个(gè)时(shí)代(dài)的(de)科(kē)技(jì)答(dá)卷(juǎn)。

1、超(chāo)级(jí)“语(yǔ)言(yán)大脑”是如何炼成的？

所谓“大语言模型”，指的是一种通过学习大量文本(běn)数(shù)据(jù)，从(cóng)而(ér)具备语言理解与生成能力的人工智能系统。它不是真正“懂”语言，而是通过庞大的参数和复杂的训练机制，让机器学会了“预测下一个词”。这个过程，需要成百上千亿级的模型参数、千万本书的总信息量、数周甚至数月的训练时间。

比如ChatGPT，背后是OpenAI花费数亿美元、使用几千张高端GPU显卡和超大语料训练出的成果。而在中国，自主研发出拥有数百亿甚至千亿参数的语言模型，是科研者面对的一场“硬仗”。

2、国产大模型，破局之路走得很难

研发大语言模型，最难的不是“写代码”，而是“通盘突破”：

01语料难

中文的语言结构更复杂、歧义性更强，公开高质量中文语料少。科研者不得不从网页、书籍、论文、论坛中手动清洗出语料，还要过滤“低质文本”和“敏感内容”。一个模型的训练语料，往往需要上百人投入数月筛选处理。

02算力紧

大模型训练是资源密集型工程。以千亿参数模型为例，动辄需要数千张GPU服务器支持，而在芯片领域，我国受制于供应链“卡脖子”。于是科研者用“模型压缩”“并行调度”等方式做减法，用最少的资源跑出最好的效果。

03对标高

ChatGPT带来的震撼让世界意识到：谁掌握了大模型，谁就能在人工智能时代的中占据重要地位。中国必须有自己的AI底座，自己的语言理解系统。为此，“悟道”“ChatGLM”“文心一言(yán)”“天书”“百川”“DeepSeek”等国产大模型接连问世。

根据国家互联网信息办公室最新披露的数据显示，截至2025年4月，已成功通过备案的(de)人(rén)工(gōng)智(zhì)能(néng)大(dà)模(mó)型数量达到了346家——从通用模型，到金融、医疗、教育等行业专用模型，这背后，是无数科研团队昼夜鏖战的成果。

3、那些让人动容的科研者故事

2023年，天数智芯的天垓100国产GPU加速卡迎来了一场硬仗——为北京智源研究院训练70亿参数的Aquila语言模型提供算力支持。面对国产GPU与国际顶尖产品的性能差距，天数智芯产品线总裁邹翾带领团队展开了一场技术攻坚战。他们日夜兼程，重构IXCCL通信库，优化混合精度训练方案，硬是将多卡通信效率提升至98%，最终实现了连续19天的稳定训练。当Aquila语言模型如期完成训练并达到预期效果时，这支团队用行动证明：在算力自主化的道路上，中国人的创新精神永远不会被硬件条件所限制。

图源：pexels

在高校、研究所、企业、实验室，从“算法调优”到“数据治理”，从“推理优化”到“模型压缩”，每一个细节都凝聚着无数人沉默却坚定的努力。他们或许不在镜头前，不在热门话题里，却正是AI革命的无名英雄。

4、把AI写进中国语言和文化

“我们希望让AI用中文思考。”这是很多国产大模型团队的共同目标。

不仅仅是翻译得通顺，更要理解中国语言的语境，理解我们的典故、成语、对联、诗词，甚至是“一个眼神”的情感含义。科研者正在将这些“文化基因”注入AI中。

有人用模型进行古文翻译，有人训练AI生成中医问诊语言，还有人尝试用AI保护濒危方言。AI不是替代人类，而是服务社会、传承文明的新工具。大语言模(mó)型(xíng)正逐渐(jiàn)从(cóng)科(kē)研(yán)实(shí)验(yàn)室(shì)走(zǒu)进(jìn)医(yī)疗(liáo)、教(jiào)育(yù)、司(sī)法(fǎ)、工(gōng)业(yè)、文旅(lǚ)等(děng)多(duō)个(gè)领(lǐng)域，为(wèi)人(rén)类(lèi)解(jiě)决(jué)实(shí)际(jì)问(wèn)题(tí)，也(yě)为(wèi)中(zhōng)国(guó)讲(jiǎng)好(hǎo)自(zì)己(jǐ)的(de)故(gù)事(shì)提(tí)供(gōng)了(le)新(xīn)的(de)载(zài)体(tǐ)。

5、写(xiě)在(zài)“全国(guó)科(kē)技(jì)工(gōng)作(zuò)者(zhě)

2025年(nián)5月(yuè)30日(rì)，是(shì)第(dì)九(jiǔ)个(gè)“全国(guó)科(kē)技(jì)工(gōng)作(zuò)者(zhě)日(rì)”。我(wǒ)们(men)将(jiāng)目(mù)光(guāng)投(tóu)向(xiàng)那(nà)些(xiē)或(huò)许(xǔ)无(wú)名却(què)做(zuò)着(zhe)意(yì)义(yì)非(fēi)凡(fán)的(de)事(shì)情(qíng)的(de)科(kē)技(jì)工(gōng)作(zuò)者(zhě)，他(tā)们(men)在(zài)国(guó)产(chǎn)AI道(dào)路上(shàng)，仰(yǎng)望(wàng)星(xīng)空(kōng)，脚(jiǎo)踏(tà)实(shí)地(de)。

在(zài)大(dà)模(mó)型(xíng)这(zhè)场(chǎng)没(méi)有(yǒu)硝(xiāo)烟(yān)的(de)科(kē)技(jì)竞(jìng)赛(sài)中(zhōng)，他(tā)们(men)不(bù)仅(jǐn)是(shì)工(gōng)程(chéng)师(shī)，更(gèng)是(shì)文化(huà)守(shǒu)望(wàng)者(zhě)，是(shì)时(shí)代(dài)的(de)记(jì)录(lù)者(zhě)。他(tā)们(men)用(yòng)代(dài)码(mǎ)构(gòu)筑(zhù)语言的秩序，用数据打造理解的基石，用算法(fǎ)塑(sù)造(zào)思(sī)维(wéi)的(de)逻(luó)辑。

他们是这个时代最可敬的人之一。

致敬中国每一位科技工作者，向你们说一声：节日快乐，未来可期。

供稿单位：重庆理工大学计算机(jī)科(kē)学(xué)与(yǔ)工(gōng)程(chéng)学(xué)院(yuàn)

作(zuò)者(zhě)：重(zhòng)庆(qìng)理(lǐ)工(gōng)大学张佳雯

审核专家：倪伟

声明：除原创内容及特别说明之外，部分图片来源网络，非商业用途，仅作为科普传播素材，版权归原作者所有，若有侵权，请联系删除。

官方网站-首页

全国科技工作者日 | 仰望星空的“AI巨脑”：中国科研者在路上

产品&技术

解决方案&服务

投资者关系

新闻中心

关于我们