2025-08-09 18:01:54
【导语】1952年,新中国首次受邀参加奥运会,五星红旗在奥运村升起的珍贵瞬间因技术限制仅以黑白影像留存。然而,在“2024中国·AI盛典”上,借助人工智能技术,这一历史时刻以栩栩如生的彩色影像重现,令人仿佛穿越时空。AI技术不仅让这一振奋人心的时刻再次生动展现,更为经典影视作品的高质量修复提供了可能。中国传媒大学人工智能系副教授陶竹林及其团队,正致力于利用AI技术修复包括“四大名著”在内的经典影视作品,让红色基因与优秀文化得以传承。尽管面临诸多挑战,AI助力经典影像修复的前景依然广阔。

1952年,新中国成立不到三年之时,第一次受邀参加奥运会。当中国奥运代表团几经波折抵达赫尔辛基后,他们做的第一件事,便是在奥运村升起五星红旗。这一珍贵的历史时刻通过影像得以记录、保存,成了见证我国开启奥运之路的珍贵回忆。然而,囿于当时的技术条件,原始版本的影像只能以黑白形式留存。随着人工智能(AI)技术的快速发展,在“2024中国·AI盛典”上,我们得以看到这一珍贵时刻的彩色影像,栩栩如生、生动再现,每个动作、每张笑脸,仿佛一下把我们拉回到了当时的场景。
让历史穿越时空
在《1952奥运》视频中,当鲜艳的五星红旗高高扬起,当年轻的笑脸清晰重现,AI技术让这一振奋人心的伟大时刻,穿越时空再一次栩栩如生地展现在我们面前。
“很多珍贵经典影像受到当时拍摄条件、保存条件的限制,存在划痕、霉斑、分辨率不足等问题,不符合当前观影的质量要求。传统人工+工具的修复方法一方面效率低下,另一方面质量达不到要求。”陶竹林表示。
AI技术的快速发展为这一问题提供了新的“解”。
通过深度学习与智能算法,AI技术为高质量、高效率的经典影像修复提供了可能。结合画质智能增强、色彩还原、音频同步修复等手段,AI技术能够助力经典影像焕然一新。
在中央广播电视总台音像资料馆主导推进的“智能影像修复任务”中,陶竹林团队与南京理工大学唐金辉团队合作参与了多项经典影像修复工作,《1952奥运》视频便是其中浓墨重彩的一笔。
“修复过程包括图像修复、图像上色、视频增强等阶段,最终实现了图像和视频质量的极大提升。”陶竹林的博士研究生翟艳介绍道。
具体而言,在图像修复阶段,针对老旧黑白图像中普遍存在的噪声、划痕及脏点问题,采用先进图像复原技术完成了图像的去噪、去划痕和脏点处理,有效提升了图像的清晰度和结构的完整性。
在图像上色阶段,基于图像修复基础,引入自动上色方法对图像进行初步着色,并通过人工优化,修复色彩不准确、边缘溢色等问题,最终实现真实感强、视觉效果自然的彩色图像生成。
在视频增强阶段,首先基于上色后的首尾帧图像,通过颜色传播方法实现整段视频的自动上色,确保颜色在时间维度上的连续性和一致性。随后采用深度学习方法完成视频的超分辨率重建,提升视频整体清晰度,从而实现完整视频的视觉增强。
“通过上述策略和方法,我们有效地在动态视频场景中实现了颜色的连续追踪与准确匹配,确保如旗帜飘动、人物行进等变化(huà)过(guò)程(chéng)的(de)色(sè)彩(cǎi)保(bǎo)持(chí)一致;同时,实现了特定区域的定向上色处理,满足对重要物体或场景的个性化修复需求,带来了更高的还原度与艺术表现力。”陶竹林介绍道。
让优秀文化鲜活留存
除再现重要历史时刻,AI技术还能助力经典影视作品活力焕新。“四大名著”是我国文学史中的经典作品,也是世界宝贵的文化遗产之一。根据“四大(dà)名著(zhe)”改(gǎi)编(biān)的(de)经(jīng)典(diǎn)影(yǐng)视(shì)作(zuò)品(pǐn)不(bù)胜(shèng)枚(méi)举(jǔ),从(cóng)20世(shì)纪(jì)80年(nián)代(dài)一(yī)直(zhí)跨(kuà)越(yuè)至(zhì)今(jīn)。
这(zhè)些(xiē)经(jīng)典(diǎn)的(de)影(yǐng)视(shì)作(zuò)品(pǐn)成(chéng)为(wèi)一(yī)代(dài)又(yòu)一(yī)代(dài)人(rén)的(de)难(nán)忘(wàng)记(jì)忆(yì),也(yě)成(chéng)为(wèi)世(shì)界(jiè)了(le)解(jiě)中(zhōng)国(guó)文化(huà)的(de)重(zhòng)要(yào)窗(chuāng)口(kǒu)。然而,随着拍摄技术(shù)的(de)不(bù)断(duàn)精(jīng)进(jìn),以(yǐ)及(jí)荧(yíng)幕(mù)分(fēn)辨(biàn)率(lǜ)的(de)逐(zhú)渐(jiàn)提(tí)升(shēng),很(hěn)多(duō)经(jīng)典(diǎn)影(yǐng)像(xiàng)显(xiǎn)得(de)“格(gé)格(gé)不(bù)入(rù)”,无(wú)法(fǎ)满(mǎn)足(zú)当(dāng)今(jīn)高(gāo)质(zhì)量(liàng)的(de)观(guān)影(yǐng)要(yào)求(qiú)。
如(rú)何(hé)让(ràng)经(jīng)典(diǎn)影(yǐng)像(xiàng)跟(gēn)上时代的脚步,更好地实现文化传承与发展?AI技术给出了答案。
“AI助力经典影像修复的具体步骤包括总结分析、模型搭建、数据训练、实际修复等几个阶段”,翟艳介绍。
操(cāo)作(zuò)过(guò)程(chéng)中(zhōng),首(shǒu)先(xiān)需(xū)要(yào)对(duì)影(yǐng)像(xiàng)中(zhōng)常(cháng)见(jiàn)的(de)退(tuì)化(huà)问(wèn)题(tí)进(jìn)行(xíng)系(xì)统(tǒng)性(xìng)总(zǒng)结(jié),包(bāo)括(kuò)图(tú)像(xiàng)噪(zào)声(shēng)、划(huà)痕(hén)、模(mó)糊(hu)和(hé)分(fēn)辨(biàn)率(lǜ)低(dī)等(děng)。接(jiē)着(zhe),基(jī)于(yú)这(zhè)些(xiē)分(fēn)析(xī)构(gòu)建(jiàn)模(mó)拟(nǐ)真(zhēn)实(shí)退(tuì)化(huà)过(guò)程(chéng)的(de)退(tuì)化(huà)模(mó)型(xíng),为(wèi)后(hòu)续(xù)训(xun)练(liàn)提(tí)供(gōng)有(yǒu)效(xiào)的(de)数(shù)据(jù)支(zhī)撑(chēng)。在(zài)此基础上,调研当前主流图像修复技术,优选基于扩散模型的图像生成方法,并结合所构建的退化数据,对模型进行有针对性的重新训练,从而更好地适应经典影像的修复需求。
“比如,图像修复环节主要采用扩散模型去除(chú)噪(zào)声(shēng)和(hé)划(huà)痕(hén),并(bìng)结(jié)合超分辨率重建技术提升图(tú)像(xiàng)清(qīng)晰(xī)度(dù)与(yǔ)细(xì)节(jié)表(biǎo)现(xiàn)力(lì)。在(zài)视(shì)频(pín)修(xiū)复(fù)方(fāng)面(miàn),则(zé)引(yǐn)入(rù)结(jié)合(hé)运(yùn)动(dòng)特(tè)征(zhēng)的(de)扩(kuò)散(sàn)模(mó)型(xíng),有(yǒu)效(xiào)处(chù)理(lǐ)视(shì)频(pín)中(zhōng)不(bù)同(tóng)帧(zhèng)之(zhī)间(jiān)变(biàn)化(huà)带(dài)来(lái)的(de)时(shí)序(xù)不(bù)一(yī)致(zhì)问(wèn)题,同时实现去噪(zào)与(yǔ)划(huà)痕(hén)修(xiū)复(fù);在(zài)此(cǐ)基(jī)础(chǔ)上(shàng),根(gēn)据(jù)修(xiū)复(fù)目(mù)标(biāo),进(jìn)一(yī)步(bù)集成(chéng)上(shàng)色(sè)算(suàn)法(fǎ)与(yǔ)分(fēn)辨(biàn)率(lǜ)增(zēng)强(qiáng)模(mó)型(xíng),实(shí)现(xiàn)视(shì)频(pín)在(zài)视(shì)觉(jué)效(xiào)果(guǒ)与(yǔ)色(sè)彩(cǎi)层(céng)次(cì)上(shàng)的(de)整(zhěng)体提升。”陶竹林补充道。
团队正在参与开展的“四大名著”修复工作便为经典影像的清晰重现提供了解决方案。
以《西游记》为例,为实现影像整体视觉质量的提升,团队针对不同类型片段的结构特征,设计并实现了一套差异化的视频修复策略。
具体而言,将影像拆分成以背景场景为主和(hé)以(yǐ)人(rén)物面部细节为主的视频片段,采取差异化的修复策略,更好地满足不同的修复需求。
对于以背景场景为主的视频片段,重点关注帧间时序一致性,通过对连续帧之间的变化规律进行建模,实现画面在运动状态下的稳定还原,有效避免闪烁与结构漂移问题;而对于以人物面部细节为主的片段,则侧重于提升图像的纹理细节和真实感,使修复结果在视觉上更具表现力。
此外,“为了进一步改善整体修复效果,我们对视频内容进行分段处理,并结合片段拼接与融合技术,有效解决了统一模型难以兼顾不同片段特征的问题,确保整段视频在风格与质量上的一致性。”陶竹林补充道。
在AI大模型技术快速发展的背景下,团队还据此整理并建立了面向特定历史影视作品的近景图像数据集,为模型训练提供了极具代表性的训练样本。
让红色基因得以传承
经典影视作品还承载着传承优秀文化,赓续红色精神的重要使命,其中,20世纪60年代的经典电影作品《雷锋》便是这样一部激励一代又一代人成长的杰出作品。
原版影片以黑白方式呈现,而经过AI修复后的彩色4K版影片,更好地还原了当时的场景与人物细节,目前已经在多个地方点映。
在修复过程中,团队采取了简单镜头与复杂镜头差异化的修复方案。“在部分简单镜头的处理中,针对自然景物、读书看报等静态场景,采用常规图像上色算法即可实现较高质量的着色,实现边缘过渡自然、无明显色彩异常的稳定效果。”翟艳介绍道,“而针对复杂镜头,普通上色方法却容易出现颜色漂移、边界溢色等问题。”
对此,对于光线昏暗、室内结构复杂、人物较多或场景发生渐变的镜头,团队创新提出对每一段片段提取关键帧进行精细化上色处理的方法,同时,结合帧间插值技术提升时序一致性,有效缓(huǎn)解(jiě)了(le)错(cuò)上(shàng)色(sè)与(yǔ)漏(lòu)色(sè)现(xiàn)象(xiàng),实(shí)现(xiàn)了(le)整(zhěng)体(tǐ)视(shì)觉(jué)效(xiào)果(guǒ)的(de)显(xiǎn)著(zhe)提(tí)升(shēng)。
修(xiū)复(fù)过(guò)程(chéng)中(zhōng)的(de)另(lìng)一(yī)个(gè)难(nán)点(diǎn),则(zé)是如何处理人物快速运动或人物数量众多等高动态镜头。“我们在增加关键帧数量的基础上,引入了人工修复机制,对易被忽略的细节区域(如快速移动的人物轮廓、遮挡区域)进行手动精修,确保色彩还原的准确性与视觉自(zì)然(rán)度(dù)。”陶竹林介绍。
AI助力经典影像修复
仍存在诸多难点
“合理利用AI技术,不但可以让大家重温经典,接受爱国主义教育熏陶,还可以更好地传承中华优秀文化,增强文化自信。”陶竹林表示。然而,尽管AI助力经典影像修复已经实现了显著发展,但仍面临诸多挑战。
比如模型的泛化能力不足。当前模型大多依赖人工设计或理想化的退化模拟,难以全面覆盖经典影像的真实退化情况,导致在实际应用中泛化能力不足。效率和精度的平衡问题同样凸显。对于高分辨率图像的修复需要处理大量数据,对计算资源提出了很高的要求。此外,还面临AI大模型快速发展的通用问题,数据获取难度大。高质量的训练数据集对于基于深度学习的方法尤为重要,但获取大规模、标注精确的数据并非易事。
对此,陶竹林认为,影像修复领域未来将在作用机制、数据训练、技术融合等方面实现进一步发展。就作用机制而言,深度学习应与传统修复方法相结合,各自发挥优势;同时,针对不同用户需求和场景特点的个性化修复解决方案也尤为重要。就数据训(xun)练(liàn)而(ér)言(yán),应(yīng)引(yǐn)入(rù)大(dà)规(guī)模(mó)真(zhēn)实(shí)退(tuì)化(huà)影(yǐng)像(xiàng)数(shù)据(jù),进(jìn)一(yī)步(bù)提(tí)升(shēng)AI模(mó)型(xíng)对(duì)于(yú)复(fù)杂(zá)退(tuì)化(huà)的(de)适(shì)应(yīng)性(xìng)和(hé)泛(fàn)化(huà)能(néng)力(lì)。就(jiù)技(jì)术(shù)融(róng)合(hé)而(ér)言,借助大数据与云计算,能够更高效地处理大规模影像数据,从而实现修复效果的进一步提升。
采访专家:陶竹林(中国传媒大学人工智能系副教授)
撰文:记者 贾朔荣
编辑:段大卫