中国慈善家 · 2026-05-18
中国慈善家 · 2026-05-18

视障人士也能“看”春晚了。
2026年央视春晚,抖音直播间开通了AI实时字幕,服务听障观众,同时还专门为视障群体增设了智能语音解说通道,依托火山引擎豆包语音模型的能力,让视障人群第一次“同步感知”春晚。
统计数据显示,中国目前约有8500万残障人士,改善他们的处境、推动他们和主流人群的融合一直是社会创新的一个发力点。
随着AI时代的到来,AI一个重要的应用场景正是助残领域。
AI语音撑起亿级无障碍直播
“以前春晚只是听个‘响’,感受一下热闹,相声小品还好,歌舞节目就只能靠想象,不知道舞台上的灯光有多美,演员的动作有多灵动。”视障人士刘先生告诉记者,除夕夜大家都是“看”春晚,他只能“听”春晚,只能听到主持人的声音、音乐的旋律以及现场观众发出的笑声。
而在2026年马年春晚,视障人士可以通过抖音直播间宏大场景、舞蹈动作、魔术变化、色彩转换的语言解说,感受到了春晚舞台的气氛和场面。听障人士也可以通过唱念做打、人声和弦、语言对白、音乐旋律的手语翻译来感受春晚。
这一改变源于抖音直播间首次面向全网开放两路无障碍信号,依托火山引擎豆包语音模型实现大规模、低延迟、高准确率的AI实时字幕与智能语音解说,让听障观众第一次与普通人同步感受晚会节奏、语言节目笑点与现场情绪,不再被隔绝在声音之外。
这场高规格、高复杂度的直播保障,成为AI助残面向公共场景的一次关键压力测试。
火山引擎豆包语音产品负责人杨相会向《中国慈善家》介绍,春晚直播需求在1月初才正式明确,距离直播仅有一个月的时间。要在主持人播报、歌唱演奏、方言节目、观众掌声与背景音混杂的复杂环境中保持稳定转写,同时满足极低延迟、内容安全支撑,对模型能力与工程协同都是极高挑战。
豆包语音团队、抖音直播团队、视频直播服务团队以及安全审核团队多方协同,在极短时间内完成链路打通、模型优化、压力测试与人工兜底机制搭建。
支撑整场无障碍直播平稳运行的核心,是火山引擎豆包语音识别大模型。杨相会介绍,这一模型基于大模型架构全新训练,拥有千万小时级训练语料,具备更强的识别准确率、上下文理解能力与抗干扰表现。
与传统语音模型不同,它无须为某一种方言单独训练,也不用在不同语言间手动切换,可在同一模型内支持普通话、英语及多种主流方言,即便面对带有浓重地方口音的节目,依然保持稳定输出。
“技术团队还利用历年春晚素材开展专项优化,强化对人名、节目名、特殊词汇与网络热词的识别,确保字幕准确、贴合语境。”杨相会说,最终呈现的效果超出预期。主持人串场、语言类节目、互动环节均实现高准确率转写,延迟控制在自然流畅范围,让听障用户真正实现平等观赛。
杨相会表示,春晚项目的意义,不仅是完成一次重大活动保障,更验证了AI语音能力可以规模化、常态化服务残障群体。
经过实战验证的技术能力,可进一步平移至短视频、影视剧、公共广播、课堂教学、线下会议等更多场景,让无障碍从特殊时刻的临时配置,变为数字生活的基础能力。
AI为残障群体带来的改变,早已不止于一场晚会的顺畅观看。近年来,人工智能正以润物无声的方式渗透信息获取、出行导航、康复训练、就业支持、居家生活等各个领域,推动无障碍从零星试点走向体系化落地。从全国残特奥会的集中科技保障,到日常产品里的无障碍功能迭代,一条可复制、可推广、可持续的路径逐渐清晰。

这样的改变并非个例。越来越多的残障用户开始将通用AI工具融入日常,用语音助手控制环境,用实时字幕获取信息,用智能生成解决工作难题,用多模态辅助突破物理限制。
从被动受助到自主解决问题
近年来,在重大赛事场景中,AI语音转写、智能手语、视觉辅助、智能看护等技术广泛应用,为运动员与观众提供更顺畅的沟通、更安全的出行与更便捷的观赛体验。AI手语翻译、智能导览、无障碍剧场、实时字幕等功能陆续进入主流平台,逐步打破听力或视力差异带来的信息鸿沟。
杨相会表示,豆包语音团队的核心思路,是提供可复用、可扩展、低成本的底层能力,而非局限于某一款助残产品。通过开放接口,AI无障碍能力可以赋能更多应用,帮助到公益组织、开发者与硬件厂商,让技术普惠真正下沉到最需要的人群与最贴近生活的场景。
近期,一加一残障公益集团合伙人、上海有人公益基金会理事傅高山完成了一项过去难以想象的AI助残实践。针对肢体障碍群体对低成本、高可靠性轮椅动力车头的迫切需求,他在缺乏工程图纸、结构计算与供应链资源的情况下,向大模型AI提出了清晰而具体的改造需求后,AI在短时间内给出了接近工业级的完整方案,不仅包含结构设计、重心校准、制动系统与安装规范,还精准匹配了具备加工能力的供应商,列明材料规格、采购价格区间与安全测试标准。

这个案例彰显了AI助残最核心的痛点:残障群体最清楚自身的真实需求,却长期困于“有需求、无能力、无资源”的困境。AI则大幅降低了创新与实践的门槛,让残障人士不必被动等待外界的设计与捐赠,而是可以主动用技术解决自己的问题。
傅高山认为,试图用技术“修复”个体残障并不是助残的最佳方案,真正可持续的方向,是用AI改善信息交互、降低参与门槛、支持平等生活,尊重残障作为人类多样性的正常存在。
比如,短视频与直播平台内置AI实时字幕,降低听障用户的内容消费门槛;地图应用推出无障碍导航,规划轮椅通道、盲道友好路线,支持更独立的出行;智能导盲设备帮助视障人士识别障碍物、红绿灯与周边环境;AI辅助内容创作、数据处理与在线服务,降低残障者就业技能门槛,支持更多居家灵活就业可能。技术不再是遥远的概念,而是真实提升生活质量、扩大社交半径、增强自主尊严的日常支撑。
认知鸿沟和技术局限
尽管AI助残快速推进,但行业仍面临认知偏差、设计错位、可靠性不足与长效机制缺失等现实挑战。
傅高山直言,很多对AI助残的理念出现偏差,比如大量资源投向仿生器官、替代式修复等方向,成本高昂、落地困难,对普通家庭缺乏实际意义,而真正能改善生活的信息无障碍、出行辅助、沟通支持等领域,却常常被视为“不够科技感”而被忽视。

“有些厂商做仿生手、仿生腿,想着缺哪补哪,加上脑机接口之类的,但这种路线大多成不了,核心是看待残障的视角错了。”傅高山说,国际主流残障理念早已明确,残障是人类多样性的正常组成,障碍更多来自环境不友好与社会排斥,而非个体的“残障”。很多团队热衷于做仿生眼、仿生腿、脑机接口 “替代器官”,投入巨大、量产极难、价格昂贵,对大多数残障群体意义不大。
另外,工程视角与用户需求的错位,同样影响真实体验。不少AI助残产品功能看似强大,却在细节上脱离使用场景:字幕字体过小、颜色对比不足、无法自由调节,语音播报语速过快、语气机械、缺乏重点标注,操作流程复杂、学习成本高,对老年残障群体尤为不友好。
还有一些产品在数据采集、隐私保护与信息安全上缺乏透明机制,过度收集用户信息,却没有建立起充分的纠错和申诉渠道。
AI本身的技术局限同样不容忽视。傅高山指出,大模型存在“幻觉”风险,生成内容看似专业完整,却可能在关键参数、安全标准、可行性上出现偏差,非专业的用户很难判断风险。在辅具改造、康复指导、出行安全等场景中,这类问题尤其值得警惕。
长效运营不足同样制约行业发展,不少项目停留在“发布会公益”,上线时声势浩大,后续迭代停滞、反馈无门,最终快速收缩,难以形成持续价值。
“每一场大型体育赛事几乎都有为残障人士服务的AI团队,也会有很多产品出来,但这些产品仅能在赛事期间使用,比如为视障人士设计的眼镜,市场上根本看不到,原因就是这些产品满足不了残障人士的真正需求。”一位视障人士告诉《中国慈善家》。
在傅高山看来,AI不应是附加功能,而应是产品的基础标配;不应是短期公益项目,而应是企业长期的社会责任。只有将无障碍纳入产品设计、研发测试、迭代更新与客户服务全流程,让残障用户真正参与需求定义、体验测试与效果评估,AI助残才能摆脱“作秀”,走向现实生活,做到可用、可持续。
让技术适配人
面对技术快速迭代与社会需求持续升级,AI助残正在形成更清晰的价值共识。技术可以解决问题,但不能替代人文关怀;可以提升效率,但不能取代社会包容;可以降低门槛,但不能忽略最脆弱群体的真实处境。
也就是说,AI的使命是赋能,不是替代。
从AI自主完成轮椅车头改装,到春晚AI无障碍直播间让千万听障观众平等观赛,再到AI辅具、信息无障碍、智能康复等场景持续落地,一条清晰的路径正在形成。
傅高山将AI助残分了三个阶段:第一阶段“Work for AI”(为AI工作),比如做数据标注。随着AI智能化的提高,进入第二个阶段,即“Work with AI”(和AI一起工作),这一阶段解决操作无障碍、效率等问题。第三个阶段是“Life with AI”(和AI一起生活),比如盲人阅读时能让AI总结、互动。这种改变会让残障人士使用AI的门槛越来越更低,最终和普通人实现平权。

“未来,AI将进一步深入残障群体的工作、学习、社交与生活,从信息辅助到行动支持,从就业赋能到情感陪伴,构建更完整的无障碍体系。”傅高山说,真正的AI向善,不是追求多么炫酷的能力,而是让每一个人都能在技术面前拥有尊严、自主与平等。
杨相会也表示,豆包语音团队将持续聚焦无障碍场景,不断优化模型在复杂环境下的准确率、延迟表现、易用性与隐私保护,把春晚所验证的技术能力逐步开放到更广泛的生活与公共服务场景中,让AI真正服务每一个人。
作者:温如军
图片来源:视觉中国
图片编辑:张旭