给残障人士的AI - 中国慈善家

杂志

给残障人士的AI

真正有用的AI，是改善信息获取、降低行动门槛、提升社交平等、支持自主生活，而不是试图 “消除残障”

中国慈善家 · 2026-05-18

听障人士在通过抖音观看春晚无障碍转播。图｜抖音

视障人士也能“看”春晚了。

2026年央视春晚，抖音直播间开通了AI实时字幕，服务听障观众，同时还专门为视障群体增设了智能语音解说通道，依托火山引擎豆包语音模型的能力，让视障人群第一次“同步感知”春晚。

统计数据显示，中国目前约有8500万残障人士，改善他们的处境、推动他们和主流人群的融合一直是社会创新的一个发力点。

随着AI时代的到来，AI一个重要的应用场景正是助残领域。

AI语音撑起亿级无障碍直播

“以前春晚只是听个‘响’，感受一下热闹，相声小品还好，歌舞节目就只能靠想象，不知道舞台上的灯光有多美，演员的动作有多灵动。”视障人士刘先生告诉记者，除夕夜大家都是“看”春晚，他只能“听”春晚，只能听到主持人的声音、音乐的旋律以及现场观众发出的笑声。

而在2026年马年春晚，视障人士可以通过抖音直播间宏大场景、舞蹈动作、魔术变化、色彩转换的语言解说，感受到了春晚舞台的气氛和场面。听障人士也可以通过唱念做打、人声和弦、语言对白、音乐旋律的手语翻译来感受春晚。

这一改变源于抖音直播间首次面向全网开放两路无障碍信号，依托火山引擎豆包语音模型实现大规模、低延迟、高准确率的AI实时字幕与智能语音解说，让听障观众第一次与普通人同步感受晚会节奏、语言节目笑点与现场情绪，不再被隔绝在声音之外。

这场高规格、高复杂度的直播保障，成为AI助残面向公共场景的一次关键压力测试。

火山引擎豆包语音产品负责人杨相会向《中国慈善家》介绍，春晚直播需求在1月初才正式明确，距离直播仅有一个月的时间。要在主持人播报、歌唱演奏、方言节目、观众掌声与背景音混杂的复杂环境中保持稳定转写，同时满足极低延迟、内容安全支撑，对模型能力与工程协同都是极高挑战。

豆包语音团队、抖音直播团队、视频直播服务团队以及安全审核团队多方协同，在极短时间内完成链路打通、模型优化、压力测试与人工兜底机制搭建。

支撑整场无障碍直播平稳运行的核心，是火山引擎豆包语音识别大模型。杨相会介绍，这一模型基于大模型架构全新训练，拥有千万小时级训练语料，具备更强的识别准确率、上下文理解能力与抗干扰表现。

与传统语音模型不同，它无须为某一种方言单独训练，也不用在不同语言间手动切换，可在同一模型内支持普通话、英语及多种主流方言，即便面对带有浓重地方口音的节目，依然保持稳定输出。

“技术团队还利用历年春晚素材开展专项优化，强化对人名、节目名、特殊词汇与网络热词的识别，确保字幕准确、贴合语境。”杨相会说，最终呈现的效果超出预期。主持人串场、语言类节目、互动环节均实现高准确率转写，延迟控制在自然流畅范围，让听障用户真正实现平等观赛。

杨相会表示，春晚项目的意义，不仅是完成一次重大活动保障，更验证了AI语音能力可以规模化、常态化服务残障群体。

经过实战验证的技术能力，可进一步平移至短视频、影视剧、公共广播、课堂教学、线下会议等更多场景，让无障碍从特殊时刻的临时配置，变为数字生活的基础能力。

AI为残障群体带来的改变，早已不止于一场晚会的顺畅观看。近年来，人工智能正以润物无声的方式渗透信息获取、出行导航、康复训练、就业支持、居家生活等各个领域，推动无障碍从零星试点走向体系化落地。从全国残特奥会的集中科技保障，到日常产品里的无障碍功能迭代，一条可复制、可推广、可持续的路径逐渐清晰。

2024年11月28日，智能导盲犬亮相2024年中国国际福祉博览会。

这样的改变并非个例。越来越多的残障用户开始将通用AI工具融入日常，用语音助手控制环境，用实时字幕获取信息，用智能生成解决工作难题，用多模态辅助突破物理限制。

从被动受助到自主解决问题

近年来，在重大赛事场景中，AI语音转写、智能手语、视觉辅助、智能看护等技术广泛应用，为运动员与观众提供更顺畅的沟通、更安全的出行与更便捷的观赛体验。AI手语翻译、智能导览、无障碍剧场、实时字幕等功能陆续进入主流平台，逐步打破听力或视力差异带来的信息鸿沟。

杨相会表示，豆包语音团队的核心思路，是提供可复用、可扩展、低成本的底层能力，而非局限于某一款助残产品。通过开放接口，AI无障碍能力可以赋能更多应用，帮助到公益组织、开发者与硬件厂商，让技术普惠真正下沉到最需要的人群与最贴近生活的场景。

近期，一加一残障公益集团合伙人、上海有人公益基金会理事傅高山完成了一项过去难以想象的AI助残实践。针对肢体障碍群体对低成本、高可靠性轮椅动力车头的迫切需求，他在缺乏工程图纸、结构计算与供应链资源的情况下，向大模型AI提出了清晰而具体的改造需求后，AI在短时间内给出了接近工业级的完整方案，不仅包含结构设计、重心校准、制动系统与安装规范，还精准匹配了具备加工能力的供应商，列明材料规格、采购价格区间与安全测试标准。

2026年3月3日，浙江湖州，浙江臻行科技有限公司的技术工程师在对AI智能假肢产品进行技术调试。

这个案例彰显了AI助残最核心的痛点：残障群体最清楚自身的真实需求，却长期困于“有需求、无能力、无资源”的困境。AI则大幅降低了创新与实践的门槛，让残障人士不必被动等待外界的设计与捐赠，而是可以主动用技术解决自己的问题。

傅高山认为，试图用技术“修复”个体残障并不是助残的最佳方案，真正可持续的方向，是用AI改善信息交互、降低参与门槛、支持平等生活，尊重残障作为人类多样性的正常存在。

比如，短视频与直播平台内置AI实时字幕，降低听障用户的内容消费门槛；地图应用推出无障碍导航，规划轮椅通道、盲道友好路线，支持更独立的出行；智能导盲设备帮助视障人士识别障碍物、红绿灯与周边环境；AI辅助内容创作、数据处理与在线服务，降低残障者就业技能门槛，支持更多居家灵活就业可能。技术不再是遥远的概念，而是真实提升生活质量、扩大社交半径、增强自主尊严的日常支撑。

认知鸿沟和技术局限

尽管AI助残快速推进，但行业仍面临认知偏差、设计错位、可靠性不足与长效机制缺失等现实挑战。

傅高山直言，很多对AI助残的理念出现偏差，比如大量资源投向仿生器官、替代式修复等方向，成本高昂、落地困难，对普通家庭缺乏实际意义，而真正能改善生活的信息无障碍、出行辅助、沟通支持等领域，却常常被视为“不够科技感”而被忽视。

2023年12月21日，日本东京，横滨小交响乐团为圣诞音乐会排练贝多芬《第九交响曲》时，脑瘫患者Kiwa Usami(中)正在用一根食指弹奏人工智能钢琴。

“有些厂商做仿生手、仿生腿，想着缺哪补哪，加上脑机接口之类的，但这种路线大多成不了，核心是看待残障的视角错了。”傅高山说，国际主流残障理念早已明确，残障是人类多样性的正常组成，障碍更多来自环境不友好与社会排斥，而非个体的“残障”。很多团队热衷于做仿生眼、仿生腿、脑机接口 “替代器官”，投入巨大、量产极难、价格昂贵，对大多数残障群体意义不大。

另外，工程视角与用户需求的错位，同样影响真实体验。不少AI助残产品功能看似强大，却在细节上脱离使用场景：字幕字体过小、颜色对比不足、无法自由调节，语音播报语速过快、语气机械、缺乏重点标注，操作流程复杂、学习成本高，对老年残障群体尤为不友好。

还有一些产品在数据采集、隐私保护与信息安全上缺乏透明机制，过度收集用户信息，却没有建立起充分的纠错和申诉渠道。

AI本身的技术局限同样不容忽视。傅高山指出，大模型存在“幻觉”风险，生成内容看似专业完整，却可能在关键参数、安全标准、可行性上出现偏差，非专业的用户很难判断风险。在辅具改造、康复指导、出行安全等场景中，这类问题尤其值得警惕。

长效运营不足同样制约行业发展，不少项目停留在“发布会公益”，上线时声势浩大，后续迭代停滞、反馈无门，最终快速收缩，难以形成持续价值。

“每一场大型体育赛事几乎都有为残障人士服务的AI团队，也会有很多产品出来，但这些产品仅能在赛事期间使用，比如为视障人士设计的眼镜，市场上根本看不到，原因就是这些产品满足不了残障人士的真正需求。”一位视障人士告诉《中国慈善家》。

在傅高山看来，AI不应是附加功能，而应是产品的基础标配；不应是短期公益项目，而应是企业长期的社会责任。只有将无障碍纳入产品设计、研发测试、迭代更新与客户服务全流程，让残障用户真正参与需求定义、体验测试与效果评估，AI助残才能摆脱“作秀”，走向现实生活，做到可用、可持续。

让技术适配人

面对技术快速迭代与社会需求持续升级，AI助残正在形成更清晰的价值共识。技术可以解决问题，但不能替代人文关怀；可以提升效率，但不能取代社会包容；可以降低门槛，但不能忽略最脆弱群体的真实处境。

也就是说，AI的使命是赋能，不是替代。

从AI自主完成轮椅车头改装，到春晚AI无障碍直播间让千万听障观众平等观赛，再到AI辅具、信息无障碍、智能康复等场景持续落地，一条清晰的路径正在形成。

傅高山将AI助残分了三个阶段：第一阶段“Work for AI”（为AI工作），比如做数据标注。随着AI智能化的提高，进入第二个阶段，即“Work with AI”（和AI一起工作），这一阶段解决操作无障碍、效率等问题。第三个阶段是“Life with AI”（和AI一起生活），比如盲人阅读时能让AI总结、互动。这种改变会让残障人士使用AI的门槛越来越更低，最终和普通人实现平权。