蓝鲸TMT频道3月3日讯,今日,百度智能云曦灵正式发布“AI手语平台”,可实现分钟级生成手语合成视频、手语主播实时直播等能力。同时,百度智能云曦灵还发布了“AI手语平台一体机”,可以通过规模化部署建立无障碍窗口,适用于医院、银行、车站等多种公共场合。
百度集团副总裁吴甜表示,人工智能呈现融合创新和降低门槛的新特点,综合运用多技术的数字人带来新体验,AI加持使数字人制作和运营成本与门槛降低,AI手语平台将让更多听障人士享受科技带来的便利。
据了解,目前我国听力语言残疾人达到2780万以上,而专业的手语翻译不足1万人,巨大的需求缺口亟待补足。在国家发布的《无障碍环境建设“十四五”实施方案》中,明确提出要完善无障碍基本公共服务体系、加强信息无障碍服务深度应用。
针对线上场景,“AI手语平台”具备“视频手语合成”、“直播手语合成”、“文本转手语”、“语音转手语”四大功能,通过几小时的部署,可实现普通视频合成为手语视频、实时直播中增加手语画面、文字翻译为手语、语音实时翻译为手语等多种效果。对于诸如医院、银行、机场等线下场景,百度智能云曦灵此次发布的全离线一体机V3以及端云结合一体机P3,搭载了“AI手语平台”的核心功能,可实现ASR语音识别、语音翻译、人像渲染等多功能。
据了解,百度智能云曦灵-AI手语平台通过SMLTA语音识别算法模型,实现声学、语言一体化端到端建模语音识别,在手机端近场语音识别率可达98%以上。在手语翻译的准确度及精炼度上,百度研发了首个基于神经网络的精炼度可控手语翻译模型,并联合手语语言学专家、特殊教育专家以及天津理工大学聋人工学院等制定了自然手语标注规范,建设了大规模自然手语翻译语料库。
天津理工大学聋人工学院副院长袁甜甜在发布会上分享到,聋人学生更能感同身受,不错过每一个细节。由于时间紧任务重,学生们还自发呼吁其他各高校近五百名聋人学生共同完成语料库的标注,以责任感和荣誉感为弥补社会信息鸿沟做出努力。