谷歌推出SignGemma:将手语转化为口语文本的AI模型
人工智能(AI)手语技术谷歌产品与创新开源项目机器学习模型无障碍技术自然语言处理(NLP)科技公告
作者: aipost发布于: 14天前
谷歌宣布推出SignGemma,这是一个即将发布的AI模型,旨在将手语翻译成口语文本。作为开源Gemma家族的一部分,它将于今年晚些时候发布,并最终集成到Google产品如Gemini Live中。这一创新旨在通过弥合聋人和听力障碍社区的沟通差距来提升无障碍性。
谷歌宣布推出SignGemma,这是一个即将发布的AI模型,旨在将手语翻译成口语文本。作为开源Gemma家族的一部分,它将于今年晚些时候发布,并最终集成到Google产品如Gemini Live中。这一创新旨在通过弥合聋人和听力障碍社区的沟通差距来提升无障碍性。
SignGemma代表了AI驱动的无障碍技术的重大进步,利用机器学习和**自然语言处理(NLP)**来解释视觉手语手势并将其转换为实时文本或语音。通过开源该模型,谷歌鼓励在辅助技术领域进行更广泛的开发和采用。
预告暗示了未来在实时互动中的应用,表明与谷歌生态系统的无缝集成。这与该公司专注于包容性AI解决方案的宗旨一致,紧随Live Transcribe等项目之后。
参考资料
- 谷歌DeepMind推文:https://x.com/googledeepmind/status/1927375853551235160?s=46
- AI Post的X账号:https://x.com/aiposted