讯飞星火首发语音视觉虚拟人交互“三合一” ，亮相多语言大模型

2024.10.24 11:25 · 阅读 9.6万

钛媒体App 10月24日消息，讯飞星火4.0 Turbo全新升级，首发多模态视觉交互，让大模型从语音交互拓展到音视频流的实时多模交互，使得情境感知更全面，任务理解更精准；首发超拟人数字人，业界率先实现语义贯穿的“口唇-表情-动作”的超拟人数字人生成，一张照片就能生成数字人，实现更加立体的个性化多维表达；此外首次发布星火多语言大模型，首批支持中英之外的八个语种，多行业任务场景效果超过GPT-4o。

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

讯飞星火首发语音视觉虚拟人交互“三合一” ，亮相多语言大模型

讯飞星火首发语音视觉虚拟人交互“三合一” ，亮相多语言大模型

相关文章

数字王国与AWS达成合作，拓展自主虚拟人及其技术

蝉妈妈旗下AI内容创作平台蝉镜发布电商 数字人

中科金财：公司多模态技术在微短剧、视觉智算及数字人等领域落地应用

IDC首发电商直播数字人报告：百度慧播星综合第一

蝉妈妈旗下AI内容创作平台蝉镜发布电商数字人