讯飞星火首发语音视觉虚拟人交互“三合一” ,亮相多语言大模型

2024.10.24 11:25 · 阅读 9.6万
钛媒体App 10月24日消息,讯飞星火4.0 Turbo全新升级,首发多模态视觉交互,让大模型从语音交互拓展到音视频流的实时多模交互,使得情境感知更全面,任务理解更精准;首发超拟人数字人,业界率先实现语义贯穿的“口唇-表情-动作”的超拟人数字人生成,一张照片就能生成数字人,实现更加立体的个性化多维表达;此外首次发布星火多语言大模型,首批支持中英之外的八个语种,多行业任务场景效果超过GPT-4o。
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。