在合肥奥体中心,第七届世界声博会暨科大讯飞全球1024开发者节盛大开幕,科大讯飞借此机会展示了其最新的多模态视觉交互技术和超拟人数字人。这一创新不仅震撼了行业,也预示着数字人技术的新篇章。
科大讯飞研究院院长刘聪在活动现场演示了如何通过一张照片快速生成超拟人数字人,这一技术极大简化了数字人的定制流程,降低了应用门槛。用户只需上传个人照片,便能获得一个高度拟真的数字人形象。
除了形象定制,科大讯飞还推出了情感贯穿的多模态交互技术,使数字人能够根据语境实时调整表情,实现更自然的情感表达。这一技术让数字人的面部表情更加生动,情感传递更加准确。
在肢体动作驱动方面,科大讯飞也实现了技术创新。超拟人数字人的肢体动作能够根据语音的节奏、语调和内容实时生成,摆脱了预设模板动作的限制,提升了数字人在动态场景中的表现力。
科大讯飞还采用了中间表征压缩技术,提升了数字人在多场景下的实时交互能力。这一技术有效压缩了视频维度,减少了计算量,保障了数字人与用户的实时互动。
科大讯飞数字人技术已广泛应用于金融、政务、文旅、商业、展会等多个领域。讯飞智作作为智能内容创作基地,结合星火认知大模型,为用户提供一站式的虚拟人解决方案,降低了服务成本,提升了用户体验。
目前,首发超拟人虚拟人的内测通道已在讯飞智作小程序上开放。依托星火大模型的基座能力,用户可以实现任意一张照片的快速驱动生成,定制属于自己的超拟人数字人。