什么是 SG Com?
SG Com SDK 可以用于访问 Speech Graphics 的实时音频驱动的脸部动画技术,使开发人员能够创建由语音驱动的虚拟角色应用。
SG Com 可将音频流转换为高保真的脸部动画,并可将其流式传输到其他端点。输入和输出之间的处理延迟为 50 毫秒。
SDK 包括:
SG Com API,一个 C API
SG Com Unreal Engine 插件,可轻松集成到 Unreal Engine 中
还可根据要求提供 C# 绑定和 Unity 集成示例。
SG Com 功能
按照具体语言,实现任何角色的精确嘴型同步
自动检测情绪(积极、消极、中性)
自动检测非嘴部发声,例如笑声和咕哝声
自动检测可听见的呼吸声
根据检测到的情绪或发声,生成全脸表情
按照当前的语音内容,匹配相应的头部动作
胸部呼吸动作与语音和可听见的呼吸声精准同步
眨眼和眼球微动
实时表现情绪,且支持中断情绪
角色在不发声时表现闲置动作
支持发言和倾听(对语音作出反应)两种身份
支持各种实时情绪控制器,可调整情绪模式、脸部表情以及动作的强度、速度及动作变化频率等特征
当情绪模式、表情、语音活动和呼吸发生变化时会发出通知