产品指南
解决方案
SGX
SGX 是一款通过音频生成高质量脸部动画的制作套件。它能生成准确的嘴型同步以及非嘴部动作,其中包括了全脸情绪、头部动作、眨眼和眼球微动。它具有批量处理和交互式编辑功能。SGX 非常适合希望能创意可控地制作出高效、质量稳定的脸部动画的开发人员。
SGX 适用于任何语言,甚至是虚构语言。输入由音频文件组成。还可选择并输入 11 种不同语言(14 种方言)的音频文本,以生成更高质量的嘴型同步动画。输出的动画文件可导入游戏引擎或其他 3D 动画系统。
SG Com
SG Com 是一个 SDK,可以用于访问 Speech Graphics 的实时音频驱动的脸部动画技术,使开发人员能够创建由语音驱动的虚拟角色应用。
SG Com 的处理引擎可将输入的音频流转换为同步、高保真的脸部动画,并可将其流式传输到其他端点。输出动画包括嘴型同步、全脸表情、眨眼、眼球微动和头部运动,所有这些都由说话者的声音驱动。输入音频和输出动画之间的处理延迟仅为 50 毫秒,因此适用于实时对话。
SG Com 还包括一个播放器,用于处理来自引擎的动画的缓冲、解码和同步播放。
核心库是一个 C API。目前已在 Windows、Linux、MacOS、Android、iOS、PlayStation 5、Xbox Series X 和 Nintendo Switch 上构建和测试。此外,还提供了 Unreal Engine 插件和 Unity 集成示例。
Rapport
Rapport 是一个端到端的人工智能云平台,可轻松部署交互式角色。它具有模块化和可配置的特点,使开发人员能够将最先进的语音和聊天机器人技术与 SG Com 创造的富有表现力和亲和力的数字角色相结合。它可以在网络、离线或任何平台或设备上实时使用。更多信息,请参阅 rapport.cloud。
SGX 与 SG Com
以下是 SGX 和 SG Com 的主要区别特征及共同功能(SG 核心)。
SGX | SG Com |
工具套件 | 运行时解决方案 |
适用于最高质量的制作 | 适用于现场制作和通讯 |
批量处理/编辑 | 实时处理 |
文件处理 | 流式传输处理 |
文本支持(14 种语言模块) | 仅音频输入 |
SG 核心 | |
肌肉动态模拟 | |
嘴型同步和完整的非嘴部情绪 | |
人工智能驱动 | |
情绪控制器(“模式”和“修改器”) | |
自动检测语音模式(“自动模式”) | |
一次性角色设置 | |
任何骨骼控制类型 | |
无语言阻碍 |