元数据
SGX 为用户提供了编辑或导出元数据的功能。为此,了解 events 中的元数据序列非常有用。下面将介绍这些内容。
每个序列都提供了以下信息:
主要元数据
本部分介绍了编辑时主要关注的元数据序列:
单词对齐
音素对齐
嘴型同步
情绪模式
表情
呼吸
修改器
单词对齐
单词对齐是一种分类时间序列,由音频中单词的时序分析组成。该序列仅在使用文本处理的 events 中创建。空标签 [^] 表示无声音或无语音。
编辑:当脸部动画中的单词发音与音频不同步时,单词对齐边界可能会发生偏移。
依赖项:文本
音素对齐
音素对齐是一种分类时间序列,与单词对齐类似,但包括了组成单词的音素(辅音和元音)的子区间。与单词对齐一样,音素对齐序列仅在使用文本处理的 events 中出现。空标签 [^] 表示无声音或无语音。
编辑:当个别音素的发音与音频不同步时,音素对齐边界可能会发生偏移。由于边界很多,编辑音素对齐比编辑单词对齐更费力。而在大多数情况下,编辑单词对齐就足够了,因为单词对齐会自动重新对齐音素。因此,只有当您真的想深入编辑基于语音的时序时,才应该编辑音素对齐方式。
依赖项:单词对齐
嘴型同步
嘴型同步是一种分类时间序列,表示在动画中的任何一个点使用了哪种嘴型同步系统,是基于语音还是基于原声。该序列仅在使用文本处理的 events 中创建。
编辑:如果用户认为在某一特定区间内选择另一种嘴型同步系统效果更好,则可以使用此选项编辑嘴型同步系统的选择。
依赖项:音素对齐
情绪模式
情绪模式序列是一种分类时间序列,表示在任何时间点角色的哪种情绪模式处于活动状态。空标签 [^] 表示未分类时间区间。
编辑:此序列可用于编辑情绪模式的选择和位置,从而产生不同的非嘴部情绪。
依赖项:文本、短语
表情
表情序列是一种分类时间序列,表示在任何时间点角色的哪种表情处于活动状态。空标签 [^] 表示无表情(在动画中,这段时间区间通常会与前后表情发生时间存在重叠)。
角色表情分级菜单中的各个路径,统称为“表情标签”。例如,上述序列中的“Fearful/low/3”是指情绪模式“害怕”的低音调子集中的表情“3”,如下面 SGX Studio 所示。
编辑:可用于编辑表情的选择和位置,从而产生不同的非嘴部情绪。
呼吸
呼吸序列是一种分类时间序列,表示呼吸循环中吸气和呼气的时间。
编辑:移动呼吸片段之间的边界可调整吸气和呼气的时间。
依赖项:无
修改器
修改器序列是一种不规则时间序列,用于绘制情绪修改器随时间的变化。
编辑:用于编辑修改器。
依赖项:文本
韵律元数据
本部分介绍了韵律元数据,即对语音语调、重音和强度的分析。这些序列要么不可编辑,要么不太需要编辑,但可能用于其他用途,尤其是在导出时。韵律元数据包括以下四个序列:
强度
音调
韵律
短语
强度
强度序列是一种常规时间序列,提供了声学强度随时间变化的分析。此序列不可编辑。
音调
音调序列是一种常规时间序列,提供了对音调随时间变化的分析。如果未检测到语音,分析默认为 0.0。此序列不可编辑。
韵律
韵律序列是一种不规则时间序列,用于绘制所分析的重音模式和语速随时间的变化。该分析用于确定语音和非嘴部情绪中肌肉运动的幅度和速度。
韵律序列有三个通道,每个通道的范围为 [0,2],“正常”值为 1.0 左右。
音节重音(蓝色):每个音节的重音程度(影响语音行为)
短语重音(黑色):每个短语的重音程度(影响非嘴部情绪)
短语速度(红色):每个短语的速度程度(影响语音和非嘴部情绪)
编辑:这个序列一般不需要编辑,因为通常更容易通过编辑修改器来改变语音或非嘴部情绪的程度和速度,而且同样有效。
前置项:文本
短语
短语序列是一种分类时间序列,它将时间轴划分为与口语短语大致对应的区间。每个短语根据语音语调被分为高音调 (H) 和低音调 (L)。短语构成了分配表情的区间,并且当情绪模式为双音调时,其音调将用于选择表情。
编辑:此序列一般不需要编辑,因为可以直接编辑由它派生出来的表情。
前置项:文本