最近做的工作和字幕生成有关,顺手整理了一些字幕相关的资料。本文简单介绍了字幕的基本知识和一些常见的字幕格式,一来备忘,二来共同学习。
1 什么是字幕
1.1 定义
字幕是指以文字形式显示电视、电影、舞台作品中的对话等非影像内容,也泛指影视作品后期加工的文字。 在电影银幕或电视机荧光屏下方出现的解说文字以及种种文字,如影片的片名、演职员表、唱词、对白、说明词以有人物介绍、地名和年代等都称为字幕。它是为了让原本无法了解音轨内容的观众看懂影片内容,包括为听障人士以及不懂影片源语的人士提供便利。
这些字幕按照影片放映时出现的先后顺序而分为片头字幕、片间字幕和片尾字幕。一般情况下,片头、片尾字幕叠印在画面上,而对白、歌词等字幕一般出现在屏幕下方,戏剧等舞台伤口则显示于舞台两侧或上方。
字幕的作用主要是将语音内容以文字方式显示,以帮助听力较弱的观众理解节目内容。 另外,对于不同语言的观众,只有通过字幕才能了解影片内容。而在中国,不同地区语言的发音差别很大,不能正确理解普通话的人很多。但是文字写法的差异并不大,看到普通话的文字后人们大都都能理解。所以,近年来华语圈的影视作品中,对应普通话(或方言)的字幕大多被附加在节目中。
1.2 字幕的历史
早在电视电影诞生之初,字幕就已随之出现。最早的字幕形式可以追溯至无声时代的字幕卡(intertitles)。字幕卡的最早应用是在 1903 年 Edwin S. Porter 导演的电影《汤姆叔叔的小屋》中,字幕伴随人类科技的发展,其历史已逾百年。
世界上第一部加字幕的有声电影是美国影片《爵士乐歌星》(The Jazz Singer),这部电影 1927 年 10 月 6 日在美国上映,1929 年 11 月 26 日在法国巴黎上映时首次引入了字幕这个概念,可以算得上字幕历史上的标志性事件。后来随着艺术形式的发展,又出现了唱词字幕(surtitles),在美国被称为 supertitles,它出现在舞台歌剧中,1983 年加拿大歌剧 Elektra 中出现的唱词字幕。
2 字幕的种类
字幕的类型可以根据不同的标准进行分类:
- 根据应用方式
- 硬字幕:直接嵌入在视频画面中,与画面融为一体,兼容度最高,但不可编辑或修改。
- 软字幕:通过工具将外挂字幕与视频画面压制打包到一起,表面上是一个视频文件,但也可以分离出来编辑或修改。
- 外挂字幕:单独将字幕制作成一个文件,在播放时同时播放,可以随时编辑修改。
- 根据文件格式
- 图形格式字幕:由 idx 和 sub 文件组成,有时也能看到 ifo 文件,但这个现在已经不怎么用了。
- 根据表达内容
- 对话字幕:包括人物的对话、独白、旁白,以及歌词字幕,大多数位于荧幕的中下方位置。
- 信息字幕:与视频内容息息相关,但大多数时候与人声不关联,比如注解、说明性、过渡性字幕,片名、人名条、主创团队、主创成员、合作伙伴、片尾演职人员名等。
- 特效字幕:用于活跃气氛、突出品牌形象以及市场宣传,常见的包括台标、水印、角标、水印广告或花字配字等。
- 根据控制形式
3 字幕格式
字幕可分为片名标识等说明性字幕,及对白等帮助理解内容的语言字幕。对于视频制作时出现的片名、说明性字幕,一般在影视后期制作时叠加到了视频画面中,没有什么格式可言。这是所说的格式,是指现在网络上流传的影视对白字幕。
目前比较流行的字幕格式,分为图形格式和文本格式两类。
3.1 图形格式字幕
由 idx 和 sub 文件组成,有时也能看到 ifo 文件,不过这个现在已经不怎么用的上了。idx 相当于索引文件,里面包括了字幕出现的时间码和字幕显示属性等,sub 文件就是存放字幕本身了,注意是图片格式的,所以比较大,动辄 10M 以上了。idx+sub 可以存放很多语言的字幕,提供了在播放的时候的选择。
3.2 文本格式字幕
比较流行的文本字幕有 srt、ssa、smi、ass 格式,因为是文本格式,所以就比较小了,一般大不过百来 K。
SRT 格式,SRT 三大核心构成部分:
- ① 轴编号
- ② 开始和结束时间码
- ③ 字幕文本
1 | 45 |
这表示:第 45 个字幕,显示时间从该影片开始的第 2 分 52.184 秒到第 2 分 53.617 秒,内容为:慢慢来。
格式规范请参阅下图,不符合本规范的字幕文件,可能无法被字幕软件或视频播放器识别。
SSA、ASS 格式
SSA(Sub Station Alpha)是为了解决 SRT 过于简单的字幕功能而开发的高级字幕格式其扩展名为.SSA。采用 SSA V4 脚本语言,能实现丰富的字幕功能,除了能设定不同字幕数据的大小和位置外,更能实现动态文字和水印等复杂的功能。ASS(Advanced SubStation Alpha)其实是更高级的 SSA 版本,采用 SSA V4+脚本语言编写。
ASS 格式
ASS 相对 SRT 来讲,最大的特点是可以定义样式风格(字幕字体、颜色、位置、大小、特效等),因此相对来讲,它新增了:
- ① 脚本信息(script info)文件
- ② V4+Styles 风格文件
- ③ Events(它包括了 SRT 中的时间轴和字幕文字)
SMI 格式
SMI(Sami),其扩展名为.smi,是 Windows Media Player 专用字幕文件格式,如果在播放的文件目录中有格式正确且与歌曲同名的 SMI 文件,那么 WMP 都会识别。SMI 和 SRT 一样都是文本字幕格式,可以用记事本或者 E-Lyric 打开进行编辑。
vtt 格式
VTT 文件是一个文本文件,其中包含使用 Web 视频文本轨道 (WebVTT) 格式显示定时文本轨道(例如字幕或字幕)的信息。定时文本轨道包括诸如字幕或字幕之类的信息。 VTT 文件的目的是将文本覆盖添加到.格式有点类似于 SRT 文件。基于 WebVTT 的文本文件使用 UTF-8 编码。 VTT 文件包含诸如字幕、描述、标题、描述、章节和元数据等信息。作为纯文本文件,可以使用 Microsoft Notepad、Apple TextEdit 和 Notepad++ 等文本编辑器打开 VTT 文件。
1 | WEBVTT |