第5章:Sora 2的新特性和提示词技巧
Sora 2在物理表现、音效同步和画面可控性上大幅进化。通过具体提示可生成更逼真视频,并结合专业术语提升影像质量与创作自由度。
1 物理一致性更高的模拟表现
Sora 2 的一个重要进化点是对符合物理法则的自然动作的再现性。与 Sora 1 相比,物体坠落时的重力、水面的波纹、布料的弯曲等表现都变得更加逼真。为了最大限度地发挥这一能力,在提示词中具体指示物理情境是有效的。
通过描述物体的材质和作用力,例如“玻璃杯掉到地上碎裂开来”或“旗帜被强风吹得剧烈飘扬”,AI 能进行更精确的模拟,生成具有说服力的影像。
2 音频/音效的同步生成
Sora 2 新增的一个划时代功能是与影像同步的音频和音效的自动生成。这使得在生成视频的同时,也能创建与视频内容相符的环境音或动作音。例如,输入“下雨的森林中”的提示词,生成的视频中就会包含雨声和鸟鸣声。利用这一功能,可以大幅减少在视频制作后期处理中添加音效的麻烦。
音频种类 | 提示词中的指示方法 | 活用示例 |
---|---|---|
环境音 | 像 (Sound of waves crashing on the shore) 这样,用括号来指示音频内容。 | 在海边场景中加入海浪声。 |
音效 | 像 A car door slams shut, (sound of a car door slamming). 这样,将音频与影像描述结合起来指示。 | 配合关门的动作,加入“砰”的音效。 |
背景音乐 (BGM) | 像 with dramatic orchestral music 这样,指定音乐的类型或氛围。 | 为壮丽的风景配上管弦乐的背景音乐。 |
3 可控性提升
Sora 2 中,对镜头运动、角度、剪辑等影像表现的**控制能力(Controllability)**得到了大幅提升。这使得制作者能够以更接近导演的身份,给出精确的导演指示。
例如,可以在提示词中指定具体的镜头动作,如“缓慢推近拍摄主体面部”或“无人机从高空追踪拍摄的镜头”。此外,甚至可以指示一系列镜头的组合序列,使一次生成一个带有简短故事情节的视频不再是梦想。
4 实景、动画、广告表现的实例
根据想要生成的视频类型,在提示词中加入专业术语,可以极大地提升影像质量。例如,如果目标是电影般的影像,指定镜头的类型和布光方式会很有效。如果想生成动画,则指定特定动画工作室的画风或角色设计的特点。仅仅了解这些词汇,就能大大拓宽您的表达范围。
项目 | 指定词汇示例 | 效果 |
---|---|---|
景别/角度 | Extreme close-up(特写) Wide shot(广角) Dutch angle(斜角) | 营造震撼力或临场感,或表达不安定的心理描写。 |
照明 | Rembrandt lighting(伦勃朗光) Backlight(背光) Golden hour(黄金时段) | 强调主体的立体感,或创造出梦幻而美丽的氛围。 |
镜头 | Telephoto lens(长焦镜头) Fisheye lens(鱼眼镜头) | 虚化背景突出主体,或产生独特且扭曲的视觉效果。 |
运动 | Slow motion(慢动作) Time-lapse(延时摄影) Whip pan(快速摇摄) | 强调动作,表现时间流逝,或进行快速的场景转换。 |
5 常见的错误指定与修正模式
刚开始使用 Sora 2 时,经常会生成与预期不符的视频。这大多是由于提示词中的指令模糊或相互矛盾所致。例如,“一辆又大又小的车”这种矛盾的指令会使 AI 感到困惑。
此外,仅使用“美丽的风景”这种抽象的词语,AI 会生成什么样的风景就全凭运气了。通过描述具体的地名或元素,才能获得更接近意图的结果。了解失败的模式并避免它们,是提高水平的捷径。