新書推薦:
《
冯友兰和青年谈心系列
》
售價:HK$
167.3
《
利他主义的生意:偏爱“非理性”的市场(英国《金融时报》推荐读物!)
》
售價:HK$
77.3
《
认知行为疗法:心理咨询的顶层设计
》
售價:HK$
99.7
《
FANUC工业机器人装调与维修
》
售價:HK$
99.7
《
吕著中国通史
》
售價:HK$
62.7
《
爱琴海的光芒 : 千年古希腊文明
》
售價:HK$
199.4
《
不被他人左右:基于阿德勒心理学的无压力工作法
》
售價:HK$
66.1
《
SDGSAT-1卫星热红外影像图集
》
售價:HK$
445.8
|
編輯推薦: |
一本书全面精通Sora,成为AI短视频掘金高手!
技术原理 模型框架 功能详解 指令编写 提示词库 商业变现
8章专题内容布局+73个官方视频示例分析+490多张图片全程图解
随书还赠送了8大资源:106分钟同步教学视频+111页PPT教学课件+112组AI提示词+119个效果文件 57集AI绘画教学视频 56集AI文案写作教学视频 15000多组AI绘画关键词等
|
內容簡介: |
如何快速了解Sora文生视频这一强大模型,制作AI短视频,抢占市场先机,赚取第一桶金?
本书包括8章专题内容布局 73个官方视频示例分析 490多张图片全程图解,随书还赠送了8大资源:106分钟同步教学视频 111页PPT教学课件 112组AI视频生成提示词 119个效果文件 57集AI绘画教学视频 56集AI文案写作教学视频 15000多组AI绘画关键词等。具体内容从下面两条线展开。
一条是技能线:从AI短视频的相关技术入手,介绍Sora的概念特点、基本能力、技术原理、模型架构、生成式AI功能、指令编写、提示词库、商业变现等内容,通过学习和实践,读者将能够充分发挥Sora的强大功能,创作出令人惊叹的短视频作品,实现自己的创作和商业目标。
一条是案例线:本书非常注重Sora的实际应用,并通过大量的视频案例分析,包括人像、风光、动物、植物、幻想、旅行等多种题材,同时涉及动画短片、电影预告片、无人机航拍视频、历史镜头视频、电商广告视频、游戏视频等多个领域,全方位展示了Sora在不同场景下的应用效果。
本书是一本不可多得的AI短视频生成技术指南,适合短视频创作者、影视制作人员、摄影师、市场营销人员、AI技术爱好者与开发者、教育工作者及研究人员等广大群体阅读。此外,本书还可以作为相关培训机构和职业院校的参考教材。
|
關於作者: |
明机
·AI训练师:对人工智能三要素算法、算力、算据(数据)拥有深厚的研究,熟悉AI算法和模型特性,擅长使用TensorFlow、PyTorch等框架技术进行模型训练与产品开发;
·AI工程师:对Sora生成连贯视频序列的循环神经网络,Sora处理复杂视觉内容的空间时间补丁,Sora加快视频生成速度的自回归变压器等技术,Sora成为世界模拟器等技术掌握颇深;
·AI先行者:AI提示词库创作者,首批应用ChatGPT、gemini、Stable Diffusion 、Midjourney、DALLoE、Firefly、Sora、Pika、Runway等AI工具的从业人员,擅长AI文案编写、AI绘画与AI视频生成训练。
|
目錄:
|
第1章 认识Sora:强大的人工智能视频生成模型 1
1.1 Sora是什么 2
1.1.1 Sora的基本介绍 2
【示例1】:走在东京街头的时尚女性 3
1.1.2 Sora的功能特点 4
【示例2】:穿过东京郊区的火车窗外的倒影 4
1.1.3 Sora的竞品对比 6
【示例3】:坐在天空中的一片云上看书的年轻人 7
1.1.4 Sora的核心优势 9
1.1.5 Sora的创意用途 10
【示例4】:培养皿里的竹林和奔跑的熊猫 11
1.2 面对Sora,我们该思考的5个问题 12
1.2.1 文生视频模型为什么会火 12
【示例5】:在日落时分惬意地漫步 16
1.2.2 Sora的发布意味着什么 17
【示例6】:手机镜头下的未来城市风貌 18
1.2.3 我们与Sora有何关系 19
【示例7】:“云人闪电”的科幻电影片段 20
1.2.4 我们该如何应对Sora 21
1.2.5 普通人该怎么入局 23
【示例8】:冬日长毛猛犸象的壮丽景色 24
第2章 能力解析:Sora如何高效地生成视频 26
2.1 Sora的技术创新点 27
2.1.1 支持多样化视频格式 27
【示例9】:在大海中游动的海龟 27
2.1.2 改进的画面构图和框架 29
【示例10】:兔子和松鼠的奇妙混合物 30
2.1.3 语言理解与视频生成 31
【示例11】:不同的人物在不同的城市散步 33
2.1.4 多模态输入处理 34
【示例12】:无人机环绕拍摄的海边建筑 35
2.1.5 可变的持续时间、分辨率、宽高比 36
【示例13】:白发男人的特写镜头 37
2.2 Sora强大的视频生成能力 37
2.2.1 3D一致性:以3D的视角呈现物体和人物的运动 37
【示例14】:推镜头展示熙熙攘攘的东京城市街道 38
【示例15】:摇镜头展示令人惊叹的山水风光 39
2.2.2 长期一致性:保持视频中的人物和场景的不变 40
【示例16】:一只达尔马提亚狗从窗户向外看 41
2.2.3 世界交互模拟:模拟人物与环境之间简单的互动 42
【示例17】:模拟画家的创作过程 42
【示例18】:模拟人物吃汉堡的场景 42
2.2.4 模拟数字世界:探索与创造的无界数字世界 43
【示例19】:模拟《我的世界》游戏场景 43
2.2.5 复杂元素生成能力:打造出逼真的虚拟场景 44
【示例20】:一大堆老式电视播放着不同的节目 44
【示例21】:逼真的动画特写场景 46
2.2.6 多镜头生成能力:呈现出丰富的视觉盛宴 46
【示例22】:用不同的镜头展示的机器人 47
2.3 Sora面临的一些局限性和挑战 48
2.3.1 模拟物理世界的局限性 48
【示例23】:破碎的玻璃杯 49
2.3.2 生成长视频的难度 50
【示例24】:在沙漠中发现的塑料椅子 50
【示例25】:篮球通过篮筐后爆炸 51
2.3.3 理解复杂提示词的准确性 52
【示例26】:庆祝生日的温馨家庭场景 53
2.3.4 训练模型的复杂性 54
【示例27】:35毫米电影风格的跑步动作场景 55
2.3.5 提升视频生成的时效性 56
【示例28】:偏僻路上小狼嬉戏的场景 57
第3章 技术原理:解析Sora的技术特性与优势 59
3.1 解析Sora的技术原理 60
3.1.1 Sora如何根据文本生成内容——Diffusion模型 60
3.1.2 Sora如何处理复杂视觉内容——时间空间补丁 62
3.1.3 Sora如何生成连贯的视频序列——循环神经网络 63
【示例29】:中国农历新年庆祝视频 64
3.1.4 Sora如何生成不同风格的视频——生成对抗网络 65
3.1.5 Sora如何加快视频的生成速度——自回归变换器 67
3.2 Sora在视频生成过程中的3个关键步骤 68
3.2.1 步骤1:视频压缩网络 68
【示例30】:一窝金毛寻回犬在雪地里玩耍 68
3.2.2 步骤2:时间空间潜在补丁提取 69
3.2.3 步骤3:视频生成的Transformer模型 70
【示例31】:淘金热期间加利福尼亚州的历史录像 70
3.3 Sora技术的未来展望 71
3.3.1 技术革新与性能升级:速度更快、稳定性更强、体验更流畅 71
3.3.2 跨领域融合与拓展应用:让生活更加多姿多彩、充满无限可能 72
第4章 模型架构:Sora的基础是世界通用模型 73
4.1 认识世界通用模型 74
4.1.1 什么是世界通用模型 74
4.1.2 世界通用模型的作用是什么 75
【示例32】:Santorini的航拍建筑美景 76
4.1.3 多模态模型促进AI更好地理解真实世界 77
【示例33】:一列蒸汽火车行驶在高架桥上 78
4.1.4 世界通用模型打破了虚拟与现实的边界 79
【示例34】:惬意漫步的南非妇女 79
4.1.5 世界通用模型的代表——Runway 80
4.2 Sora将视频生成模型作为世界模拟器 81
4.2.1 用大语言模型的方法理解视频 81
【示例35】:一群纸飞机在茂密的丛林中飞舞 82
【示例36】:愉快漫步的老人 83
【示例37】:白雪皑皑的东京城 84
4.2.2 实现对物理世界的“涌现” 85
【示例38】:可爱的达尔马提亚狗 85
4.2.3 模拟真实物理世界的运动 87
【示例39】:壮观的海岸风光 88
4.3 Sora模型训练的核心技术 90
4.3.1 自然语言理解 90
4.3.2 生成式人工智能模型 92
【示例40】:老年人的悠闲生活与美丽的自然风光 93
4.3.3 场景构建与精细化渲染 96
4.3.4 AI驱动的动画技术 98
【示例41】:眨眼的特写镜头 99
4.3.5 个性化定制与持续优化 100
【示例42】:不同风格的袋鼠漫步场景 101
第5章 功能详解:使用Sora快速生成视频 105
5.1 Sora的文生视频功能 106
5.1.1 Sora的注册方法 106
5.1.2 申请Sora的内测资格 110
5.1.3 使用文生视频功能 113
5.2 Sora的其他AI生成功能 114
5.2.1 图生视频:为DALL·E图像制作动画 114
【示例43】:活泼可爱的柴犬 115
【示例44】:一个多样化的怪物家族 116
【示例45】:由字母组成的云朵图片 117
【示例46】:冲浪者在历史大厅中驾驭巨浪 118
5.2.2 视频生视频:向前或向后扩展视频的时长 119
【示例47】:旧金山的高空城市缆车 119
【示例48】:永无止境的骑行场景 122
5.2.3 视频到视频编辑:转换视频的风格和环境 123
【示例49】:飞驰在丛林中的跑车 123
5.2.4 连接视频功能:创建神奇的无缝过渡效果 125
【示例50】:无人机视频与蝴蝶视频的连接 126
【示例51】:越野车视频与豹子视频的连接 128
5.2.5 图像生成功能:为用户带来卓越的体验 130
第6章 指令编写:优化提示词提升Sora的生成效果 133
6.1 编写Sora提示词的基础思路 134
6.1.1 明确具体的视频元素 134
【示例52】:一只在拍摄视频的柯基犬 134
6.1.2 详细描述场景细节 135
【示例53】:一朵花生长的定格动画 135
6.1.3 创造性地使用提示词 136
【示例54】:一群鱼在纽约的街道上游动 136
6.1.4 构思引人入胜的角色和情节 137
【示例55】:一只猫叫醒正在睡觉的主人 137
6.1.5 用逐步引导的方式构建提示词 139
【示例56】:挤满了工人的建筑工地 139
6.2 Sora提示词的编写技巧 140
6.2.1 如何选择Sora的提示词 140
【示例57】:基纳巴丹干河上的野生动物 141
6.2.2 Sora提示词的编写顺序 142
【示例58】:美术馆内的艺术盛宴 143
6.2.3 编写Sora提示词的注意事项 143
【示例59】:跳迪斯科舞的卡通袋鼠 144
第7章 提示词库:打造专业级视频效果的要素 145
7.1 Sora内容型提示词 146
7.1.1 主体特征 146
【示例60】:在南极洲愉快漫步的女人 147
【示例61】:不同主体特征的视频效果 148
7.1.2 场景特征 150
【示例62】:色彩斑斓的鱼类和海洋生物 151
7.1.3 艺术风格 152
【示例63】:太空冒险故事的电影预告片 153
7.2 Sora标准化提示词 155
7.2.1 画面构图 155
【示例64】:变色龙的特写镜头 156
7.2.2 视线角度 157
【示例65】:维多利亚冠鸽的侧面视角 158
7.2.3 画面景别 159
【示例66】:玻璃球体里的小矮人 160
7.2.4 色彩色调 161
【示例67】:在茂密的花园里奔跑的虎斑猫 162
7.2.5 环境光线 163
【示例68】:月光下的狼嚎剪影动画 164
【示例69】:在霓虹灯城市中嬉戏的小狗 165
7.2.6 镜头参数 165
【示例70】:深海中的大章鱼和帝王蟹之战 166
第8章 商业变现:从文本到视频的创收之路 168
8.1 Sora未来可能的商业场景应用 169
8.1.1 电商产品展示 169
8.1.2 视频广告制作 170
8.1.3 游戏开发和动画片制作 170
【示例71】:展示游戏《我的世界》 171
【示例72】:水獭的热带冲浪冒险 172
8.1.4 电影电视节目制作 173
【示例73】:海盗船激战瞬间 173
8.1.5 教育内容制作 174
8.2 如何利用Sora实现多渠道变现 174
8.2.1 广告收入与赞助变现 175
8.2.2 知识付费变现 175
8.2.3 提示词交易变现 176
8.2.4 内容创作变现 177
8.2.5 Sora的其他变现方式 178
|
內容試閱:
|
◎ 市场优势
随着科技的飞速发展,人工智能已逐渐渗透到人们生活的方方面面,而AI短视频生成技术作为其中的一颗“新星”,更是受到了广泛关注。根据Mob研究院发布的报告显示,2023年中国短视频市场规模近3000亿,用户规模占整体网民的94.8%。这些数据表明,短视频市场正在迅速增长,用户规模庞大,且持续增长。
据市场研究公司Statista的报告,到2025年,全球AI视频技术的市场规模预计将达到120亿美元。根据艾媒咨询公司的报告显示,2023年中国AIGC产业规模约为143亿元,预计到2030年,产业规模有望达到11441亿元,这显示出AIGC产业在未来几年内具有巨大的增长潜力。
在这样的大背景下,我们策划编写了本书,为广大短视频创作者、影视制作人员、市场营销人员、AI技术爱好者与开发者、教育工作者,以及研究人员提供了一本关于Sora AI短视频生成技术的全面指南。
◎ 工具介绍
Sora作为一款引领短视频创作新时代的人工智能工具,它集成了先进的算法和模型架构,为创作者提供了前所未有的创作自由度和便捷性。Sora的独特之处在于其强大的生成式AI功能,使得创作者只需通过简单的指令和提示词库,就能让Sora为他们创作出独具匠心的短视频内容。
本书通过深入解读Sora的技术原理、功能特点、提示词优化及商业应用,帮助读者更好地掌握和利用AI技术生成高质量的短视频。通过学习本书内容,读者将能够全面掌握Sora AI短视频生成技术的核心原理、功能特点及实战应用,为自身在短视频创作、影视制作、市场营销等领域的发展提供有力支持。
◎ 本书特色
本书是一本全面、深入、实用的技术指南,从Sora的基本概念、技术原理到实际应用案例,进行了系统而全面的介绍,无论是初学者还是专业人士,都能从中找到所需的知识和信息。本书特色如下。
(1)73个官方示例,实战应用导向:为了让读者更好地将理论知识转化为实际操作,本书精选了73个官方展示的AI视频示例。这些示例涵盖了不同的题材和用途,旨在帮助读者快速掌握高效、高质量的短视频制作技巧。通过学习和模仿这些示例,读者将能够轻松提升自己的AI短视频制作水平,实现创意与技术的完美结合!
(2)80多个小节讲解,解析前沿技术:本书精心策划了8大章共80多个小节,全方位、多角度地深入解析了Sora这一前沿的AI短视频生成模型。通过对本书的专业解读,读者将能够掌握其核心技术原理与优势,不仅站在技术的前沿,更能轻松应对各种挑战,成为AI短视频领域的佼佼者。
(3)7大超值资源赠送,全面且丰富:为了给读者带来前所未有的学习体验,精心准备了7大超值资源赠送给读者,这些资源包括:教学视频 PPT教学课件 AI视频生成提示词 效果文件 AI绘画教学视频 AI文案写作教学视频 AI绘画关键词等,让您全方位了解AI短视频的魅力。
◎ 温馨提示
(1)版本更新:在编写本书时,是基于当前各种AI工具和网页平台的界面截取的实际操作图片,但本书从编辑到出版需要一段时间,这些工具的功能和界面可能会有变动,请在阅读时,根据书中的思路,举一反三,进行学习。
(2)提示词:也称为提示、文本描述(或描述)、文本指令(或指令)、关键词等。需要注意的是,即使是相同的提示词,Sora等AI模型每次生成的视频、图像效果也会有差别,这是模型基于算法与算力得出的新结果,是正常的,所以大家会看到书里的截图与视频有所区别。用同样的提示词,自己再制作时,出来的效果也会有差异。
(3)效果问题:本书所展示的示例效果,均来源于Sora官方发布的演示视频。鉴于Sora模型目前尚处于初期研发阶段,它不可避免地存在一些问题。例如,生成的人物面部表情可能显得不够自然,肢体动作也可能略显僵硬。此外,还可能出现多手多脚,以及其他不符合现实世界物理规律的现象。然而,我们深信这些问题都将在后续的版本中逐步得到改进和优化,为我们带来更加出色的短视频创作体验。
(4)使用问题:本书内容写于2024年2月底,此时Sora正处于内测阶段,因此,本书关于Sora具体生成视频的实战教程部分内容较少,建议大家关注书封底的QQ群,等Sora正式开源后,作者会赠送具体的制作教程,到时请读者朋友留意查收。
◎ 资源获取
如果读者需要获取书中案例的素材、视频和课件,请使用微信“扫一扫”功能按需扫描下列对应的二维码。
◎ 作者售后
本书由明机编著,参与编写的人员还有苏高等人,在此表示感谢。由于编者知识水平有限,书中难免有疏漏之处,恳请广大读者批评、指正,沟通和交流请联系微信:2633228153,添加时请输入关键词:明机。
|
|