黎斌：AI技术重塑短视频市场的八大趋势 |德外独家|Amz520跨境卖家导航

黎斌：AI技术重塑短视频市场的八大趋势 |德外独家

德外5号 2024-01-24 1704

AIGC在过去的2023年中，其每一步发展都备受数字行业相关从业人员的关注，多模态交互是其发展的必然趋势，具体到短视频领域，它怎样看懂视频，又将如何赋能，在AI的加持下短视频产业将走向哪里？

在日前召开的第四届中国短视频大会“主流媒体短视频创新传播”分论坛上，中央广播电视总台创新发展研究中心新媒体研究部主任黎斌，带来了《AI技术重塑短视频市场的八大趋势》为题的主旨发言。

以下内容根据黎斌先生的发言实录整理：

图注：中央广播电视总台创新发展研究中心新媒体研究部主任黎斌

Hello 2024

「 “AI+视频”的技术逻辑概览」

1、AI如何解析视频（看懂视频）

AI视频分析引擎对原始视频进行结构化信息抽取，从中解析“对象”“属性”“行为”“事件”。

视频结构化是一种利用深度学习技术对视频进行逐帧分析，对视频内容进行对象识别、特征提取，以智能标签形式保存成结构化数据（能与每帧关联起来），建立视频大数据结构化平台,成为后期视频智能检索和视频数据挖掘的基础。

图片来源：知乎@阿里云视频云

从视频标签的流程图中可以看到，输入一个视频，分别进行两部分操作：

一部分是对视频做抽帧处理，抽帧得到的图像通过人像识别、场景识别、物体识别、地标识别、OCR等图像AI识别模型，提炼出视频标签。
另一部分是把视频中的音频提取出来，然后通过ASR（自动语音识别技术）得到文本结果，最后再经过NLP（自然语言处理），提取出文本标签。

2、AI“看懂”视频后的赋能空间

AI看懂视频并赋能的逻辑为：AI解析视频-特征识别—>元素抽取-重新组合

1>基本能力

在AI技术的支持下，短视频编辑软件可以自动识别出视频素材中的人物、场景、物体等要素，并根据需求进行智能分割、分类和标注，这使得编辑人员可以更加方便地搜索、整理、使用各种素材，极大减少了人力物力的浪费，提高了工作效率。

图片来源：作者自制

2>AI视频合成

AI 视频合成技术能够从多源视频中提取元素，例如人物、场景、特效等，通过智能算法，快速剪辑和合成视频，添加过渡效果、音乐和文字，节省了大量的时间和精力。

3>AI 视频自动化生成

“视频生成”是指通过对人工智能的训练，使其能够根据给定的文本、图像、视频等单模态或多模态数据，自动生成符合描述的、高保真的视频内容。AI 视频生成工具就如同你的视频制作室，让你能够利用自己的图片、文字或视频素材来打造独特的影片。

AI视频生成的基本方法:关键帧 + 补间技术三步骤。

先通过各种AI生成图片的方式生成静态关键帧图像，通过生成视频关键帧形成视频的“粗略”故事情节；然后通过AI补帧算法，平滑关键帧之间的连接细节，依次填充附近帧之间的内容；最后再通过协同补帧算法,弥补关键帧生成可能存在的各类缺陷，提升生成视频的整体质量和连贯性。

因AI视频解析技术带来了AI对视频元素具有的多种重构与合成能力，从而重塑了传统视听媒体采、编、审、发等生产全链条的工作模式，乃至直接生成视频的AI大模型的出现，将全面赋能视听内容产能。

Hello 2024

「 AI加持下短视频市场的八大趋势」

在2023这个被称为“AI 元年” 的特殊年度，继 GhatGPT 腾空出世之后，开启了全球的“百模大战”。2024已踏浪而来，视频创作不再局限于传统的方式了，基于AIGC的迅猛发展，今后短视频市场将呈现值得关注的八大趋势：

趋势一、视频井喷，注意力竞争更加激烈

1、大大减少实景拍摄，降本增效

短视频创作者通过AI技术可以更快速地完成剪辑、调色、特效等编辑工作，从而降低制作成本，提高创作效率。

除了更多抽象和虚幻的视频片段用AI制作各种教育课件、专题片、科幻电影外，还有许多以前需要实地拍摄、现场演示的视频也会用到AI取代，如手把手食谱视频，现在做视频时不用浪费食物了。

2、随着多模态技术的快速成长，还将迎来进一步的视频内容大爆炸

近年来，自动音频播放作为网络阅读的另一种选择开始兴起。合成视频工具很快也能做到这一点，通过AI技术可以将文本、图片、音频等多种媒体形式转化为视频，实现自动化的视频创作，蕴藏巨大的应用场景！

我们将会看到：

很多作者将自动为每一篇博文和文章创建视频版本，会成为一种时髦，企业、品牌文宣也纷纷将他们所有的内容转换成视频形式。
尤其是AI自动剪辑短视频工具的出现，仅存量长视频的短视频再传播，就会带来巨量降本增效价值！
搜索将升级。想象一下，你遇到一个新的主题，想要为其创建内容。这样，我们可能会看到完全基于搜索查询而创建的个性化定制视频。目前谷歌每天有 85 亿次搜索量，百度日均60亿次搜索，其中有多少会在未来变成视频？

趋势二：AI视频化的生产与应用更加大众化

随着智能硬件的不断发展，AI技术将成为智能手机、智能相机等设备的标配。这将进一步提升用户在短视频创作中使用AI技术的便捷性和实用性。多模态支持自然语言交互修改图像和视频，技术操作简化，降低使用门槛。做到提速增效，快速反馈。

趋势三：AI改变创作者的游戏规则：让视频剪辑升级为导演

AI辅助视频创作场景，合成素材创意：想象一下，你可以描述自己正在寻找的精确片段（甚至提供相机移动方式、角度、光圈），然后，AI 会直接在你的编辑程序中创建无数的选项，直到你找到完美的素材。
视频修改创意：想象一下，你是品牌方，一年前拍摄了一个很好看的视频，但后来更新了包装。现在用AI，你将能够快速和经济地以新换旧，而不需要重新拍摄，或聘请昂贵的视觉特效人员。有了AI视频生成工具之后，你将不仅可以擦除视频场景的一部分，还可以创造新的内容来替换它。
AI工具能够从手机镜头中建立即时的布景和背景：这类虚拟制作，不需要大量的工作人员、仓库布景或 LED 墙，从而节省了大量成本，但需要你提出设计。

以上单独的工具应用将改变创作游戏规则，但它们主要还是用于改进现有的内容，人们手动将合成片段剪辑成一个有叙事表达的作品。但这一阶段将是短暂的，因为人工智能将能够把这一过程自动化。

AI在不远的将来能支持实时视频生成。通过AIGC，只需简单的脚本或场景描述，系统就能自动生成精美的视频内容。这将通过将视频/音频模型与大型语言模型相结合来实现，形成所谓的多模态模型。这一技术基本上是把 ChatGPT 和视频结合起来了。

一旦你向它提出一个视频的想法，并提供一些标准，它将会：

图片来源：作者自制

以上创作场景下均产生新的编辑范式：AI 工具改进现有视频工作流，改变视频创作者的游戏规则，特别是传统的视频剪辑将上升为一个“艺术+技术”复合要求的富有策划力、创造力的导演!

趋势四：内容质量竞争中AI成为必杀技

未来，用户将更加追求高质量的短视频内容，而平台也将更加注重内容的制作和筛选。

AI 工具释放创造力：AI支持创造更广泛的内容，AI 大模型可以分析大量的短视频数据，提取其中的创意元素和流行趋势。这将为创作者提供更多的创意启发和创作方向。并进一步普及创建专业内容的能力。

AI 大模型推动短视频行业变革：新人更容易进入视频创作领域，创作速度更快，更经济；带来内容创作、个性化推荐、内容审核、广告投放等方面的变革，推动行业的发展和创新。因此短视频行业AI成为必杀技！

AIGC是降低还是提高了内容创作工作者的职业门槛？

从创作本身来讲，门槛是降低了，但从创作的目标来讲，AIGC其实是提升了创作职业的从业门槛。因为人人都可以写和画了，内容将变得极大丰富。但人的注意力总是有限的，所以，如何创作出有创意的内容变得更加重要了。

趋势五：短视频IP进化，AI 数字人将成为标配

1、短视频IP：网络帐号→人格体

AI 大模型可以用于创建虚拟主播和互动内容，与用户进行实时互动。这将为短视频行业带来新的互动体验和商业模式。

图片来源：作者自制

2、AI助推“虚拟网红”的蓬勃发展

AI虚拟网红可以逼真地模拟真人，解放真人时间，增强用户互动，将在各个领域释放它们的创造性和影响力，随着生成式AI视频工具将这一过程普及化，那么自媒体、产品品牌都会建立自己的虚拟形象。这将重塑整个网红领域。

图片来源：Virtual Humans

3、数字分身让越来越多的内容具有互动性

现在人人都可以为自己的数字分身创造内容，给他们的虚拟躯壳赋予内容的“灵魂”，甚至看起来可以以我们自己的个性与他人互动交流。

如何将“自己”移植到数字空间？即微调（fine-tuning）。利用了现有基础模型的强大功能，然后继续在更小、更具体的数据集上训练这个模型。

数据从何而来？它会抓取你的电子邮件和社交媒体帖子。对于 youtube 、抖音用户来说，这还可能包括他们多年来上传的数千小时的视频。

这种方法的文本版本已经存在，最近推出的一个网站 character.ai，利用微调技术创建了“名人聊天机器人”。通过这个工具，你可以和拜登总统或者爱因斯坦交谈。

提高内容粘性靠什么？今后越来越多的内容将是互动性的，靠沉浸式互动体验，靠与虚拟数字人的情感互动、个性化交往、知识互动和文化交流，正将社交方式重新定义。

下一步，大模型进一步落地，智能体工具（AI.Agent、GPTS）作为个人智能助理将进一步提速短视频产业升级:

从供给侧看，生产短视频正从人工操作—>AI辅助—>AI Agent代工，现在一个制作团队1000人，其生产力可能赶不上一个团队4人却拥有50个智能体的生产力；
从消费侧看，AI虚拟数字人更加逼真拟人化，这种内容社交提升了内容粘性，内容消费从静态观看升级为沉浸式互动，进一步向用户个性化、千人千面的AI助理进化。比如，你的母婴短视频IP可能成为众多母亲婴儿护理的7*24小时在线的指导专家。

趋势六：视频信息更多定制化和个性化

AI大模型加持下，短视频内容井喷必然促使个性化消费升级：AI 大模型可以更好地理解用户的兴趣和偏好，从而提供更加个性化的短视频推荐。这将提高用户的观看体验，增加用户粘性。

同时，AI技术能够创造出更加个性化的内容。通过使用AI 技术，创意设计师可以根据不同的受众特点和需求，为他们提供定制化的体验。用户也将能够根据自己的兴趣和喜好，定制自己的短视频内容，而平台也将根据用户的需求，推送更加个性化的短视频内容。

趋势七：AI视频生成竞争将进一步挑战传统媒体机构的创作优势

随着技术的进一步发展，AI 视频技术深刻改变媒体市场格局。有了AIGC的助力，视频制作已经不再局限于专业人士，每个人都能成为自己的导演，传统广电媒体依靠重装备、高技术门槛形成的创作优势逐渐消失，每一个人使用AI都可以展现出属于自己的独特风采，更多精彩短视频、微电影和游戏作品，将不再出于传统机构之手，传统媒体面临降本增效的市场压力骤增。争夺大众注意力的竞争更加白热化，目前能够带来可持续广告收入的品牌浏览量/参与度会全面下降。

图注：2021-2025年中国AI视频生成行业市场规模及增速。来源：共研产业咨询（共研网）。

中国AI视频生成行业竞争格局较为集中，由几家同时具备AIGC技术开发平台和视频平台的互联网巨头主导。我国市场领先的企业为百度、阿里、腾讯以及爱奇艺。从中国AI视频生成行业竞争趋势层面来看，互联网巨头凭借其强大的研发实力、产业链布局以及庞大的用户基础，铸就了一道难以逾越的市场优势壁垒。

趋势八：AI短视频领域面临巨大的造假侵权风险

当前，深度合成技术除了单一的图像、音频合成之外，它以真实的镜头为基础进行训练，你可以加入任何想要加入的脚本，这样可以将语音识别、人脸识别、唇形搜索等结合起来，进行人脸语音的合成，训练并克隆某人声音，把声音和图像结合起来，从而可以让这个人自然流利地说出自己从未说过的话。

现在谷歌的语音人工智能已经可以通过图灵测试。人工智能领域的专家们表示，不久之后就会很难知道一张照片、一段视频或一段音频是否是真实的。

如何防范AI风险？

1、从技术角度，要以魔法打败魔法，为了避免深层造假，Runway 表示它正在使用人工智能和人工审核的组合，防止用户产出包括色情或暴力内容或违反版权的视频。AI 大模型可以辅助内容审核，帮助平台快速识别和处理违规内容。这将提高平台的内容质量，保护用户的合法权益。

2、另一方面，是加强法律监管。我国对生成合成类内容等提出了系列监管要求。2023年1月10日起实施的《互联网信息服务深度合成管理规定》进一步提出，深度合成服务提供者深度合成服务时，应当使用显著方式对深度合成信息内容进行标识。

总之，AI是一场提升生产力的革命！相比而言，互联网是一场生产关系的革命、通过改善资源的配置方式而提升生产效率。它是通过去中介化来提高效率，远不及AIGC的效率革命。

你希望在短时间内画一百张画，通过互联网的众包的方式，你让一百人同时写，可以提升效率；但不如用Midjourney工具来画，从成本、效率乃至质量都有天壤之别！这是不同层次生产力的差异！如同工业革命时期火车相比于马车这种生产力的提升，我们可以说AIGC所带来的技术革命甚至能够超过互联网和移动互联网带来的变革。英伟达黄仁勋说：人工智能“不同于以往的任何技术”，因为智能是“所有其他技术的基础”——人类正是因为拥有智力才能发明出各种技术。他预言两年之内英伟达乃至整个行业也会“面目全非”。

短视频的列车已经驶入AI时代了，让我们觉知当下，整装待发吧！

注：关注“德外5号”发送“AI短视频趋势”即可下载黎斌先生《AI技术重塑短视频市场的八大趋势》PDF版发言稿。

转载引用声明：

请原文转载或不加修改地引用文中数据、结论及数据说明，并注明来源。除此之外的任何自行加工与解读均不代表CTR观点，对由此产生的不良影响，CTR保留诉诸法律的权利。