嘿,朋友们!你还记得第一代AI数字人吗?那时候要拍大量的视频素材,给数字人“学习”我们的动作、表情,才能让它张嘴说话。换句话说,那个时候的数字人就像是“戴了个假面”,一张嘴就是加了个“替身”!
忘掉它吧!
数字人2.0时代 已经到来,这次可不是简单地 P 个嘴巴那么 low~ 现在的全能AI数字人简直是开了挂:人物、场景、表情、动作统统由 AI 凭空变出来!你的数字分身终于’获得自由’啦!怎么样,是不是已经迫不及待想试试看了?
数字分身炼成术:小白必看!
先别急着动手,让我告诉你这整个套路是啥样的:
-
抓脸:拍点自己的高清小视频(别担心,不用化妆,素颜也行 )
-
炼脸:把视频丢给AI训练成你的’数字脸模型’ -
造场景:想在哪耍就在哪耍,沙滩、雪山、太空站随你挑! -
生成视频:AI根据你的脸和想要的场景做出一段短视频 -
剪裁:把生成的素材修修剪剪 -
练形象:让AI更懂你的样子和特点 -
克隆声音:让AI学会用你的声音说话 -
合成大片:最终生成会说话的、动起来的数字人视频
听起来复杂?别担心,我手把手教你,保证你比做泡面还简单!
一、速成你的’数字脸’:AI不认识你可不行!
想要制作全能数字人视频,第一步就是通过AI工具捏造一个“数字人”。不怕,你并不是一个人在战斗!咱们今天用的是“可灵AI”这个工具,它可是个“大力士”,我们用到的是它的“人脸模型”功能。
怎么用呢?给你一段视频,马上就能明白。
那到底什么是“可灵AI”人脸模型呢?
很简单!你只需要上传几段多角度的视频(好吧,是视频,不是照片),它就能给你训练出一个独一无二的人脸模型!训练完成后,你就能用这个人脸模型随意生成5秒、10秒的视频,轻松制作多个短视频。简直是给创作者开了一扇大门——再也不用担心无聊的背景了!
第1步:AI模型定制
通过Web端首页侧边栏 > AI创作 > AI定制模型,进入功能页面。
【AI定制模型】
可以训练自己专属人脸,此功能只有铂金会员和钻石会员才能使用。
第2步:接受功能须知
认真阅读并同意相关条款,点击’同意并使用’按钮。是的,就是这么简单!
第3步:上传一个正面的视频
★
你需要上传一段正面的视频(10-15秒,1080p,横竖屏均可)。千万记住,视频分辨率得高!否则,数字人可能会有点“模糊”。调整完模型名字点保存,然后点击下一步。
常见错误:视频分辨率太低,短边需要 ≥1080像素
比如这里问题,分辨率不对,就去剪映里面重新导出一遍标准的视频分辨率格式。
解决办法:使用电脑版剪映重新导出一遍视频
①比例选择 9:16
②时长控制在 10-15秒之间
③导出时选择 1080P
★
关键技术要求
竖屏视频:1080 * 1920 分辨率
横屏视频:1920 * 1080 分辨率
若分辨率不达标,可用剪映以正确参数重新导出
如果不会操作,右边有小姐姐手把手教你应该上传什么样的视频。
第4步:补充多维度视频素材
★
拍更多不同角度的视频(10-15秒),至少得有10段。每个视频都有它的作用,别偷懒啊!这些可是你数字人生命的“营养源(丰富训练样本库)”。
完成上传后,系统将开始模型训练,消耗999可灵值(且用且珍惜)。
同样的,小姐姐也会做演示应该上传什么样的视频。
一旦这些步骤完成后,恭喜!你就能开始训练你的数字人脸模型啦!通常,等待个一个小时,你的数字人就会正式上线!
训练完成之后就会给我们一个 5 秒的模型效果视频,这逼真程度,已经非常 Nice 了。
二、AI人物视频制作:赋予数字人生命
一旦训练好模型,接下来就是生成视频的环节了。你只需提供一个简单的提示词,选择人物模型,AI便会自动生成符合你要求的AI视频。
第1步:文生视频
进入【文生视频】功能,输入提示词,选择训练好的人物模型(参考人脸)。接着,AI会自动将其融入提示词中,生成出符合你要求的视频。
可设置自己需要的参数之后再生成。
参数设置推荐:
-
生成模式:高品质 -
生成时长:10秒(消耗70可灵值,比5秒更具应用价值) -
视频比例:9:16,适合短视频内容 -
生成数量:可同时生成1-4条(可灵值会叠加)
第2步:构建精准提示词
一个精准的提示词至关重要,它直接决定了你视频的最终效果。提示词需涵盖五大核心维度:
-
主体特征:年龄、性别、着装、表情特点等 -
场景设置:背景环境、周围物品、空间氛围 -
动作与姿态:肢体语言、面部微表情、互动方式 -
灯光与氛围:光影效果、色调氛围、视觉重点 -
技术规格:分辨率要求、风格定位、细节要求
这里,我们以一位约35岁的男性科技博主为例:
主体特征:一位约35岁的男性科技博主,短发,穿着红色宽松舒适的短袖T恤,表情自信且亲切,眼神专注又友好,充满对科技的热情。
场景设置:直播间背景是现代科技风格,中景构图清晰展示博主从腰部以上至头顶的画面,同时呈现周围环境。墙上有各种电子设备、科技书籍,前方是一张简约的站立式工作台,桌上摆着笔记本电脑、智能音箱和几款小型AI机器人模型。背景灯光冷色调的蓝色和紫色,几何造型的LED灯饰进一步增强了科技氛围,红色宽松短袖在冷色调环境中形成鲜明对比。场景中没有任何椅子,体现博主站立直播的风格。
动作与姿态:博主站在工作台旁,面向镜头保持专业站姿,神情严肃但不过分紧绷。双手自然下垂,在讲解AI技术时配合精准的手势强调重点,动作幅度克制有力。眼神专注直视镜头,眉宇间略微收紧传递思考状态,身体保持直立微向前倾,肩部放松避免僵硬感。通过沉稳的语速和停顿节奏,搭配简洁明确的手部动作,营造出严谨的技术探讨氛围,同时维持适度的观众交流感。
灯光与氛围:冷色调的灯光效果突显科技氛围,聚光灯照亮博主的面部和手势,电脑和设备上的光芒映在他的脸上,营造出互动科技的未来感。灯光巧妙打在红色宽松短袖上,使其在画面中形成视觉焦点。
技术规格:超高清8K分辨率,写实风格,中景构图平衡展示博主与环境的关系,聚焦博主的表情和手势,呈现一种兼具科技感和互动感的画面。通过景深控制使博主成为视觉中心,同时保持周围环境的清晰可辨。
点击立即生成,大约等20分钟,AI视频就生成好了。
提示词应该如何写呢?可借助 DeepSeek 等AI工具生成结构化提示词,提升视频生成质量。
主体特征: 一位约30岁的男性科技博主,短发,穿着科技风卫衣,表情自信且亲切,眼神专注又友好,充满对科技的热情。 场景设置: 直播间背景是现代科技风格,墙上有各种电子设备、科技书籍,桌上摆着笔记本电脑、智能音箱和几款小型AI机器人模型。背景灯光冷色调的蓝色和紫色,几何造型的LED灯饰进一步增强了科技氛围。 动作与姿态: 博主站在桌旁,面向镜头微笑,双手自然摆动,边说话边用手势表达,姿态轻松亲切,带有很强的亲和力,仿佛在向观众介绍有趣的AI技术。 灯光与氛围: 冷色调的灯光效果突显科技氛围,聚光灯照亮博主的面部和手势,电脑和设备上的光芒映在他的脸上,营造出互动科技的未来感。 技术规格: 超高清8K分辨率,写实风格,聚焦博主的表情和手势,呈现一种兼具科技感和互动感的画面。
— 帮我根据上面的提示词框架,写一个新的场景:一个人骑着老虎在大街上闲逛
第3步:视频下载与质量检查
对已经生成好的数字人视频下载(可下载有水印或无水印),这里下载的是无水印。如遇手部变形或动作呆板问题,可尝试更换提示词或重新训练人脸模型。
下面是两个数字人视频效果视频。
视频案例(9:16比例)

常见问题
★
问题:可灵文生视频,手变形了,动作呆板
回答: 有两个层面,
换提示词,可能这个提示词出的就是有问题,觉得不行就换 所有提示词都有问题,那就证明你训练人脸模型的时候,真人录制的素材就不好,可以重新录重新训练
三、场景二创:数字人的无限可能
场景复刻技术:
借助Kimi等AI工具,我们可以实现对任意场景的 70% 相似度复刻,让你的数字人置身任何想要的环境中。 操作步骤:
-
截取目标场景图片 -
将图片上传至Kimi并使用特定提示词模板 -
根据需求调整生成的提示词 -
将提示词导入可灵文生视频,选择已训练的人脸模型
由于文章篇幅限制,点击上方卡片关注“林月半子”公众号,发送“全能数字人场景二创模版”,即可获取场景二创完整提示词。
目标样本
四、数字人训练:让静态形象开口说话
大家有没有发现,可灵直接出来的视频形象场景已经很Nice了,但人物是没有开口讲话的,下一步我们就可以通过数字人软件,让“活”起来,开始讲话。
用到的数字人软件是 必火AI 数字人
★
必火AI 数字人
通过我的邀请链接购买有优惠:https://www./login/SKolpV,可以添加林月半子微信,cloud-native-101,备注:必火AI,领取折扣码,折上加折。
训练流程详解
第1步:形象克隆
将可灵生成的数字人视频上传至数字人平台,进行形象分析与克隆。
上传的视频要求
第2步:声音克隆
点击声音克隆,选择克隆声音模式(基础版免费,高保真付费):
基础版声音克隆流程:
音频要求;文件格式:mp3、m4a、wav,音频时长:5秒~3分钟 基础版声音克隆限时免费的,消耗的积分也少,但声音的质量相对高保真效果会差一点。
高保真声音克隆流程:
音频格式;支持mp3、m4a、wav文件格式,音频文件大小不超过20M。 高保真消耗积分很大,但音质比基础版好。因此再克隆高保真声音时,确保原音频无损坏。
第3步:数字人口播视频制作
生成数字人口播有两种驱动方式:
①文本驱动(可输入台词,数字人根据提供的台词进行匹配口型)
②音频驱动(上传已准备好的音频,数字人会通过音频内容进行匹配口型)。
选择刚刚克隆好的形象,点击【去创作】
文本驱动
输入台词,选择已训练克隆好的声音,可鼠标滑动选取文本内容, 进行逐句试听, 最多选取300字,点击插入停顿在光标处调整文字之间的停顿时长。
★
AI is truly amazing! What you are watching right now is my very first video created using my AI digital human.
你现在看到的视频完全是由我的AI数字人生成,以后有了它,我再也不用反复拍视频了,输入文案就能生成新的视频!你觉得我这个数字人视频如何?欢迎留言告诉我哦!
音频驱动
如果觉得AI声音不够生动,可以直接录音,然后上传 mp3 音频文件,这样出来的视频声音会完全还原自己的声音。
第4步:视频生成与下载
点击提交,等待几分钟之后,数字人视频就制作好了。 然后我们下载之后来看看效果。
五、成品优化:剪辑升华数字人视频
剪辑工具:剪映
第1步:这里用剪映剪辑
打开剪映点击首页,在点开始创作,进入剪辑界面。
第2步:视频剪辑
导入数字人视频之后进行剪辑,添加字幕,标题,背景音乐等。
第3步:对剪辑好的数字人进行保存
OK,以上就是完整的制作一个全能数字人视频的整体过程。
结语
搞定了!是不是比想象中简单多了?有了这套流程,你随时随地都能让你的数字分身出场,再也不用担心’露脸焦虑’啦!你想过吗?以后可能大家看的视频都是AI合成的,都分不清哪个是真人哪个是数字人了…有点可怕又有点酷,对吧?
数字人技术的突飞猛进已让创作者拥有了前所未有的可能性。从人脸采样到声音克隆,从场景构建到最终剪辑,每一步都在不断拓展着我们对’自我’的数字化延伸。当你熟练掌握这套全能数字人工作流,你的数字分身将在各种平台上自由表达,为你开启内容创作的全新维度。
对了,你做出的第一个数字人视频是什么场景?评论区告诉我吧!我超好奇的~如果遇到问题也欢迎提问,咱们一起研究!
★
#artContent h1{font-size:16px;font-weight: 400;}#artContent p img{float:none !important;}#artContent table{width:100% !important;}