我用AI复制了自己，结果太惊人！数字分身制作全攻略大公开！

我是林月半子，与你「探索AI的无限可能」，一起拥抱未来！

嘿，朋友们！你还记得第一代AI数字人吗？那时候要拍大量的视频素材，给数字人“学习”我们的动作、表情，才能让它张嘴说话。换句话说，那个时候的数字人就像是“戴了个假面”，一张嘴就是加了个“替身”！

忘掉它吧！

数字人2.0时代 已经到来，这次可不是简单地 P 个嘴巴那么 low～现在的全能AI数字人简直是开了挂：人物、场景、表情、动作统统由 AI 凭空变出来！你的数字分身终于’获得自由’啦！怎么样，是不是已经迫不及待想试试看了？

数字分身炼成术：小白必看！

先别急着动手，让我告诉你这整个套路是啥样的：

抓脸：拍点自己的高清小视频（别担心，不用化妆，素颜也行😝）
炼脸：把视频丢给AI训练成你的’数字脸模型’
造场景：想在哪耍就在哪耍，沙滩、雪山、太空站随你挑！
生成视频：AI根据你的脸和想要的场景做出一段短视频
剪裁：把生成的素材修修剪剪
练形象：让AI更懂你的样子和特点
克隆声音：让AI学会用你的声音说话
合成大片：最终生成会说话的、动起来的数字人视频

听起来复杂？别担心，我手把手教你，保证你比做泡面还简单！

一、速成你的’数字脸’：AI不认识你可不行！

想要制作全能数字人视频，第一步就是通过AI工具捏造一个“数字人”。不怕，你并不是一个人在战斗！咱们今天用的是“可灵AI”这个工具，它可是个“大力士”，我们用到的是它的“人脸模型”功能。

怎么用呢？给你一段视频，马上就能明白。

那到底什么是“可灵AI”人脸模型呢？

很简单！你只需要上传几段多角度的视频（好吧，是视频，不是照片），它就能给你训练出一个独一无二的人脸模型！训练完成后，你就能用这个人脸模型随意生成5秒、10秒的视频，轻松制作多个短视频。简直是给创作者开了一扇大门——再也不用担心无聊的背景了！

第1步：AI模型定制

通过Web端首页侧边栏 > AI创作 > AI定制模型，进入功能页面。

【AI定制模型】

可以训练自己专属人脸，此功能只有铂金会员和钻石会员才能使用。

第2步：接受功能须知

认真阅读并同意相关条款，点击’同意并使用’按钮。是的，就是这么简单！

第3步：上传一个正面的视频

★

你需要上传一段正面的视频（10-15秒，1080p，横竖屏均可）。千万记住，视频分辨率得高！否则，数字人可能会有点“模糊”。调整完模型名字点保存，然后点击下一步。

❌ 常见错误：视频分辨率太低，短边需要 ≥1080像素

视频分辨率太低

短边分辨率只有720P

⚠️ 比如这里问题，分辨率不对，就去剪映里面重新导出一遍标准的视频分辨率格式。

✅ 解决办法：使用电脑版剪映重新导出一遍视频
①比例选择 9:16
②时长控制在 10-15秒之间
③导出时选择 1080P

★

关键技术要求
竖屏视频：1080 * 1920 分辨率
横屏视频：1920 * 1080 分辨率
若分辨率不达标，可用剪映以正确参数重新导出

如果不会操作，右边有小姐姐手把手教你应该上传什么样的视频。

第4步：补充多维度视频素材

★

拍更多不同角度的视频（10-15秒），至少得有10段。每个视频都有它的作用，别偷懒啊！这些可是你数字人生命的“营养源(丰富训练样本库)”。

完成上传后，系统将开始模型训练，消耗999可灵值(且用且珍惜)。

同样的，小姐姐也会做演示应该上传什么样的视频。

一旦这些步骤完成后，恭喜！你就能开始训练你的数字人脸模型啦！通常，等待个一个小时，你的数字人就会正式上线！

训练完成之后就会给我们一个 5 秒的模型效果视频，这逼真程度，已经非常 Nice 了。

二、AI人物视频制作：赋予数字人生命

一旦训练好模型，接下来就是生成视频的环节了。你只需提供一个简单的提示词，选择人物模型，AI便会自动生成符合你要求的AI视频。

第1步：文生视频

进入【文生视频】功能，输入提示词，选择训练好的人物模型（参考人脸）。接着，AI会自动将其融入提示词中，生成出符合你要求的视频。

可设置自己需要的参数之后再生成。

参数设置推荐：

生成模式：高品质
生成时长：10秒（消耗70可灵值，比5秒更具应用价值）
视频比例：9:16，适合短视频内容
生成数量：可同时生成1-4条（可灵值会叠加）

第2步：构建精准提示词

一个精准的提示词至关重要，它直接决定了你视频的最终效果。提示词需涵盖五大核心维度：

主体特征：年龄、性别、着装、表情特点等
场景设置：背景环境、周围物品、空间氛围
动作与姿态：肢体语言、面部微表情、互动方式
灯光与氛围：光影效果、色调氛围、视觉重点
技术规格：分辨率要求、风格定位、细节要求

这里，我们以一位约35岁的男性科技博主为例：

主体特征：一位约35岁的男性科技博主，短发，穿着红色宽松舒适的短袖T恤，表情自信且亲切，眼神专注又友好，充满对科技的热情。
场景设置：直播间背景是现代科技风格，中景构图清晰展示博主从腰部以上至头顶的画面，同时呈现周围环境。墙上有各种电子设备、科技书籍，前方是一张简约的站立式工作台，桌上摆着笔记本电脑、智能音箱和几款小型AI机器人模型。背景灯光冷色调的蓝色和紫色，几何造型的LED灯饰进一步增强了科技氛围，红色宽松短袖在冷色调环境中形成鲜明对比。场景中没有任何椅子，体现博主站立直播的风格。
动作与姿态：博主站在工作台旁，面向镜头保持专业站姿，神情严肃但不过分紧绷。双手自然下垂，在讲解AI技术时配合精准的手势强调重点，动作幅度克制有力。眼神专注直视镜头，眉宇间略微收紧传递思考状态，身体保持直立微向前倾，肩部放松避免僵硬感。通过沉稳的语速和停顿节奏，搭配简洁明确的手部动作，营造出严谨的技术探讨氛围，同时维持适度的观众交流感。
灯光与氛围：冷色调的灯光效果突显科技氛围，聚光灯照亮博主的面部和手势，电脑和设备上的光芒映在他的脸上，营造出互动科技的未来感。灯光巧妙打在红色宽松短袖上，使其在画面中形成视觉焦点。
技术规格：超高清8K分辨率，写实风格，中景构图平衡展示博主与环境的关系，聚焦博主的表情和手势，呈现一种兼具科技感和互动感的画面。通过景深控制使博主成为视觉中心，同时保持周围环境的清晰可辨。

点击立即生成，大约等20分钟，AI视频就生成好了。

💡 提示词应该如何写呢？可借助 DeepSeek 等AI工具生成结构化提示词，提升视频生成质量。

主体特征：一位约30岁的男性科技博主，短发，穿着科技风卫衣，表情自信且亲切，眼神专注又友好，充满对科技的热情。场景设置：直播间背景是现代科技风格，墙上有各种电子设备、科技书籍，桌上摆着笔记本电脑、智能音箱和几款小型AI机器人模型。背景灯光冷色调的蓝色和紫色，几何造型的LED灯饰进一步增强了科技氛围。动作与姿态：博主站在桌旁，面向镜头微笑，双手自然摆动，边说话边用手势表达，姿态轻松亲切，带有很强的亲和力，仿佛在向观众介绍有趣的AI技术。灯光与氛围：冷色调的灯光效果突显科技氛围，聚光灯照亮博主的面部和手势，电脑和设备上的光芒映在他的脸上，营造出互动科技的未来感。技术规格：超高清8K分辨率，写实风格，聚焦博主的表情和手势，呈现一种兼具科技感和互动感的画面。

— 帮我根据上面的提示词框架，写一个新的场景：一个人骑着老虎在大街上闲逛

第3步：视频下载与质量检查

对已经生成好的数字人视频下载（可下载有水印或无水印），这里下载的是无水印。如遇手部变形或动作呆板问题，可尝试更换提示词或重新训练人脸模型。

下面是两个数字人视频效果视频。

视频案例（9:16比例）

常见问题

★

问题：可灵文生视频，手变形了，动作呆板

回答：有两个层面，

换提示词，可能这个提示词出的就是有问题，觉得不行就换

所有提示词都有问题，那就证明你训练人脸模型的时候，真人录制的素材就不好，可以重新录重新训练

三、场景二创：数字人的无限可能

场景复刻技术：

借助Kimi等AI工具，我们可以实现对任意场景的 70% 相似度复刻，让你的数字人置身任何想要的环境中。操作步骤：

截取目标场景图片
将图片上传至Kimi并使用特定提示词模板
根据需求调整生成的提示词
将提示词导入可灵文生视频，选择已训练的人脸模型

由于文章篇幅限制，点击上方卡片关注“林月半子”公众号，发送“全能数字人场景二创模版”，即可获取场景二创完整提示词。

目标样本

四、数字人训练：让静态形象开口说话

大家有没有发现，可灵直接出来的视频形象场景已经很Nice了，但人物是没有开口讲话的，下一步我们就可以通过数字人软件，让“活”起来，开始讲话。

用到的数字人软件是 必火AI 数字人

★

必火AI 数字人

通过我的邀请链接购买有优惠：https://www./login/SKolpV，可以添加林月半子微信，cloud-native-101，备注：必火AI，领取折扣码，折上加折。

训练流程详解

第1步：形象克隆

将可灵生成的数字人视频上传至数字人平台，进行形象分析与克隆。

上传的视频要求

第2步：声音克隆

点击声音克隆，选择克隆声音模式（基础版免费，高保真付费）：

基础版声音克隆流程：

音频要求；文件格式：mp3、m4a、wav，音频时长：5秒～3分钟基础版声音克隆限时免费的，消耗的积分也少，但声音的质量相对高保真效果会差一点。

高保真声音克隆流程：

音频格式；支持mp3、m4a、wav文件格式，音频文件大小不超过20M。高保真消耗积分很大，但音质比基础版好。因此再克隆高保真声音时，确保原音频无损坏。

第3步：数字人口播视频制作

生成数字人口播有两种驱动方式：

①文本驱动（可输入台词，数字人根据提供的台词进行匹配口型）

②音频驱动（上传已准备好的音频，数字人会通过音频内容进行匹配口型）。

选择刚刚克隆好的形象，点击【去创作】

文本驱动

输入台词，选择已训练克隆好的声音，可鼠标滑动选取文本内容, 进行逐句试听, 最多选取300字，点击插入停顿在光标处调整文字之间的停顿时长。

★

AI is truly amazing! What you are watching right now is my very first video created using my AI digital human.
你现在看到的视频完全是由我的AI数字人生成，以后有了它，我再也不用反复拍视频了，输入文案就能生成新的视频！你觉得我这个数字人视频如何？欢迎留言告诉我哦！

音频驱动

如果觉得AI声音不够生动，可以直接录音，然后上传 mp3 音频文件，这样出来的视频声音会完全还原自己的声音。

第4步：视频生成与下载

点击提交，等待几分钟之后，数字人视频就制作好了。然后我们下载之后来看看效果。

五、成品优化：剪辑升华数字人视频

剪辑工具：剪映

第1步：这里用剪映剪辑

打开剪映点击首页，在点开始创作，进入剪辑界面。

第2步：视频剪辑

导入数字人视频之后进行剪辑，添加字幕，标题，背景音乐等。

第3步：对剪辑好的数字人进行保存

OK，以上就是完整的制作一个全能数字人视频的整体过程。

结语

搞定了！是不是比想象中简单多了？有了这套流程，你随时随地都能让你的数字分身出场，再也不用担心’露脸焦虑’啦！你想过吗？以后可能大家看的视频都是AI合成的，都分不清哪个是真人哪个是数字人了…有点可怕又有点酷，对吧？

数字人技术的突飞猛进已让创作者拥有了前所未有的可能性。从人脸采样到声音克隆，从场景构建到最终剪辑，每一步都在不断拓展着我们对’自我’的数字化延伸。当你熟练掌握这套全能数字人工作流，你的数字分身将在各种平台上自由表达，为你开启内容创作的全新维度。

对了，你做出的第一个数字人视频是什么场景？评论区告诉我吧！我超好奇的～如果遇到问题也欢迎提问，咱们一起研究！

★

#artContent h1{font-size:16px;font-weight: 400;}#artContent p img{float:none !important;}#artContent table{width:100% !important;}

微精选