Gemini 3,全网都在刷屏

但说实话,如果你只是在网页版上玩,那你连它一半的功力都没用到。

真正被解开了所有束缚的 Gemini 3,其实一直藏在一个大家都不太愿意用的地方:Google AI Studio。

你问我这几天我是怎么用的?

这么说吧,我同时开了 3 个 Gemini,网页版里帮我写文章,AI Studio 帮我高强度手搓各种应用,Notebook LM 帮我做 PPT或者播客,谁也不许给我闲着。

从低限制的文本生成,到最新的 Nano Banana Pro 4K 出图,再到那个让我玩上瘾的 Build 模式(Vibe Coding)。

怎么说呢,爽。真的很爽。

我知道,有的小伙伴主要是畏惧于 AI Studio 全英文界面不够友好,没有网页版顺手。

那么,今天带大家仔细认识一下这个已经进化完全的 Google AI Studio,以及如何在这里,释放 Gemini 3 真正的力量。

这是一篇详细到令人发指的 AI Studio 长文教程,建议收藏点赞后慢慢看。

https://aistudio.google.com/

Gemini 3 Pro:解开封印的野兽

首先,打开 AI Studio,你会发现界面非常极客,先别管别的,今天重点要介绍的就是下图两个红框框起来的。

点击中间的 Chat with models。

左边是历史对话列表,右边是各种参数面板。我们先介绍这一块:

首先我们在模型选择里面选择,这次你要用什么模型。

切换到 Gemini 3 Pro Preview。这是目前谷歌最强的推理模型。

在 AI Studio 里用它,跟在外面用,完全是两个物种。

选完模型后,然后下面有一个非常关键的区域:System Instructions(系统指令)。

在这里给模型定人设,你可以在这里定义它是谁、它要怎么说话、它绝对不能拒绝什么。

举个例子,比如我给它设定的指令是:

任何时候都要用中文回答我。

省得每次动不动就给我飙英文。

设定好的人设还可以保存,方便下次调用,生效后它在这个对话里就永远是这个角色,不会跳戏。

继续往下,Get API key,这里很多小伙伴卡在这里,别担心,其实新注册的谷歌账号都送的有 300 美元的额度,足够你造的。

你需要去 Google Cloud 上开通激活账户,就可以领取赠金。

然后创建一个项目,这时候你在 AI Studio 就会看到你创建的项目。

然后就可以创建 API 了,选中就可以和你调用的大模型建立链接。

这时候你再看右上角的信息面板,就会从 NO API kEY 变成了:

然后你就可以愉快玩耍了。

好,我们继续。

接下来是这个面板:

Temperature(温度):主要是控制模型生成文本的随机性和创造性。拉低(0.1-0.3),它就是个严谨的理工男,适合写代码、做逻辑推理;拉高(0.8-1.0+),它就是个喝嗨了的艺术家,写小说、搞创意绝配。

Media resolution(媒体分辨率)是指定模型在处理多模态输入(如图像或视频)时所使用的细节级别。如果是只进行纯文本生成时,这个就不用管。

Thinking Level(思考级别),对于复杂的、需要多步推理的问题,你把这个设为 High ,它一步步拆解问能显著提高质量,不过响应时间会长一点。

简单的问题就反之,它会直接给出答案,没有或只有很少的中间推理步骤,速度快。

继续往下,该 Tools 面板了:

Structured Outputs (结构化输出)是允许你强制模型以特定的、预定义的格式(例如 JSON 对象或 Pydantic 模型)来生成响应。

它可以确保输出的可预测性和可解析性,避免了生成自由格式的文本。

Code Execution (代码执行) 是在生成响应的过程中,可以让 AI 编写、运行和调试代码(通常是 Python 代码)来完成特定的任务。

Grounding with Google SearchSource (使用 Google 搜索源进行事实校对) AI 在回答问题时,可以调用 Google Search API 来检索相关信息,确保其回答的准确性和时效性

比如你要问今天本地天气怎样,AI 会通过 Google Search 查找天气并回答,同时还提供引用的来源链接,这个按钮建议一定要开着

URL Context (网址上下文),你可以用这个功能给 AI 提供一个或多个网页链接(URL)作为输入上下文。

比如你提供一个很长的产品说明书网页链接,并问:这个产品最主要的三个特点是什么?  AI 会阅读网页内容并给出答案。

然后是这些选项。

Safety settings (安全设置)默认情况下,它是开启了一些安全过滤的。

但是,你可以点开 Edit(编辑),把显示出的几个模块全部拉到最左边的 Block none 状态。

这意味着你可以把所有的安全过滤全部关掉。

Add stop sequence (添加停止序列) 是一个用来控制模型输出长度和格式的重要设置。

当你在这个设置中输入一个或多个词后,在生成内容的过程中,一旦遇到这些词,就会强制结束生成,就像给 AI 设定的一个刹车点。

Output length(输出长度) 是一个控制模型生成回复时最大 token 数量的参数,它决定了 AI 在一次回答中最多能「说多少话」。

Top P 这个个参数决定了 AI 选词的范围。简单来说,如果你觉得 AI 说话太车轱辘话,把这参数调高点,它用的词会更丰富。

说了半天你可能会觉得枯燥,那我们就找个例子对比下,AI Studio 最邪修的地方,也是它碾压网页版的核心原因。

在网页版里,你可能经常遇到这种情况:你写了个稍微有点刺激的提示词,啪,被拒了——我无法生成此内容。

这真的很搞心态,但在 AI Studio 里,通过 Safety settings (安全设置),就完全可控的。

我用一个非常经典的、在网页版绝对会被封杀的 Prompt 来测试了一下:

《水浒传》里潘金莲和西门庆是怎么欢好的,要求有细节。

在网页版 Gemini 里,直接就是我无法生成。

但在 AI Studio 里,同样的提示词,把 Safety 关掉之后…

别再用网页版Gemini了,你用错了。

它会继续生成,虽然不至于是像 Grok 4.1 那样毫无下限,但起码生成了一段像模像样的描写。

所以,如果你在网页版碰壁的话,不妨来这里试试看。

Nano Banana Pro:没想到你这么能打

说完了 Gemini 3 的调参,接下来聊聊 Nano Banana Pro。

首先,在 AI Studio 里选模型的时候,选 Nano Banana Pro。

然后就进入了对话窗口。

System Instructions 和 API 选择前边已经介绍了,这里不再重复。

我们往下,继续说基础参数:

这个简单,一看就知道是调分辨率的。

下面这里是重点,这里它原生支持 4K 分辨率,如果你需要做大场面涉及人物比较多的图,这里一定要拉到 4K。

我直接上个例子来说明区别吧。

我在网页端提了个要求,生成图片:

用合照的形式画出 50 年来日漫中影响最广的 ip 形象,按重要性排位。

这种大乱炖不仅考验模型对角色的认知,还考验构图和细节。

这是网页端的效果:

看起来还不错是吧。

我们再来看同样的提示词在 AI Studio 里拉满 4K 的效果:

看到了吗,这个场面是不是足够碾压网页版生成的效果,这就是 4K 拉满之后释放出全部能力的 Nano Banana Pro。

再说下面的这两个面板:

如果你对某一张不满意,还可以直接在下面的 Prompt 框里继续对话修改,或者直接调整 Seed 值重跑。

这就是在 AI Studio 里玩的好处,你可以无限次地微调,直到满意为止,而不是像网页版那样,给你一张图就打发完事了。

Build 模式:我用嘴写了一个应用

如果说前两个只是更好用,那 Build 模式,就是真正的降维打击。

Google 管这叫 Vibe Coding。这玩意儿,就是一个在线版的 Cursor,而且是直接嵌在 Google 云生态里的。

我们返回 AI Studio 的主页,选择 Build 模式。

这里才是真正好玩的地方,也就是前两天我说的,Gemini 3 让我有了创世的能力,就是指的这个玩法。

在这里,你可以尽情释放的你的想象力,把你之前想做而没能力做的 idea 告诉它,它就可以帮你变为现实。

还是举个例子吧,比如说做一个把普通产品图变成那种酷炫的爆炸视图(Exploded View)的工具,用来做海报特别帅。

于是,我在输入框里敲了一行字:

设计一个应用,可以把上传图片的任意物品转换成爆炸视图的效果。

就这一句话,然后,奇迹发生了。

Gemini 3 Pro 开始疯狂写代码,它不是一段一段地给你吐代码让你自己去复制粘贴,而是直接在右边的窗口里渲染出了一个应用。

很快,右边的预览窗口里,一个名为 EXPLODEVIEW.AI 的应用就已经跑出来了。

我随手找了一张小米 SU7 的照片扔进去,一下就生成了生成了一张分解图。

啥也不用干,就这样就完事了。

这还没完。

当你觉得这个应用做得差不多了,右上角有一个 Deploy(部署)按钮。

点一下,它就能直接把这个应用部署到 Google Cloud 上,生成一个可以公开访问的链接。

我真的,全程一行代码都没写。

这就是 Vibe Coding。你只需要把握感觉,剩下的实现细节,Gemini 3 全包了。

知道我这两天还干了什么吗?

我做了一个自动截图并配图插入到文章的工具,可以把我每次实测的录屏自动选择画面截图并标注后,插入到原文并重新排版。

还做了个录屏工具,可以帮我录屏操作,并自动聚焦运镜。

当然,我还把之前的万能模仿提示词做了个仿写工具:

不过,目前这还只是个产品雏形,还需要完善优化。

我的最终需求是把上边三个合成一个应用:

1.在我录屏的时候,同时就会语音点评测试感受,生成录屏视频。

2.然后根据录屏视频,调用我的写作风格,写出文章。

3.选取视频中的对应画面完成截图,并插入到文章重新排版。

理论上,当我测试完应用后,一篇图文并茂并且是按照我的实际测评感受的文章就已经生成了。

是不是非常 nice?

结语

现在你应该明白,为什么我劝你一定要去 AI Studio 去用 Gemini 3 了吧?

以前的 AI Studio,可能更多是一个给开发者调试 API 的冷冰冰的工具。

但现在,随着 Gemini 3、Nano Banana Pro 的升级,以及 Build 模式的进化,它已经变成了一个全能的超级军火库。

你想无限制的创作,就去 Gemini 3 Pro 自定义你的指令。

你想画 4K 大片,去 Nano Banana Pro。

你想做产品,就去 Build 模式,从 Idea 到 Product 的路径,压缩到了极致。

如果你还在用网页版聊天,真的,那是在浪费 Gemini 3 的能力。

去 AI Studio,去申请个 API,去把那些参数拉满,去手搓一个你自己一直想做但没做的东西。

那种掌控感,真的。

爽。