Discover跨国串门儿计划#339.Nano Banana Pro 发布会:图像生成新纪元,从漫画到商业设计
#339.Nano Banana Pro 发布会:图像生成新纪元,从漫画到商业设计

#339.Nano Banana Pro 发布会:图像生成新纪元,从漫画到商业设计

Update: 2025-11-27
Share

Description

📝 本期播客简介

本期克隆了 Nov 21, 2025 的 Nano Banana Pro 的直播发布会!本期节目中,我们将深入探索 Nano Banana Pro 这一全新图像生成模型的强大功能和创新应用。从令人惊叹的文本渲染能力,到多模态输入和高分辨率输出,Nano Banana Pro 不仅能将你的朋友变成漫画英雄,还能为你的商业品牌设计专业视觉稿。我们还将探讨模型如何利用谷歌搜索获取实时信息,以及它在教育、游戏和专业设计领域的无限潜力。加入我们,一起见证 AI 图像生成的新纪元,看看 Nano Banana Pro 将如何改变你的创作和工作方式!

👨‍⚕️ 本期嘉宾

Logan:主持人

Nana b:Nano Banana 模型团队成员

Ammar:Nano Banana 模型团队成员

Kat:Nano Banana 模型团队成员

Nicole:生成式媒体项目首席产品经理

Tulsi Doshi:模型团队负责人

⏱️ 时间戳

00:00 开场 & 播客简介

Nano Banana Pro 核心功能与演示

00:27 文本渲染与角色一致性:将朋友变成漫画英雄

    00:36 文本渲染能力:在各种场景中实现惊人的细节和准确性

    00:46 角色一致性:将自己和朋友放入自定义漫画故事

    00:51 漫画生成演示:Amy 和 Sasha 拯救世界

    01:26 小说模式:利用文本渲染能力创作漫画书

    08:31 漫画生成结果展示:Sasha 和 Amy 在谷歌办公室修复发布问题

    09:46 互动故事线:选择故事走向,驱动剧情发展

02:28 Nano Banana Pro 模型概览

    02:28 为专业人士和普通创作者赋能

    02:45 多语言文本渲染:支持多种语言,完美处理连字

    03:07 强大的推理能力:基于 Gemini 三 Pro,可调用搜索获取最新知识

    03:28 卓越的设计感:适用于信息图、视觉稿、幻灯片等

03:32 视觉设计能力与多模态输入

    03:32 平面设计师的福音:听取用户反馈,扩展多模态输入窗口

    03:51 14个输入:改变游戏规则,保证角色高度一致性

    04:03 拓展能力边界:支持2K、4K分辨率及各种宽高比

    04:40 跨平台使用:可在 AI Design、Figma 等平台创作

05:04 商业品牌设计演示:从牙膏到咖啡豆

    05:04 品牌创建:使用 Gemini 三 Pro 快速生成品牌概念

    06:16 牙膏品牌设计:Nano Banana Pro 生成高质量模型和 Logo

    06:43 营销活动潜力:本地化、翻译等功能

    07:12 多语言翻译:西班牙语牙膏标签,保持企业风格

    07:33 分辨率调节:4K、1K、2K、4K选项

11:13 实时信息与游戏角色生成

    11:13 调用谷歌搜索:获取最新信息,生成游戏角色总览

    11:31 游戏角色生成演示:Logan 的技能、任务与风格化图片

    13:49 物品栏与技能:展示 Logan 的“功能需求”和“至日权杖”

15:03 视频转图文教程与信息可视化

    15:03 视频转教程:将 YouTube 视频转化为五步图文解释

    15:17 发布说明视频演示:反重力平台操作指南

    16:47 4K分辨率的由来:用户反馈驱动,模型迭代

    17:27 信息可视化:模型在可视化信息方面的潜力

17:43 文本渲染的重要性

    17:43 图像生成质量基准:文本渲染是衡量模型精细细节处理能力的关键

    18:24 “小脸问题”:模型在处理微小细节时的挑战

    18:49 非英语语言的显著进步:捷克语、乌尔都语等

20:06 视频转教程结果:反重力平台操作指南

    20:06 分步教程:从视频中提取内容,生成操作指南

    20:45 狗狗版爱彼迎:Varun 的副业,AI 智能体查看狗狗

    21:12 细节到位:让理解复杂概念变得容易

22:13 创意卡通画与摄影构图分析

    22:13 飞机安全须知卡片风格卡通画:Ammar 抢会议室的故事

    23:22 风格控制能力:模型对特定风格的精准把握

    23:45 摄影构图分析:上传照片,分析构图并提供优化建议

    24:23 模型一致性:在调整构图时保持建筑和景色一致性

25:55 多语言美食菜单演示

    25:55 巴基斯坦菜肴菜单:乌尔都语标注,完美处理连字

    27:17 翻译与推理:将菜单翻译成西班牙语,保留不可翻译的词汇

    28:02 推理能力:模型对真实性的表达和编辑能力

28:55 模型思考摘要与推理能力

    28:55 “思考摘要”功能:展示模型思考过程

    29:08 复杂提示处理:交换衣服、满杯红酒、国际象棋开局可视化

    30:08 菜单价格与地理位置:利用世界知识生成湾区价格菜单

31:08 信息图与职业生涯可视化

    31:08 F1 比赛信息图

    31:17 Logan 的职业生涯可视化:皮克斯风格,参考谷歌搜索结果

    32:25 巴基斯坦菜肴菜单:湾区价格,现代风格,插图

33:54 提示词的灵活性

    33:54 简化提示:从冗长提示到简单指令

    34:22 论文摘要:将论文转化为情况说明书

34:37 4K 壁纸生成器

    34:37 用户需求:KIC 想要 4K 壁纸生成器

    35:33 4K 验证:下载文件大小确认分辨率

    35:53 示例:巨大的香蕉漂浮在太空中的电影风格壁纸

    36:17 生成速度:Pro 模型速度快,4K 分辨率略有延迟

    36:58 1K、2K、4K 的区别:数据量和细节呈现

38:21 袋熊信息图

    38:21 可爱的袋熊:展示袋熊的栖息地和行为

    38:40 细节:袋熊用屁股堵住隧道入口躲避捕食者

40:04 4K 壁纸生成结果

    40:04 桌面壁纸:电影效果,光影细节

    40:30 手机壁纸:Pixel 手机新壁纸,边缘细节

41:03 教育与学习应用

    41:03 心脏图表:点击解释左心室,生成新例子

    41:03 视觉化学习:将复杂概念转化为直观图像

41:33 模型团队负责人访谈 (Tulsi Doshi)

    41:33 发布周回顾:Gemini 三和 Nano Banana Pro 发布

    41:55 团队努力:从模型开发到发布,确保用户体验

    43:32 持续进步:在 Gemini 三和 Nano Banana Pro 方面的进展

43:50 TPU 资源与商业模式

    43:50 TPU 资源:持续的努力和投资

    44:05 商业模式:牙膏、咖啡馆、狗狗版爱彼迎等投资机会

45:05 每日 Gemini 报纸生成器

    45:05 新闻条目:利用谷歌搜索,生成相关新闻和插图

    46:33 实时信息:从博客和文章中获取信息,生成报纸内容

    46:48 图片编辑:将谷歌办公室覆盖上香蕉

48:06 可视化菜单应用

    48:06 菜单可视化:上传菜单描述,生成带图片的新版本

    49:13 真实性担忧:模型生成的食物图片过于美味

    49:57 搜索事实核查:结合搜索结果,提供准确信息

50:27 Gemini 模型与搜索互动改进

    50:27 自然融入:模型行为更一致,搜索结果更自然

    50:50 实时信息:Gemini 应用的关键部分,扩展到图像生成

    51:11 丰富图像:引入真实内容,创建丰富图像

51:46 城堡空间理解与信息情境化

    51:46 真实城堡:基于对城堡的理解,展示空间理解和维度

    52:33 平面图重制:用 Nano Banana Pro 重新混合平面图

    53:11 信息情境化:将产品需求文档转化为信息图

53:47 发布日历可视化

    53:47 Josh Woodward 的案例:将发布日历转化为视觉图

54:00 文档可视化需求

    54:00 文档优先用户:希望制作可视化内容,简化执行摘要

    54:35 幻灯片集成:Nano Banana Pro 与幻灯片同步发布

54:49 画廊更新与游戏创作

    54:49 画廊更新:新增20个应用示例,包括14个Gemini 三和6个Nano Banana

    55:18 游戏创作:酷炫有趣的游戏生成,像素化英雄与反派

    56:32 游戏演示:Dutch 对抗 Mammon 的街机游戏

    57:14 游戏生成改进:透明背景、精灵图创作

57:42 模型可用性

    57:42 API 付费用户:可在 AI Studio 中使用 API 密钥

    57:58 Gemini 应用免费用户:可在思考模式下免费使用

58:22 平面图生成结果

    58:22 渲染成家:车库、主卧、二楼等区域

    59:06 细节与连通性:门、浴室、走廊等布局

01:00:27 模型选择指南

    01:00:27 “找到你的香蕉”:根据目标选择合适的模型

    01:01:05 Nano Banana Pro:高质量、高分辨率、精确文本渲染

    01:01:30 下一步:分割、精确编辑、易于访问、快速使用

01:02:40 教育与学习的未来

    01:02:40 视觉化学习:将 T P U 和 G P U 对比等复杂概念转化为视觉图

    01:03:09 主动生成图像:推动视觉旅程向前发展

01:03:33 AI Studio 与比较模式

    01:03:33 智能体模型选择:AI Studio 智能体自动选择 Pro 或 Nano Banana

    01:03:48 Playground 比较模式:并排查看 Nano Banana 和 Pro 模型输出

01:03:56 结束语

    01:03:56 发布日快乐:感谢团队和用户

    01:04:06 社区互动:在 X 上@nano banana,分享创作

    01:04:13 反馈:欢迎提供反馈

🌐 播客信息补充

本播客采用原有人声声线进行播客音频制作,也可能会有一些地方听起来怪怪的

使用 AI 进行翻译,因此可能会有一些地方不通顺;

如果有后续想要听中文版的其他外文播客,也欢迎联系微信:iEvenight

```

Comments 
In Channel
loading
00:00
00:00
x

0.5x

0.8x

1.0x

1.25x

1.5x

2.0x

3.0x

Sleep Timer

Off

End of Episode

5 Minutes

10 Minutes

15 Minutes

30 Minutes

45 Minutes

60 Minutes

120 Minutes

#339.Nano Banana Pro 发布会:图像生成新纪元,从漫画到商业设计

#339.Nano Banana Pro 发布会:图像生成新纪元,从漫画到商业设计