超越炒作:AI在产品设计中的实际能力
AI工具正在快速改进,但它们在真实产品设计工作流中的定位仍不明确。Nikita Samutin通过四个核心阶段——从分析构思到原型设计和视觉设计——展示了AI的适用与不适用场景,并辅以真实案例说明。
如今,很容易找到为设计师策划的AI工具列表、生成插图画廊和无数提示库。但更难找到的是关于AI如何实际融入产品设计师日常工作流程的清晰视角——不是为了实验,而是为了真实、有意义的成果。
我亲身经历了这段旅程:在设计过程的每个主要阶段测试AI,从构思和原型设计到视觉设计和用户研究。在此过程中,我建立了一个简单、可重复的工作流程,显著提高了我的生产力。
在本文中,我将分享已经有效的方法,并分析我遇到的一些最常见反对意见——其中许多是我亲身面对过的。
阶段1:无陈词滥调的创意生成
反对意见:“每当我要求AI提出想法时,我只得到一列陈词滥调。它无法产生产品设计师期望的那种创造性思维。”
这是个合理的观点。AI不知道你产品的具体情况、任务的完整背景或许多其他关键细微差别。最明显的解决方法是“喂给”它你拥有的所有文档。但这是个常见错误,因为它通常会导致更糟糕的结果:上下文被无关信息淹没,AI的回答变得模糊和不集中。
当前一代模型在技术上可以处理数千个单词,但输入越长,错过重要内容的风险越高,特别是埋在中段的内容。这被称为“中间丢失”问题。
要获得有意义的结果,AI不仅需要更多信息——它需要正确的信息,以正确的方式传递。这就是RAG方法的用武之地。
RAG如何工作
将RAG视为与你的个人文档库合作的智能助手。你上传文件,助手阅读每个文件,创建简短摘要——一组捕捉关键主题、术语、场景和概念的书签(语义标签)。这些摘要存储在一种“卡片目录”中,称为向量数据库。
当你提问时,助手不会重新从头到尾阅读每个文档。相反,它将你的查询与书签进行比较,仅检索最相关的摘录(块),并将这些发送给语言模型以生成最终答案。
这与直接将文档转储到聊天中有何不同?
典型聊天交互 就像每次你有问题时都要求助手从头到尾阅读一本100页的书。从技术上讲,所有信息都“在他们面前”,但很容易错过某些内容,特别是如果它在中间。这正是“中间丢失”问题所指的。
RAG方法 你向智能助手提问,它仅从不同文档中检索相关页面(块)。它更快、更准确,但引入了一些新风险:
- 模糊问题:你问“我们如何使项目更安全?”,助手带给你关于网络安全的文档,而不是金融。
- 混合块:单个块可能包含营销、设计和工程笔记的混合。这模糊了含义,因此助手无法判断核心主题是什么。
- 语义差距:你问“我们如何加速应用程序?”,但文档说“优化API响应时间”。对人类来说,这显然是相关的。对机器来说,不总是。
它不是使用模型的记忆,而是搜索你的文档并根据找到的内容构建响应。
这些不是完全避免RAG或AI的理由。大多数可以通过更好地准备知识库和更精确的提示来避免。那么,你从哪里开始?
从三个简短、聚焦的文档开始
这三个简短文档将为你的AI助手提供足够的上下文,使其真正有帮助:
- 产品概述与场景:关于产品功能和核心用户场景的简要总结。
- 目标受众:主要用户细分及其关键需求或目标。
- 研究与实验:来自访谈、调查、用户测试或产品分析的关键见解。
每个文档应聚焦单个主题,理想情况下保持在300-500词以内。这使得搜索更容易,并有助于确保每个检索到的块在语义上干净且高度相关。
语言很重要
在实践中,当查询和知识库都是英语时,RAG效果最佳。我进行了一个小实验来测试这个假设,尝试了几种不同的组合:
- 英语提示 + 英语文档:一致准确和相关的结果。
- 非英语提示 + 英语文档:质量急剧下降。AI难以将查询与正确内容匹配。
- 非英语提示 + 非英语文档:最弱的性能。尽管大型语言模型在技术上支持多种语言,但它们的内部语义地图主要在英语中训练。其他语言的向量搜索往往可靠性差得多。
要点:如果你希望AI助手提供精确、有意义的响应,请完全用英语进行RAG工作,包括数据和查询。此建议特别适用于RAG设置。对于常规聊天交互,你可以自由使用其他语言。这也在一项2024年关于多语言检索的研究中强调。
从局外人到队友:给予AI所需的上下文
一旦你的AI助手有了适当的上下文,它就不再表现得像局外人,而开始更像真正理解你产品的人。有了结构良好的输入,它可以帮助你发现思维中的盲点,挑战假设,并加强你的想法——就像中级或高级设计师那样。
以下是一个对我效果很好的提示示例:
你的任务是对两个功能进行对比分析:“团体礼物贡献”(在group_goals.txt中描述)和“个人储蓄目标”(在personal_goals.txt中描述)。
目标是识别逻辑、架构和用户场景中的潜在冲突,并建议在UI中清晰分离这两个功能的视觉和概念方式,以便用户在实际使用中能轻松理解差异。
请包括:
- 用户目标、行动或场景中的可能重叠;
- 如果同时启动两个功能可能产生的混淆;
- 任何架构或业务层面的冲突(例如角色、通知、访问权限、财务逻辑);
- 视觉和概念分离的建议:命名、颜色编码、独立部分或其他UI/UX技术;
- 可能帮助用户理解两个功能的入门屏幕或解释元素。
如果有帮助,请包括关键参数的比较表,如目的、发起人、受众、贡献方法、时间、访问权限等。
AI需要上下文,不仅仅是提示
如果你希望AI超越表面建议并成为真正的设计伙伴,它需要正确的上下文。不仅仅是更多信息,而是更好、更结构化的信息。
构建可用的知识库并不困难。你不需要完整的RAG系统即可开始。许多这些原则即使在常规聊天中也有效:组织良好的内容和清晰的问题可以显著提高AI响应的帮助性和相关性。这是将AI从新奇事物转变为产品设计工作流程中实用工具的第一步。
阶段2:原型设计和视觉实验
反对意见:“AI只生成明显的解决方案,甚至无法构建适当的用户流程。手动操作更快。”
这是个合理的担忧。在构建完整、可用的屏幕流程方面,AI仍然表现不佳。但对于单个元素,特别是在探索新的交互模式或视觉想法时,它可以出奇地有效。
例如,我需要为一个限时促销原型化一个游戏化元素。想法是给用户一张彩票,他们可以“翻转”以显示奖品。我无法在Figma中手动或使用任何可用插件重新创建我心目中的3D动画。因此,我在Figma Make中向Claude 4描述了这个想法,几分钟内,无需编写任何代码,我就得到了我需要的效果。
在原型设计阶段,AI可以在两个领域成为强大的创意伙伴:
- UI元素构思:它可以生成数十种交互模式,包括你可能想不到的模式。
- 微动画生成:它可以快速生成精美的动画,使概念感觉真实,这对于利益相关者演示或作为工程师的交接参考非常有用。
AI也可以应用于多屏幕原型,但这不像放入一组模型并获得完全可用的流程那么简单。项目越大、越复杂,需要的微调和手动修复就越多。AI已经表现出色的地方是聚焦任务——单个屏幕、元素或动画——在那里它可以启动思考过程并节省数小时的试错时间。
这是在设计中使用AI的另一种有价值的方式——作为压力测试工具。早在2023年,Google Research推出了PromptInfuser,一个内部的Figma插件,允许设计师将提示直接附加到UI元素,并在真实模型中模拟半功能交互。他们的目标不是生成新的UI,而是检查AI在现有布局内的操作效果——将内容放入特定容器、处理边缘情况输入并早期暴露逻辑差距。
结果引人注目:使用PromptInfuser的设计师在捕捉UI问题和使界面与现实世界输入对齐方面效率提高了40%——这是设计准确性的明显增益,而不仅仅是速度。
这密切反映了我使用Claude 4和Figma Make的经验:当AI在真实界面结构内操作,而不是从空白画布开始时,它成为更可靠的伙伴。它帮助测试你的想法,而不仅仅是生成它们。
阶段3:最终确定界面和视觉风格
反对意见:“AI无法匹配我们的视觉风格。手动操作更容易。”
这是在设计中使用AI时最常见的挫折之一。即使你上传了颜色调色板、字体和组件,结果通常感觉不属于你的产品。它们往往过于装饰性或过于简化。
这是一个真正的限制。根据我的经验,今天的模型仍然难以可靠地应用设计系统,即使你提供组件结构或带有样式的JSON文件。我尝试了几种方法:
- 与组件库直接集成:我使用了Figma Make(由Claude驱动)并连接了我们的库。这是最无效的方法:尽管AI尝试使用组件,但布局经常被破坏,视觉效果过于保守。其他设计师也遇到了类似问题,指出Figma Make中的库支持仍然有限且通常不稳定。
- 将样式作为JSON上传:我尝试仅上传导出的样式——颜色、字体——以JSON格式。结果有所改善:布局看起来更现代,但AI在样式应用方式上仍然出错。
- 两步法:先结构,后样式:最有效的是分离过程。首先,我要求AI生成没有样式的布局和构图。一旦我有了坚实的结构,我接着请求从同一个JSON文件应用正确的样式。这产生了最可用的结果——尽管远非像素完美。
从左到右:在Figma中带有附加库的提示、带有JSON样式的提示和原始提示。全部使用Claude Sonnet 4和相同输入生成。
所以,是的,AI仍然无法帮助你完成UI。它不取代手工设计工作。但它在其他方面非常有用:
- 快速创建用于讨论的视觉概念。
- 生成现有模型的“假设”替代方案。
- 探索你的界面在不同风格或方向下的外观。
- 作为第二双眼睛提供反馈,指出不一致或你疲劳或过于深入工作时可能忽略的问题。
AI不会为你节省五小时的高保真设计时间,因为你可能会花那么长时间修复其输出。但作为视觉陪练伙伴,它已经很强大。如果你将其视为替代方案和新鲜视角的来源,它就成为有价值的创意合作者。
阶段4:产品反馈和分析:AI作为思维外骨骼
产品设计师已经走过了漫长的道路。我们曾经根据预定义的规范在Photoshop中创建界面。然后我们更深入地研究UX,映射用户流程,进行访谈并理解用户行为。现在,借助AI,我们获得了另一个层次:数据分析,这曾经是产品经理和分析师的专属领域。
正如Vitaly Friedman在他的一篇专栏中正确指出的,试图用AI取代真实的UX访谈可能导致错误结论,因为模型倾向于生成平均体验,而不是真实体验。AI的优势不在于发明数据,而在于大规模处理数据。
让我举一个真实例子。我们为离开我们服务的用户推出了退出调查。在一周内,我们收集了超过30,000份回复,涵盖七种语言。
仅仅计算五个预定义原因中每个的百分比是不够的。我想知道:
- 是否有用户流失更多的特定时间段?
- 原因是否因地区而异?
- 用户退出与系统负载之间是否存在相关性?
真正的挑战是……弄清楚哪些切入点和角度甚至值得探索。从分析到可视化的整个技术过程都是由Gemini在Google Sheets内部“为我”完成的。这个任务总共花了我大约两个小时。没有AI,不仅需要更长的时间,而且我可能根本无法独自达到那种洞察水平。
一些实用说明:
处理大型数据集对于没有强大推理能力的模型仍然具有挑战性。在我的实验中,我使用了嵌入在Google Sheets中的Gemini,并使用ChatGPT o3交叉检查结果。其他模型,包括独立的Gemini 2.5 Pro,经常产生不正确输出或直接拒绝完成任务。
AI不是自动驾驶仪而是副驾驶
设计中的AI仅与你问的问题一样好。它不为你完成工作。它不取代你的思考。但它帮助你更快移动,探索更多选项,验证想法,并专注于困难部分,而不是在重复性部分浪费时间。有时手动设计仍然更快。有时委托给初级设计师更有意义。
但越来越多地,AI成为建议、锐化和加速的一方。不要等待构建完美的AI工作流程。从小处开始。这可能是将AI从好奇心转变为产品设计过程中可信赖工具的第一个真正步骤。
让我们总结
- 如果你只是将完整文档粘贴到聊天中,模型经常错过重要点,特别是埋在中段的内容。这是“中间丢失”问题。
- RAG方法通过仅从你的文档中提取最相关的部分来帮助。因此响应更快、更准确,并基于真实上下文。
- 清晰、聚焦的提示效果更好。缩小范围,定义输出,并使用熟悉术语帮助模型保持正轨。
- 结构良好的知识库产生巨大差异。将内容组织成简短、主题特定的文档有助于减少噪音并保持答案清晰。
- 对提示和文档都使用英语。即使多语言模型在使用英语时最可靠,特别是在检索方面。
- 最重要的是:将AI视为创意伙伴。它不会取代你的技能,但可以激发想法,捕捉问题,并加速繁琐部分。
进一步阅读
-
“AI辅助设计工作流程:UX团队如何在不牺牲质量的情况下更快移动”,Cindy Brummer 这篇文章是我文章的完美前传。它解释了如何开始将AI集成到你的设计过程中,如何构建工作流程,以及AI可以合理承担哪些任务——在你深入RAG或创意生成之前。
-
“使用Figma Make的8个基本技巧”,Alexia Danton 虽然本文聚焦于Figma Make,但建议广泛适用。它提供实用建议,使你的AI工作更顺畅,特别是如果你正在试验视觉工具和结构化提示。
-
“什么是检索增强生成 aka RAG”,Rick Merritt 如果你想更深入地了解RAG实际如何工作,这是一个很好的起点。它用简单术语分解关键概念,如向量搜索和检索,并解释为什么这些方法通常优于长提示。