发现AI世界 - 探索最新的人工智能技术、工具和应用
笔记不再只是“存东西”:闪念贝壳 vs Get笔记,谁更懂你?

闪念贝壳主打灵感捕捉与行动转化,适合创作者;Get笔记强调知识体系构建与复习提醒,适合学习者。两者互补,一个解决“灵感消失”,一个解决“学了就忘”。

jiawen·实用工具
不要再“瞎问”了!PrompterHub帮你秒懂AI,还顺带发现一堆宝藏提示词网站

提示词工程是高效使用AI的关键,中文提示词社区 PrompterHub 及多个国外平台,帮助用户直接获取高质量提示词、提升学习与工作效率,让AI真正成为智能助手。

jiawen·实用工具
播客新风口:AI 能帮你说话,但能帮你“走心”吗?

播客正在成为新风口,市场规模突破70亿美元,视频播客尤为火热。罗永浩等人入局,平台和工具层出不穷。NotebookLM、豆包、ListenHub、腾讯 ima 等AI产品降低了创作门槛,却难以取代人情味。未来竞争,依然看创作者的真诚与观点。

jiawen·产品观察
代码即界面:生成式 UI 带来设计范式重构

无处不在的 UIUI, User Interface, where interactions between humans and machines occur.每天清晨,当你听到手机闹钟,睡眼惺忪又极不情愿地用指尖点触“稍后提醒”时,那可能是你新的一天和 UI 界面互动的开始;午休时对着咖啡机犹豫该选美式还是卡布奇诺,液晶屏上跳动图标和提示也属于 UI 界面的一部分;深夜打车回家,闪烁着幽蓝光的车载屏幕还是 UI 界面。当然,最常见的是你拿出手机后的每一次操作,都是在和 UI 界面打一次照面。你可能习惯了让 AI 生成朋友圈文案、插画甚至短视频,却未曾注意到——每当我们打开一个应用,那些精心排布的界面,都是这个数字世界下庞大的 “基础隐形设施”。据统计,全世界单日新增的 UI 界面已达千万量级,这个数字对应了一类巨大的生产资料需求。当生成式 AI 已席卷文字、图片、视频领域时,它在 UI 领域,正在和即将带来哪些变革?初代生成式 UI:“玩具” 初稿,“套模板” 技术路线大约在 9 个月前,妙多推出了 AI 生成 UI 界面的功能。这个功能的交互简易明了:用户通过描述一段对产品界面的提示词,由 AI 生成对应的 UI 界面。妙多在 24 年对 AI 生成功能给出的一个样例妙多并非这个方向的首创。要追溯最早推出这类功能并产生影响力的,应该是 Galileo AI,他们在 2023 年 2 月首次预告了利用 AI 生成界面的功能。2024 年 6 月,Galileo AI 宣布平台生成的界面总数达到 160 万,同一个月内妙多和 Figma 都推出了 AI 设计生成功能。当时我们曾评测过在同一时间针对相同的提示词,各家的生成结果:尽管在那时网上对“UI 设计是否已被颠覆”有一些讨论,但大多的专业设计师普遍将这些生成功能视为 “玩具”。他们认为,生成结果最多只能作为快速可视化初步想法的参考图。为什么这么说?要评价生成的 UI 界面是否达到可用性标准,基础的下限是 “界面美观、布局合理”。在下限可满足后,可有两个维度评估可用性:• 表达力:UI 界面是一种文字、图片、样式信息的混编表达。依据不同产品需求和场景,表达有简单和复杂之分。• 特定风格:我们日常使用一款产品,包含不同的界面,这些界面从整体看视觉风格是一致的,或是用户单看其中一个界面,容易通过视觉标识识别这是哪一款产品。在专业领域术语里,这种一致性是依赖“设计系统” 约束设计师达成的。“设计系统” 是一套复杂实践,它不仅定义了一个业务和品牌显性的视觉元素,也阐述了这些元素的实践规范。初代生成式 UI 在这两个维度:• 表达力:受限的简单。这种状态,有点像将英语作为外语的初学者,能表达出 big,却表达不出 massive, enormous。• 特定风格:虽然生成的界面也有特定风格,但种类一般固定为很少的一类或几类。就像演员如果只能穿一套或两套固定风格的服装,就无法满足多样化的舞台要求。 双重受限下的“玩具”表达力和风格支持都受限,原因归结于技术路线。我们不难理解,UI 并不只是一张如插画般的图片,它更像有逻辑与结构的 “信息容器”。生成式 UI 变得可能,则主要得益于 LLM 技术提供了一套有逻辑和结构的表述。在 LLM 擅长的领域里,AI 生成代码一直是被基础模型广泛评测和落地的重要能力。因此,一种很直觉的思路是让 AI 先生成产品界面对应的前端代码,再把代码呈现为界面。有趣的是,原有生产流程都是先有界面再有代码,在 AI 擅长的领域这个流程被逆向了。依据这个思路我们进行了一些实验,以下是我们曾经使用 GPT4 生成一些代码后再还原为界面的例子:我们进行了不少生成实验,但这些生成的界面在美观、布局合理性上距离预期的下限甚远。我们猜测,可能是那时的大模型在预训练上,前端代码或是关系到样式的代码的数据规模量不够,或是并没有在训练中激发模型对 UI 界面的“审美”能力。出于对“美”的底线有要求,我们决定尝试新的技术路线。虽然大模型直接生成前端代码转化为 UI 效果不佳,但它在理解人的设计意图,以及识别 UI 本身两方面都表现出不错的能力。我们拆分这两项能力:• AI 理解设计意图:当用户用自然语言表述时,AI 可以理解用户的需求是什么,并需要哪些模块来展示这些需求。1)如果用户只是很简单表述需求,AI 可以一定程度“扩写”来完善需求,并陈列展示的模块。2)如果用户详细地表述需求,AI 也可以较好地把不同的需求内容归类到不同的模块。• AI 识别 UI:上一步,AI 理清了哪些模块展示,这里 AI 则是能识别使用哪些 UI 模块适合展示这些信息。我们可以给定较多美观的模块让 AI 来选择。基于以上思路,一种“套模板”的技术路线应运而生。 意图 —> 自上而下的页面结构 —> “套模板”后的 UI 界面这个“套模板” 路线一方面需要 AI 将用户的意图梳理成可表达的结构,另一方面需要 AI 从已经预制好的模板库中挑选合适的模板组件,自上而下的“拼装”。为了简化这个技术路线的运行机制,我们用上图表达了原理。但是,由于 AI 在梳理如何表达结构的同时,它已经“知道”什么是可以表达的,所以上面过程中的后两步并非是分步完成的,而是“一气呵成”的。我们通过对开源模型的微调,最终使得这个技术路线可行。“套模板”的过程有点像拼乐高,你已经知道你有哪些乐高组件了,你基于这些组件来组装你的创意。而因为模板是提前绘制好的,所以生成界面的美观度和布局都比较可控,通过这种方式守住了“美“的下限标准。但是,这条技术路径的局限性是:并非所有的用户描述都能真的寻找到匹配效果适宜的模板,寻找不到时只能尽力降级处理。有时候,即使找到了不错的匹配模板,模板的粒度不够细,也无法完全满足用户的表达需求。换句话说,这条路径在表达力的上限,受限于我们提前预制模板的丰富程度和细致粒度。24 年 7 月,用户 Andy Allen 在 X 上质疑了 Figma 的 Make Design 功能,指出使用 AI 生成的天气界面,和 iOS 原生的天气界面非常雷同。这引发了设计圈热烈的讨论,大家在辩论 AI 会不会让更多的设计无比趋同。Figma 的 CEO,Dylan Field 澄清了这个错误,坦诚这是 “Ultimately it is my fault for not insisting on a better QA process for this work and pushing our team hard to hit a deadline for Config. 为了赶工功能上线而没有进行充分的 QA 工作” 而造成的。Figma 快速下线了 Make Design 功能,并在整改 2 个多月后重新上线,并把功能更名为 First Draft。如果你理解了初代生成式 UI 的技术路线,应该不难理解,为什么 Figma 会出现这样的问题 —— 生成功能的背后包含了大量设计师绘制的模板,一方面”天气“这个品类的 UI 界面总量就不多,而可能这位绘制天气组件模板的设计师偷了点懒,过多地借鉴了苹果原生的界面。初代生成式 UI 距离真正改变生产力的差距,或许就是“玩具” 版 First Draft 和真正 Make Design 的差距。技术革新:表达力从简单到复杂,灵感涌现有一种技术预判的假设是:如果基础模型进步没那么快,“套模板”这个技术方案持续的时间足够长,依靠不断的扩充模板会不会成为可行的产品道路?毕竟每扩充一些新模板,就能多满足用户的部分需求。我们甚至考虑过要不要组建一支专业的设计师内容生产队伍,来提升模板数量和丰富性。我将这条发展路径称为“模板商店”。我们通过不断提供更多模板,一方面可以提供更多的风格让用户选择,另一方面也一定程度增强了表达力。这个思路类似无代码搭建网站的产品,如 Wix,Shopify 等,它们都有自己的“模板商店”。对这个技术预判的纠结持续了四个月,我们最终并没有选择这条道路,但同时我们在生成 UI 上进展缓慢。在这进展缓慢的四个月里,我们的产品研发团队对“代码转 UI”的技术路线一直念念不忘。这也使得每一次基础模型有较大更新时,无论开源还是闭源,我们都很热衷测试一把。上面两个例子都是在 Claude 3.5 Sonnet 发布之初的测试。它确实有一些惊艳:例如生成“天气”的卡片时它甚至带上了一些与众不同的创意。但它和我们划定的“美”的下限仍有差距,且生成的内容中有很多不符合 UI 设计最基础规范的问题。事情的转机大约出现在 24 年 11 月, Claude 3.5 Sonnet 在代码生成领域的重大革新,对产研领域具有里程碑意义。我们也在这个时间后,见证了其他一些基础模型,如 Qwen 等在代码生成领域长足的进步。当我们持续不断地在“生成代码转 UI”路线上进行实验时(包括提示词工程和微调),某一天,惊奇的事情发生了:“某一次” 突变的实验结果再来看看“表达力”呢?AI 爆发出无限的表达潜力。上面的例子中(第二张图),我们甚至生成了一个有模有样的“3D Map 编辑器”——这并不是一个常见的界面设计。如果使用原来“套模板”的思路,除非我们自己预制了这么一个不常见的模板,否则 AI 绝无可能生成这样的界面。从此,生成式 UI 进入了一个新的阶段:由 AI 生成的界面不再只是一个表达力简单的“玩具”初稿。它可以呈现出更复杂的设计,也支持了更自由的风格。即使这些设计结果还无法匹配业务的设计风格,但它可以充分地向产品设计者提供多样的设计方案作为参考,这个价值提升是巨大的。这个阶段的到来是突变的,又蕴藏无限的能量,我称其为“灵感涌现”。灵感涌现下,AI 能丰富表达出各种 UI。用户再也没有相同的提示词,多次生成雷同界面的问题。基于设计系统的 UI 生成:是拐点,也是开始生成式 UI 还面临着另一个关键问题:每个业务都有自己的设计风格,如何满足不同业务个性化的风格(也就是如何遵循业务的设计系统)。当我们还在走“套模板”技术路线时,有一些中大型企业的设计团队和我们一起共创想法,他们提出过两个有意思的见解:•“表达力”受限对于我们不是障碍,反而是一种需求!我们一点也不希望我们的设计师百花齐放,我们就希望他们完全遵循我们已有的组件模板(这一刻,我更理解了为什么设计领域常有观点批判“设计系统”,企业的这种控制欲是反感的根源)。•妙多既然已经实现了 AI 基于特定设计风格的生成,那如果我们授权数据给你们训练,是不是你们就可以基于我们自己的风格进行生成了?这是一种另类的“模板商店”的思路,意味着我们的商店要经营不错,还需要完成客户的私人定制。我认为,这个思路至今也仍具备一定可行性,或是说对一类设计团队行之有效。但是,过去一年的产品开发经验让我们也进行了反思:我们究竟是应该匹配已成熟的技术(Technology),打磨产品(Product)以实现 Product-Technology-Fit;还是,我们应该更信仰模型最终会快速进化,用动态的思维去看待问题,时刻准备承接未来新模型技术溢出的能力?这一次,我们更坚定地选择了后者,暂缓了“模板商店”这条并不适应 AI 能力进化的方向,全力转向生成代码路线。转变路线后,我们在生成实验过程中,发现了一个有趣的现象:如果你告诉 AI 直接生成大众的产品界面,它似乎“懂得”这款产品的设计系统。观察下面两个界面:“bnb 外卖”乍一看,你是不是有些恍惚,这是 Airbnb 开设的外卖业务吗?以上两个界面,是我们在妙多中让 AI 参照其它外卖产品的界面生成的。在生成界面的提示词里,我们提到了“请遵循 Airbnb 的风格进行设计”,除此之外并没有额外在风格上进行其它提示或训练。因此,我们推断大模型在预训练过程中,“见到过”这些大众产品的界面并一定程度“学会了”,使得生成结果可以匹配风格。当然,如果仔细考究,它在遵循风格规范上并不严格。同时,更多的产品是非“大众”的,基础模型并未“学过”。但这个发现,让我们转向对一条新技术路线的探索:如果我们把模型也看作一个设计师,为什么不试着让他在做设计时“读懂”你的设计系统?打个比方,我们做的像是一种“解码式翻译”工作,向大模型输出一套它能够读懂、也能较好遵循的设计系统。截至今日,我们在这条路线上已有一些不错的收获。我们的“翻译”工作已能让模型基于一些通用大型的设计系统,稳定准确地生成界面。同时,我们还搞定了风格的配置,意味着用户也可以个性化的改编风格。例如:基于 Ant Design 生成的一套风格统一的健身房后台界面以上这一套界面设计是基于开源的设计系统 Ant Design 生成的。你可以看出,我们定制化了风格样式,输出的界面样式风格也保持了很好的一致性。全球有大量的中后台产品都是使用 Ant Design 的设计系统搭建的,这意味着这部分界面的生产流程已经被极大的改变。除了让这些大众的设计系统被 AI 可控、稳定地“读懂”,我们也在探索如何“翻译”不同业务的设计系统让大模型理解。根据目前试验的进展,我相信这一天的到来不会太远。而当生成式 UI 技术既可以突破表达力的限制,又可以可控地遵循丰富多样的风格时,UI 设计领域的重大拐点已然到来。这意味着:• 大部分设计中需花费大量时间才能构建高保真界面的流程即将被彻底地颠覆。设计者的价值不再是操作设计工具进行构建,而是回归设计本身进行更多的思考、呈现更多的创意方案、推进更高质量的决策。• 过去多年,中大型设计团队花费巨量时间构建、维护设计系统以保持团队设计的一致性。当 AI 能以它的方式读懂并维护设计系统时,是否会产生另一类维度描述的“新设计系统”?它甚至在大部分时间里,不需要人为进行定义或维护。当下所定义的“设计系统” 是否会成为不必要的实践?这不仅是一个拐点,也将是一个全新的开始。自问自答和四种假设:AI 时代主流的「界面设计编辑器」是怎样的?大模型日新月异,产品设计与研发领域各种新的应用也层出不穷,身为“局中人”,我们几乎每天都在观察这个行业新的提问,并进行新的思考。这一章的开头,我选择使用自问自答模式,“由小及大”整理了几个问题,并提出我的看法。问题 1:Figma、妙多这类专业又精细化的界面设计工具,在 AI 生成迈过拐点后,会演进为怎样的形态?我认为会演进成“专业编辑器 + AI 助理”的一个普遍故事。我们已经看到,一个精细的文档编辑器加生成式 AI,使 AI 成为了你的文档助手,Office 称之为 Copilot,Notion 则拟人化地展现助手形象。IDE(Integrated Development Environment)是程序员日常使用的代码编辑器,VS Code 加上 AI 后,演进成了 Cursor。在这些例子中,原有的专业编辑器加入 AI 后,并没有被削弱,而是增强。本身拥有专业编辑器技术壁垒的玩家并不多,竞争有限,他们可以依靠 AI 提升的用户价值形成商业增值,或是打造一款新的产品。我觉得界面设计领域也会演进到这一步,AI 会成为界面设计工具中的个人助理,如果产品做得好,它甚至可以无处不在。不过似乎“个人助理”的显性化在这个领域发展要慢一些,原因可能包括:本身拥有精细化编辑器的玩家不多,以及界面设计领域的生成式 AI 要理解和输出的格式不如文字、代码这么直接。妙多正向这个方向演进,新的形态应该很快就会面向用户。我觉得专业编辑器更长远的竞争也会聚焦在 AI 能力,以及 AI 和专业编辑场景的融合。商业上,只依靠专业编辑器本身的壁垒获得长期利润的预期会下降。开源会极大促进这个方向的繁荣,例如,如果不是因为 VS Code 开源,也就不会有 Cursor、Windsurf。问题 2:界面设计工具领域会出现如 Devin 一样的 Agent 吗?虽然短期有各种挑战,但保持乐观,或许产生变化的那一天不会太久。由于 Agent 需要相对闭环地完成一个场景下的任务,人们对专业领域的 Agent 的完成质量预期比通用领域高很多。换句话说,通用领域的 Agent 或许只需要一些场景完成质量比 80% 的泛受众好,它就产生可观的价值(有一类说法是覆盖 90% 的领域,代理 90%的人的 90% 工作,这就是 AGI);但在专业领域,比较对象发生了变化。如界面设计的 Agent,它可能需要完成一个任务的质量超过 80% 专业设计师才算良好。Devin 面临同类的挑战。另一方面,界面设计 Agent 最终交付的产物大概率和设计师一样,需要交付到专业的设计工具上,因此 AI Agent 也需要掌握使用专业设计工具。虽然 Figma、妙多这些闭源产品可提供 API 在画布上创建设计,还有 Penpot 这样的开源产品,但开发者需要深刻理解界面设计的领域知识才可上手构建 AI Agent 。这种理解上的门槛也可能会延缓这个领域的进展,或是开发 Agent 仍是拥有专业编辑器玩家的特权。当然,这个领域的思考和探索会非常有趣,Agent 也可以先从相对简单可行的任务开始。例如我们最近就在思考能否做一个 Agent,完成设计领域的调研,并让 AI 直接将调研结果呈现在妙多上。问题 3:当我们去看一个更通用的“设计类产品” PowerPoint 时,微软加入 AI Copilot 后使之增强,但似乎并没有赢得广泛的好评。反而是这个领域 AI Native 的产品,例如 Gamma,它颠覆了 Presentation 的创建流程,也迅速获得了用户和口碑。下一代界面设计工具会是一款颠覆 Figma 的 AI Native 产品吗?这是个值得长期思考和观察的问题。作为 Figma 的挑战者,妙多起初花了两年时间去打造一个能和 Figma 在功能和性能上相当的界面编辑器,然后我们期望 AI 赋予我们机会做出越来越差异化的产品。严格定义下,我们不是一款 AI Native 的产品。另一方面:• 有产品设计想法的人如此之多,他们都需要这么复杂的编辑器吗?——我经常听到身边的产品经理抱怨 Figma 或妙多的编辑器上手门槛高,甚至要系统地学习两天的视频课才算入门。• 当设计者意图上希望用“五彩斑斓”的渐变色作为界面设计背景时,他们究竟是需要一个复杂的渐变色设置面板,还是只是期望挑选酷炫的设计结果?• 世界上的界面大多是“演进”而创造的,有多少界面设计工作一定需要从 0 到 1?以上这些问题都导向了一款 AI Native 的产品设计工具是可能的。事实上,我们可观察到很多 AI 创业团队的产品经理已经直接使用 V0 进行产品界面的设计。Lovable 这类产品虽然最终目标是生成应用,但它们给出大量的使用案例都是在生成产品设计原型 —— 有意思的是,Lovable 团队自己说他们最终大部分 Coding 的完成还是在 Cursor 上。它们现在共性的问题是,当用户对生成结果需要进一步修改时,仅仅依靠 AI 对话编辑是不便利的。我个人看法是:一类 AI 技术的变化在同一时间赋予了两种机会:第一种是原有的界面设计工具可以在 AI 加持下增强;第二种是 AI Native 重新打造的产品和工作流,对某类用户、某些场景的效率更高。前者会被后者在效率革新上冲击,但后者也会因为“不易精确又完备的表达” 难以完成长途奔跑的最后一公里。拉长时间看,你甚至很难说两者会不会“相遇”:前者可以在融入 AI 后不断简化原有的产品形态,而后者则为了实现更广泛的需求需要完善精细化的功能。这件事对 Figma 或许有更大挑战,他们在协同时代积累的巨大用户资产可能会成为他们在 AI 时代简化的阻碍。问题 4:我们观察到 Vibe Coding 类工具的流行,例如, Bolt.new,Lovable 这类产品,当用户有产品设计意图后,能借助这些工具直接生成最终的应用。产品界面的设计似乎只是这些产品流程中的一个环节。以及,不少用户也在晒出通过提示词直接在 Claude 3.7 中创建精美的界面。这类直接面向最终结果的生产工具,甚至是基础模型本身,会不会更为“本质”,让最终的专业界面设计工具价值大大降低?首先,部分设计工具正从单点需求向一站式平台演进。例如,Bolt.new 支持从输入意图生成网站,并能实时编辑和部署。Figma 最近也被曝光出了一个“水下项目”,可以直接帮助用户搭建网站,我猜测这会是一个直接从设计到发布部署的产品,会和现在市面上 Webflow、Framer 这类产品直接竞争。Canva 最近发布了新能力 Canva Code。这个逻辑听起来有点新奇, 毕竟 Canva 以“大众版 Photoshop”著称,用于制作平面的视觉海报等物料。但这也不难理解,据我所知,部分海外设计师日常使用 Canva 来设计网站界面。哪里有界面编辑器,哪里就有把这些界面直接发布或是互动化的需求,平台响应需求、拓展功能也就不足为奇。我们可能忽略 Canva 现如今已是一个使用简单、却“并不简单”的界面编辑器。但是,这些“新物种”的出现究竟是刺激了新需求的产生,还是抑制了原有专业编辑器的场景?这个问题换个角度看,也在探讨“更通用会不会击败更专用”。历史上有一些有趣的例子。Sketch 在界面设计领域因为更专用,它抢走了 Photoshop 曾经在 UI 领域的市场,但 Photoshop 因数字化进一步深化发展得更大。Canva 是更通用的,但它似乎并不是去击败 Photoshop。Cursor 本质也是因为更专用,它和 Claude 某种程度相互成就——虽然早期也有很多质疑在说 Cursor 只是一个 Claude 的“套壳”,但我相信这样的声音越来越少。更专用的工具可长期存在,是因为“专业用户”的存在。随着技术发展,“专业用户”鲜有最终消失,但专业用户群体的定义可能因需求变化而变化。“专业用户”长期存在背后更本质的意义或许在于:他们所从事和追求的工作,是否代表人类在不断追求更完美、更好。似乎“设计”也属于这类无止境追求的工作之一。此外,产品设计领域还有一些其它属性的问题:• 人们在做产品设计时,究竟是针对产品原型进行讨论从而达成共识更为敏捷,还是针对可以运行的应用进行讨论更为充分?• 如果生成式 AI 让今后大部分的产品设计基于“生成—选择—生成式编辑”,那些跳脱传统的设计方式或风格该如何达成?那些“匠人精神”的手动调整式设计,虽然占比很小,但会不会成为产品设计最核心的价值之一?基于以上,我对界面设计领域长期存在有价值的专业工具是乐观的。结合对上面几个问题的思考,我们向大家分享一下妙多团队对未来的「界面设计编辑器」如何演进提出的四种假设:1)手动界面编辑器 + AI 助理:手动编辑器解决 70% 工作,AI 助理解决 30% 工作。2)手动界面编辑器 + AI 助理:手动编辑器解决 30% 工作,AI 助理解决 70% 工作。3)一种更为简化的 AI 原生的设计编辑器,AI 生成和编辑解决 80% 工作甚至更多,手动编辑解决剩下工作。4)几乎不存在独立的界面编辑器工具价值了。界面编辑器只是一站式 AI 原生的应用生成软件的一个功能。• 假设 1:这像是我们对 Figma 和妙多未来的预测,AI 若能占比当下生产流程中 30% 的生产力,就已是一次颠覆。• 假设 2:假设 1 的更乐观版本,它的终极目标是 AI 助手也是一个专业 Agent,它能代理大部分的设计工作并在设计工具中呈现。也有另一个视角,如果我们观察 Wix,Webflow 这类传统的建站工具,界面编辑器本身是他们的一部分且面向非专业用户,它们在界面编辑器这部分被 AI 融入的占比理论会更高。• 假设 3:一种新的定义,近半年涌现的创新产品有很多。我们看到 V0, Magic Patterns,Onlook 都处在这个定义下的雏形阶段,虽然瞄向了截然不同的发展方向。• 假设 4:可能是 Replit,Lovable,Bolt 这类产品所追求的“终局”。我们并无法线性地演绎未来,发展之中有诸多变量。以上四种假设也不是非此即彼,这四种形态的产品可能会同时存在和演进。而有趣的是,我们正参与其中,我们既是这个演进中的变量,又可以观察和思考它们长期在界面设计领域的占比变化。设计与研发的角色的变化,未来的我们是谁?最后,我们从技术和工具的视角回归到生产者本身,观察产品设计和研发领域的生产流程从过去到现在的变化,以及趋势。上图展现了一个“古老”的产品研发团队的分工模式。我们用一个通俗的例子来解释他们的分工与协作——想象你最常用的打车软件的首页:• Product Manager(产品经理):用户在叫车时有哪些核心需求?我需要哪些功能或是元素满足这些需求?• UX Designer(交互设计师):用户要开始叫车了,如何让用户轻松又明晰的操作?输入地址的输入框要放在屏幕什么位置?如何让用户更容易确认出发的精确位置?• UI Designer(界面设计师):界面中的卡片需要怎样的阴影呈现什么样的风格?地图上当前位置的展示用什么形状和颜色更适宜?我的 icon 应该使用线性还是面性?• Frontend Developer(前端工程师):他们都催我何时开发完成上线……如今还在这样分工的团队已经不多了。过去 10 年,这种传统分工发生的最显著的变化是 UX Designer 和 UI Designer 的“合并”。现在大部分的产品设计师的职位称呼都统称为 UX Designer,或是使用更概括的称呼:Product Designer。“合并”直观的代表了产研领域分工的变化。例如 UX Designer 和 UI Designer 的合并背后,我认为本质上深受“设计系统”普及化的影响。对应也有两种说法:• 说法 1 “设计统一论”:可能是更普遍的说法。原来大多数 UI Designer 日常处理的问题,是一种边际产出,这些边际被逐步被固定为了设计系统中的规范。因此,UI Designer 那部分工作更少被需要,只需要 UX Designer 懂得如何运用设计系统即可。这种说法支持设计系统促进了界面设计领域的效率。• 说法 2 “设计消亡论”:与 1 相反,认为 UI Designer 在视觉上的创造性更大,无法被固定化的价值更大。而 UX Designer 则是在不断用重复性的交互方案解决类似问题。这个逻辑也对应了行业中对设计系统的批判:在设计系统越来越固定化的今天,设计师变成那些只会拼乐高的人,“真正的设计”走向消亡。“设计统一论”一定程度表明了随着工具的发展,原有生产流程中由人完成的“不确定性”的边际产出,变成了工具可支持的“确定性”的固定产出,从而人在使用工具后,能力边界被拓宽,“多能”胜过了“单能”。Noah Levin(Figma 的 Design VP)用形象的图例,表述了趋势的变化:可见,在技术巨大的变革下,分工后的具体岗位职责非常脆弱。假设我们将产品研发比作要建造一栋房子,我们宏观的概括现在产品研发领域的分工,我愿用“3D”来简述:• Definer:这座房子满足用户什么需求?为什么可以创造价值?如何获得利润?• Designer:如何让居住者有更好的居住体验?如何让这座房子的外观和内部都更漂亮?• Developer:如何规划和实施建造这座房子?“3D”一定程度对应了 Noah 图例中的 PM,Design 和 Eng。而这“脆弱”的分工方式,未来又会如何呢?对应“设计统一论”,工具会提供越来越多“确定性”的能力。未来的 Maker 有能力一个人完成一站式的定义、设计、开发。他们可能来自于“3D”中的 Definer,Designer 和 Developer 任何一方,唯一重要的是 Maker 们都需要善于使用最先进的、可提供“确定性”的工具。而“设计消亡论”,则让我们反思:当工具提供太多“确定性”时,人类追求更美、更好的创意是否会被抹杀?在我描述 “3D” 角色中,似乎越靠前的角色需要越多的创意,面临更加“不确定性”的工作。而这类面对 “不确定性”工作的能力,是否会成为 AI 时代最重要的反脆弱能力?毕竟,人们会想方设法的用 AI 逐步代理那些“确定性”的工作,而面向“不确定”的能力可能是我们区别于 AI Agent,可坚守价值的最后阵地。这篇文章是妙多的 Co-Founder 昊然对 AI 如何改变 UI 领域的最新总结和感悟,首发于 “海外独角兽”。本文转载自微信公众号「海外独角兽」(ID:unicornoberserver)作者:张昊然,妙多 Co-Founder编辑:Cage,海外独角兽 AI Research Lead

妙多 & 海外独角兽·产品深度
【产品思考】赚钱的AI产品做对了什么?

大公司做AI产品,都能从零到一完成商业化闭环,赚钱效率很快;为什么其他做模型的公司却很难赚到钱呢?这里有四个洞察,或许能帮你换个思路。

王智远·产品经验
关于 AI 下半场的思考(真格基金深度对谈)

和历史上其他创新技术相比,生成式 AI 的应用落地速度非常快,今年我们已经看到随着模型能力的飞速进展,不少 AI 应用开始有实打实的收入。

Arthur Chiao·产品趋势
【产品观察】盘点最受欢迎AI产品

不久前,硅谷知名投资机构a16z做了一个调查,询问了18位不同行业的领导者,让他们分享各自最喜欢的AI产品。

乌鸦智能说·产品观察
AI 产品开发:从场景到技术的方法论

AI 产品开发的核心是让技术精准匹配场景,避免陷入 “为技术而技术” 的误区,遵循 “场景锚定 — 需求拆解 — 技术适配 — 闭环验证” 四步方法论,可大幅提升成功率。​场景挖掘要穿透表面需求。需通过 “场景五要素” 分析法锁定核心痛点:谁(用户)在什么时间(时机)、什么地点(环境)、做什么事(行为)、遇到什么阻碍(问题)。例如智能客服场景,不能仅停留在 “用户咨询效率低”,而要拆解为 “售后用户在晚间 10 点后咨询退换货,人工客服响应延迟率达 60%”。用用户旅程地图标注每个触点的情绪波动,优先解决让用户 “皱眉” 的高频场景。​需求转化需量化为 AI 任务。将场景问题拆解为可执行的技术目标:如上述客服场景,可转化为 “意图识别准确率≥95%”“常见问题自动回复覆盖率≥80%”。避免模糊表述,例如 “提升推荐效果” 应细化为 “用户点击转化率提升 15%”“退货率降低 10%”。同时明确数据边界,如训练数据需覆盖近 6 个月的用户咨询语料,包含 20 种常见意图类别。​技术选型坚持 “适配优先”。根据任务类型选择成熟度与场景匹配的方案:通用场景优先用预训练模型微调(如用 BERT 微调客服意图识别),特殊场景考虑轻量化定制(如工业质检用小样本学习适配特定瑕疵识别)。避免盲目追求前沿技术,例如文本分类任务用传统机器学习(SVM)即可满足需求时,无需强行上深度学习。技术验证阶段需做 “最小成本测试”:用少量标注数据验证模型准确率是否达标,再决定是否扩大投入。​闭环验证强调 “数据 — 场景” 联动。上线初期采用 “人机协同” 模式,如 AI 客服先处理明确意图,模糊咨询转人工,同时记录未解决案例作为模型迭代数据。设置 “双指标” 监测体系:业务指标(如客服响应速度)与技术指标(如模型准确率),当技术指标达标但业务指标无改善时,需回溯场景定义是否偏差。例如智能推荐系统若点击率提升但转化率下降,可能是推荐逻辑偏离用户真实需求。​这套方法论的关键是让技术始终服务于场景价值,通过 “小步快跑” 的迭代,让 AI 从 “实验室效果” 落地为 “用户可感知的体验提升”。

腾讯开发者·产品经验
【产品榜单】量子位发布“AI 100”旗舰产品榜和创新产品榜(2025年H1)

2025年7月30日,量子位智库发布“AI 100”双榜单,对2025上半年的AI产品进行阶段性判断。这份AI产品观察体系由“旗舰100”和“创新100”两个榜单组成,分别代表当前格局中领军阵营和未来市场的种子选手,覆盖AI效率、AI创作、AI娱乐等领域,包括DeepSeek、豆包、kimi、腾讯元宝、通义等产品均在榜单当中。榜单发布方量子位表示,该榜单采用真实用户数据、长期发展潜力双评估,通过专家评估和用户调研,综合考量产品的底层技术、市场空间、功能设计、变现潜力、团队背景、增长速度等多重因素。此外,量子位分析师表示,在用户需求已从“能不能用”进阶到“值不值得长期使用”的今天,AI产品不再只需要炫技,更需要经得起时间和市场的考验。在应用场景全面开花的当下,唯有系统化能力与新赛道创新能力才可能实现破局。

量子位·产品榜单
【经验分享】AI 时代如何做独立开发

本次分享,我想结合我做过的产品,谈一谈做独立开发的一些感悟、积累的一些经验、以及我看到的行业机会。我做过的 AI 产品不完全统计,我最近两年做过的 AI 产品有十来款,主要聚焦在 AI 应用层,去年基本保持每个月发布一款新产品的节奏。被人熟知的产品包括:ThinkAny:去年三月上线的 AI 搜索引擎,深受东南亚用户喜爱,高峰时期月访问量大几十万,也上过一些 AI 产品排行榜单。ShipAny:去年圣诞节发布的 AI 应用开发框架,预售四小时销售额破 1w 美金。主打一小时快速上线 AI SaaS 网站,目前已经是一些独立出海项目的首选开发框架。MCP.so:去年 11 月底上线的 MCP 应用市场,最近三个月平均月访问量百万,被 a16z 市场报告引用,已有全球知名度。CopyWeb:今年 2 月份上线的 AI Coding 产品,主打网页复刻,已经跑通了 PMF。最近三个月,我没开发新产品。主要精力在整理过去的一些经验,想着把之前做得不够好的产品捡起来迭代优化。适当断舍离,该坚持的也要坚持。独立开发一年半,我的一些感悟天下武功,唯快不破AI 时代,对独立开发者是一个很大的利好。利用 AI 技术,可以帮助我们更快地做出产品。特别是基于 AI 热点做新产品的场景,快就是优势。技术门槛不是特别高的 Web 类项目,第一个版本,也许不需要花几个月时间去打磨,如果能做到一周、一天或者一小时上线,那肯定是极好的。比如我之前做的 AI 红包封面生成器,在星巴克写了一个小时上线,过年前几天跑了很多流量。我去年做的 AI 搜索引擎,第一个版本是在一个周末完成的。我去年做的 AI 应用开发框架,是在预售后一周时间内写完代码交付的。快速上线,先起飞再加油。先验证用户需求,再决定是否继续投入,是独立开发者或小团队做产品行之有效的策略之一。快不如精,长期主义我做 AI 产品速度已经非常快了,这是我最大的优势,也时常让我困扰。反思起来就是,兴趣过于广泛,涉猎太多,很多产品都是浅尝辄止,没有往深了做,抓住了一些机会,也错过了很多机会。比如我是最早进入 chatbot 客户端、AI 知识库赛道的开发者之一,冷启动做得还可以,有一些知名度,只是后面没有坚持做,用户和口碑都流失了,倍感遗憾。最近看到很多产品后来居上了,五味杂陈。做得快不如做得精,如果快速上线跑通了 PMF,还是应该坚持做下去。长期主义是一个很好的品质,是我对后来者的建议,也是对自己的告诫。梦想要大,切入要小我去年做 AI 搜索引擎的时候,希望对标 Perplexity,做成一个全球性的通用 AI 搜索引擎。我去跟投资人聊,他们觉得我想做的方向很好,天花板足够高,但是需要投入的资源也很大,这是巨头们的战略方向,竞争激烈,不太相信我能做起来,建议我做垂类 AI 搜索引擎。初生牛犊不怕虎,我觉得光脚不怕穿鞋,就想做通用。后面越做越难,有段时间 token 成本特别高,拿不到投资,又赚不到钱,备受打击。再后来很多大模型厂商的 chatbot 都内置了联网搜索,这个赛道的竞争也越来越激烈。秘塔做了 AI 学习,Genspark 转型去做通用智能体了,我最近也在思考 ThinkAny 应该何去何从。创业者前年需要选择做通用大模型还是垂直大模型,去年需要选择做通用 AI 搜索引擎还是垂直 AI 搜索引擎,今年需要选择做通用智能体还是垂直智能体。理想主义是一把双刃剑,梦想可以很大,切入应该要小。独立开发者或小团队,从垂直赛道切入,不会有太大的资源整合压力,竞争更小,产品效果更收敛,粘性更高,也更容易产生正反馈。先垂再通,农村包围城市,不失为一个好战略。自己造血,打铁还需自身硬我去年做 AI 搜索引擎,今年做 MCP 应用市场,见了很多投资人。大致了解了国内的投资现状和资本的投资逻辑。资本很看重团队。创业跟爆米花电影的爽片情节不一样,需要团队作战,靠个人英雄主义走不通。资本很看重竞争格局。大厂有足够多足够好的飞机大炮,AI 搜索和 MCP 都在大厂的射程范围内,凭什么你能做起来。商业模式和增长速度是基本面,如果跑通了商业模式,增长速度很快,也有机会拿到投资,进一步验证了“资本只是锦上添花”。经常看到很多产品发 PR 稿晒 MRR,也是一种曝光自己吸引资本注意力的策略。独立开发者或小团队,需要对资本祛魅。专注迭代产品,持续商业化,如果能自己造血,就不需要用资本做杠杆。打铁还需自身硬,自己有实力了,才能邂逅更多的有缘人。流量为王,持续构建影响力我辞职之后,就坚持在社交平台输出内容。虽然没有刻意打造个人 IP,但也积累了一些影响力。社交平台的关注和流量,为我推广或售卖自己的产品,带来了很大的便利。比如去年圣诞节,我第一次以预售的方式推广新产品,短时间内很多用户支持,给了我很大的惊喜。现在流行超级个体、一人公司。对于独立开发者或小团队,应该积极经营社交账号,输出高质量的内容,积累影响力,形成流量池。流量变现的方式很多种,内容利他性很关键。做产品最重要的是开心最后一点感悟就是我个人的人生信条了:做产品最重要的是开心。我每天辗转于各个咖啡馆,出国旅游时也带着电脑,Coding Anywhere。我有时候也焦虑、迷茫,但整体上是开心的,持续创作是快乐源泉。AI 应用出海,可复制的一些经验讲了很多个人感悟,也讲一些实际的、可复制的经验,给想做 AI 应用出海的朋友一些参考。AI 应用开发 SOP工欲善其事,必先利其器。我做产品快,主要是因为我通过多个项目实践,积累了 SOP,第一次做 AI 应用出海的朋友,可以参考这个流程:技术栈和依赖项都比较简单,主要包括:开发基础:typescript / react / nextjs登录注册:next-auth / clerk数据存储:supabase / neon多语言:i18n / next-intl支付:stripe / lemonsqueezy / creem文件存储:s3 / r2项目部署:cloudflare / vercel域名管理:godaddy / namecheap我也在做一个全栈开发社群,在社群分享了一些我做过的项目,帮助群友们学习全栈开发技能、加入 AI 应用出海行列。如果你感兴趣,可以在浏览器打开:1024.is 详细了解。做产品需要从实践中积累足够多的经验和认知、不断打磨自己的 SOP,才能做到 Ship Fast, Ship More.一小时快速上线可以造轮子,也要用好轮子。要做到一小时快速上线一个 AI 应用,有很多方式可以实现。比如可以选择一个熟悉的全栈开发框架,减少编码工作。常用的 Web 全栈开发框架包括 NextJS / Remix / Nuxt 等。比如可以选择一个项目模板,快速集成基础功能。开源的模板包括 OpenSaaS / saas-starter 等,开箱即用。我之前做过的 AI 应用,有一部分开源在 github.com/all-in-aigc,有需要你也可以使用。你也可以选择一些商业模版,比如 ShipAny / ShipFast / MkSaaS 等。商业模版的好处是除了提供大量的基础功能和业务组件之外,还配备使用文档,帮助开发者快速开发自己的项目,少走一些弯路。另外,在开发 AI 应用时,我们也会经常用到一些 UI 组件库,比如 Shadcn / MagicUI / HeroUI 等。造轮子是一种追求,用好轮子是一种本事。好的轮子能让你省心,事半功倍。ProductHunt 打榜ProductHunt 打榜是产品冷启动最快的方式。我去年做的 ThinkAny 在上线第三天发布到 ProductHunt 打榜,拿到了日榜第四的成绩,后面被一些 Youtube、Tiktok 大 v 自发宣传,吸引了大量关注。ProductHunt 打榜讲究一定的策略,一般需要提前提交产品,设置好定时发布时间。在发布时间到来之前,你需要经常登录 ProductHunt 网站查看你的产品有没有被标记为 Featured,如果没有,你可以选择发邮件或者在 Twitter 上艾特 ProductHunt 官方账号,争取被 Featured。只有被 Featured 的产品,才有机会参与打榜。如果你的产品被 Featured,在发布当天你可以通过微信群、朋友圈、社交媒体等渠道号召投票。如果你希望进入榜单前几名的确定性更高一些,可以选择买量冲榜的方式,有一些第三方的渠道专门做这一块业务。ProductHunt 打榜是一种有效的产品 PR 手段,可以提升产品的品牌知名度和全球影响力。程序化 SEOSEO 是成本最低、见效最快的增长手段。我不是 SEO 专家,稍微懂点 SEO 技巧。MCP.so 这个网站我靠程序化 SEO 拿到了谷歌 MCP 关键词搜索第一。程序化 SEO 的 SOP 很简单:数据采集 + 清洗AI 摘要 + 结构化内容服务端渲染 + 清晰的网页结构为长尾关键词自动构建页面定时更新 sitemapSEO 是一个长期主义的事情,很难立马见效,需要一定时间的积累和投入。有钱的团队可以选择投广告,没钱的独立开发者只能持续迭代,静待花开。如果你想学习 SEO,可以了解一下“哥飞的朋友们”社群,我在群里耳濡目染几个月,收获很多。AI Wrapper 指南套壳追热点,打造现金流。我认识很多独立开发者,正在干着很多人看不上,看到了都说“真香”的事情。这件事情叫:AI Wrapper,通俗一点的说法是:套壳。SOP 很简单,主要步骤是:发现热点:hf space + google trends + github trending抢注域名:namecheap + godaddy上线网站:vibe coding + 代码模板 + AI 能力(replicate、fal、openrouter)获取流量:seo + 社媒宣传流量变现:付费订阅 + 谷歌广告虽然这种项目没什么技术含量,也没有特别大的商业前景。却是很适合独立开发者的一个方向,短平快的模式能够快速积累现金🐂,先吃饱才有力气谈梦想。AI 大时代,可以 all in 的几个方向结合我看到的一些产品和观察到的行业趋势,给出几个我认为的可以 all in 的 AI 创业方向。AI CodingAI Coding 是目前商业化跑得最好的 AI 应用场景。去年下半年,Cursor、Bolt 等产品持续领跑 AI Coding 赛道。用户增长迅速、营收屡创新高。在大模型行业商业前景不明朗的共识之下,AI Coding 跑通了商业模式,增加了行业对 AI 应用的信心,也让这个赛道成为了香饽饽,各类产品涌现。目前 AI Coding 产品主要分为四类:Coding Editor,AI 编辑器,代表产品包括 Cursor、Windsurf 等Coding Copilot,AI 编程助手,以插件的形式存在,代表产品包括 Cline、Github Copilot、augmentcode 等Coding Agent,编程智能体,代表产品包括 Bolt、Lovable、v0 等Vertical Coding Agent,垂类编程智能体,代表产品包括 Same、Wegic 等对于独立开发者或小团队而言,应该避开主要的战场,选择从小的场景切入,比如 CopyWeb 主要做网页复刻、Wegic 主要做 Landing Page 生成。Same 是从网页复刻起家,慢慢转型做全场景 Coding Agent。AgentAgent 是目前最主流的 AI 产品形态。Manus 开启了一种新的产品交互范式,掀起了 Agent 开发热潮。目前 Agent 赛道主要分为两大类:通用 Agent 和垂直 Agent。大公司,或者明星团队,一般选择做通用 Agent。代表产品包括:Manus、Genspark、Minimax Agent、扣子空间等。也有一些团队选择从垂直领域切入,比如 Lovart 是设计 Agent,iMean 是旅行规划 Agent,ClipClap 是营销视频生成 Agent。对于独立开发者或小团队而言,也许可以从垂直场景切入,选择一个有需求的小场景,用 Agent 的形式改造原来的 SaaS 产品,给用户一种新的交互体验,可能会带来新的增长。Agent Infra卖铲子永远是一个好方向。今年 Agent 创业非常火,看到一个说法:所有的 SaaS 产品,都值得用 Agent 重新做一遍。淘金的人越多,对铲子的需求就越大。所以面向 Agent 开发做基础设施是一个可行的方向。Agent Infra 包括:Tools 工具Planning 规划调度Memory 记忆存储Boilerplate 业务模板VM / Container 虚拟容器Auth 登录鉴权Payment 支付收款如果你擅长其中的某几项,不妨一试。我目前在做的事情包括:MCP.so,为 Agent 开发提供工具ShipAny,为 Coding 类 Agent 提供模板K8S 基建,为 Agent 任务可视化提供容器MCPMCP 是 AI 高速发展三年以来,最大的平台型机会。围绕 MCP,有很多可以做的方向。比如:MCP 服务器互联网 2.0 时代,API 是对外开放数据或服务的最佳方式。AI 互联网时代,MCP 逐渐成为新的开放标准。作为独立开发者,我们可以把自己做的 SaaS 产品,尽早以 MCP 服务器的形式开放,支持 MCP 的消费终端(chatbot、智能体等)在迅速发展,意味着我们开放的能力可以被更多的产品集成,一定程度上也能增加 SaaS 产品的 tob 收入。MCP 应用市场MCP 服务器数量在急速增长,对 MCP 服务器的管理和分发是一个大的需求。最近 MCP 官方推出了 dxt 扩展分发方式,进一步降低了用户侧的使用门槛。MCP 应用市场是一个很大的机会,也许我们能做出一个 AI 时代的豌豆荚。MCP 服务路由平台参考 OpenRouter、硅基流动之类的大模型路由平台,我们可以做一个 MCP 服务器路由平台,面向智能体提供原子能力。商业模式很简单,就是中间商赚差价,竞争壁垒在于供应链的整合。MCP 消费终端MCP 消费终端包括 chatbot、智能体,是最贴近用户的一类产品,市场规模很大。国内有很多优秀的独立开发者或小团队,在 chatbot 领域做出了非常不错的成绩,代表产品包括:ChatWise、ChatBox、Cherry Studio、DeepChat、LobeChat 等。以上围绕 MCP 的生态系统,是我最近投入的主方向。如果你看好 MCP.so,欢迎你参与共建。总结AI 一年,人间十年。AI 发展很快,行业仍在早期。新的时代有新的机会,独立开发也能影响全球。

idoubi·产品经验