Gemini版Chrome新增「技能」功能:Google把AI提示词变成可复用资产,正面迎战Claude Skills
当AI助手开始从“回答问题”走向“记住你的做法”,产品竞争的重心也随之改变。Anthropic旗下Claude因支持将用户指令储存为“技能(Skills)”而受到欢迎,如今,Google也把这一能力带入Gemini版Chrome浏览器。Google近日发布声明称,Gemini版Chrome将推出“技能”功能,用户可将常用指令保存下来,在后续任务中快速调用,减少重复输入提示词的成本。
这项更新看似只是一次功能补强,实则反映出AI产品正在进入一个更现实的阶段:从“会不会聊天”,转向“能不能稳定地帮你做事”。对浏览器而言,这意味着AI不再只是页面旁边的问答框,而开始成为跨标签页、跨任务流的工作层。对用户而言,技能功能的价值也并不玄妙,它解决的是一个非常具体的问题——同样的操作,不想一遍又一遍地重复说明。
Google表示,在Gemini版Chrome中,用户只需输入斜线“/”或点击加号“+”按钮,即可选择已保存的技能。技能会在用户当前浏览的页面,以及所选的其他标签页中运行。用户还可以随时编辑已保存的技能,或者创建新的技能。Google同时给出了几个典型场景,包括健康与保健领域中快速计算食谱蛋白质含量、购物场景中在多个标签页中生成并排规格对比,以及效率提升场景下扫描冗长文件、提取关键信息。
与此同时,Google还将推出一个技能库,内含Google官方提供的技能。用户可以将这些技能加入收藏夹并试用,也可以根据自身需求进行修改。对普通用户来说,这意味着学习门槛会比“自己从零编写一套流程”低得多;对产品层面而言,这意味着Google正在尝试把AI工作流标准化、模块化,让更多能力以“可调用资源”的形式沉淀下来。
目前,Gemini版Chrome的技能功能正在向Mac、Windows和ChromeOS上的部分用户推出,前提是Chrome语言设置为英文(美国)。这一限制说明,该功能仍处于渐进式上线阶段,Google在控制范围、收集反馈和优化稳定性方面显然还有进一步动作。
从产品逻辑看,技能功能并不是一个孤立的小按钮,而是AI浏览器竞争中的关键一步。浏览器天然是信息入口,也是任务入口:查资料、比价格、读文档、做表格、跨站点整理信息,这些都发生在标签页之间。过去,用户在浏览器里完成任务,靠的是手动切换、复制粘贴和不断重复提示;而一旦技能被嵌入浏览器,AI就不只是“回答问题”,而是直接参与任务结构本身。
这也是Claude Skills先引发关注的原因。它所代表的,不只是“能记住指令”,而是把用户的操作习惯转化成可复用的工作单元。换句话说,用户不再每次都对AI说“先帮我比较三款产品,再列出优缺点,再总结成表格”,而是把这套流程沉淀成一个技能。下一次,只需要一句触发词,就能把过去反复解释的任务直接唤起。
从传播学视角看,这种变化改变了用户与AI之间的关系。早期的大模型更像“临时记者”,你每次提问都要重新交代背景;而技能功能让AI更像“熟悉剪辑习惯的助理”,它开始记住你的工作方法,并以更少的沟通成本完成更接近个人风格的任务。AI产品的竞争,因此从“谁更聪明”转向“谁更懂你的流程”。
在实际应用中,技能功能的优势主要体现在三个层面。第一是重复劳动的压缩。很多人使用AI时,最耗时的并不是思考本身,而是重复描述任务要求。比如同一个文档摘要模板、同一种商品比较逻辑、同一类数据提取规则,一旦被保存成技能,就能节约大量前置沟通成本。第二是任务一致性的提升。人类在重复输入指令时容易出现表达偏差,而技能可以固定方法,减少输出波动。第三是多标签页协同。Google强调技能可以在当前页面和其他选定标签页中运行,这意味着它并非只针对单页问答,而是在更接近真实工作流的场景中生效。
以购物场景为例,用户通常会在多个电商页面之间反复切换,比较价格、参数、促销条件和售后政策。过去这一过程依赖人工整理,信息容易遗漏;现在如果把“并排规格对比”设为技能,用户只需调用一次,AI就能按照既定模板对多个页面进行整理。再比如健康与保健场景,食谱的营养计算原本需要用户自己查表、换算和核对,而技能可以把这类重复流程固化下来,使AI在浏览网页内容时直接提取并计算蛋白质含量。对于阅读长文档的场景,技能则可以把“先抓重点、再提风险、最后输出摘要”的方法变成固定动作,从而更适合办公环境中的高频需求。
不过,技能功能的意义并不只在于“省事”,更在于它标志着AI产品开始争夺用户工作流中的长期位置。一次性问答很容易被替代,但一旦用户把自己的工作习惯、判断标准和操作路径沉淀进技能库,迁移成本就会显著提高。平台不仅提供模型能力,还在提供“方法资产”。这意味着未来的竞争,不只是模型参数和推理速度,也包括谁能更好地承载用户的个人知识结构。
从行业趋势看,Google此时推出Gemini版Chrome技能功能,具有明显的对标意味。Claude在“可保存指令”上的体验已经获得市场正反馈,而Google作为浏览器和搜索入口的掌控者,显然不可能让这类高频功能长期由竞争对手建立心智。Chrome本身就是全球最重要的浏览器入口之一,Gemini又是Google押注的重要AI产品,把技能放进浏览器,等于把AI能力嵌入用户每天最常打开的场景,直接提高使用频率和粘性。
但这一功能是否会迅速形成规模,还取决于几个现实问题。首先是语言和地区限制。当前仅向将Chrome语言设为英文(美国)的Mac、Windows和ChromeOS用户推出,说明它仍处于较早阶段。其次是技能的易用性。真正能被广泛采用的功能,往往不是最复杂的,而是最简单、最稳定、最接近用户直觉的。用户愿不愿意花时间创建和维护技能,决定了它能否从“展示型功能”变成“日常工具”。
另一个关键点在于权限和边界。技能能访问哪些页面信息,能否跨标签页调用内容,是否会影响用户隐私,这些都会成为外界关注的焦点。浏览器里的AI能力天然接近用户真实信息资产,它既能提高效率,也更容易触及敏感内容。因此,Google在推广这项功能时,除了展示效率收益,也必须在安全、透明和控制权方面给出足够明确的说明。
如果从更长远的角度观察,这类“技能”功能的流行,可能意味着AI产品形态正在发生一次轻量但深刻的转向。过去,用户追求的是模型回答得是否准确;现在,用户开始要求模型能否记住方法、复用流程、组织任务。所谓“智能”,不再只体现为一次性生成的内容质量,而是体现在长期协作中的稳定性与可迁移性。
这也是为什么浏览器成为关键战场。浏览器不是单纯的信息阅读器,它是现代数字生活的任务中枢。工作文档、购物比价、信息检索、内容整理、表格汇总,几乎所有高频操作都在浏览器中完成。谁能在浏览器里提供更顺手的AI工作流,谁就更接近用户的真实使用场景。Google将技能嵌入Gemini版Chrome,本质上是在把AI从“外挂能力”变成“原生能力”。
从用户体验角度,这种原生化的价值在于减少中断。人们不希望在完成一项任务时不断离开当前页面去重新组织提示词,也不希望每次都从头解释上下文。技能让用户可以把常见需求封装成固定动作,再以更轻的方式反复调用。对个人用户而言,这是效率工具;对企业和内容工作者而言,这是可复制的流程模块;对平台而言,这是生态锁定的入口。
同时也应看到,技能并不会立刻消除人类与AI协作中的所有摩擦。技能越多,管理越重要;流程越复杂,维护成本也会增加。用户可能需要面对技能命名、版本更新、适用场景判断等一系列问题。换句话说,技能功能解决的是“重复输入”的问题,但并不自动解决“任务设计”本身的复杂性。一个设计良好的技能,仍然依赖用户对自身工作流的清晰理解。
从这个意义上说,Google这次更新更像是一次明确的方向宣示:AI浏览器的下一个阶段,不是谁能写出更长的回答,而是谁能把用户的高频动作变成最少步骤的可复用流程。Claude已经用Skills证明了这一点,而Google选择在Gemini版Chrome中快速补上,说明这场竞争已经从模型层面延伸到了使用层面。
对于普通用户而言,技能功能最直观的价值是省时间;对于行业而言,它代表的是AI产品从“生成内容”向“组织行为”迈进。今天被保存下来的,可能只是一个食谱蛋白质计算、一次商品规格对比,或是一段长文档摘要;但这些微小动作背后,折射出的却是AI与浏览器融合后更大的变化——用户的工作习惯正在被软件重新编码。
当一项功能可以把“我每次都要说一遍”变成“我只需要调用一次”,它就不只是效率优化,而是在重塑人与工具之间的分工。Google这次把技能放进Gemini版Chrome,既是在回应市场,也是在提前布局一个更深层的问题:未来的浏览器,究竟是用来打开网页,还是用来组织我们的数字生活?
在这个问题上,Claude和Gemini的竞争只是开始。真正值得观察的,是接下来谁能把“技能”做成更自然的工作方式,谁能让AI不再只是回答你的话,而是记住你做事的节奏。
在这个万物皆可 Token 化的时代,技术的迭代往往比镜头切换更快。作为一名广播电视编导专业的毕业生,我始终尝试在流动的影像与加密的算法之间寻找平衡。感谢阅读,我是王森涛,让我们在区块链的视听宇宙中保持清醒,持续探索