网站搜索

Google 的 Gems 是对 AI 提示工程的温和介绍


Google 的预构建 Gems 提供提示示例,您可以修改以开始使用您自己的自定义机器人。

快速工程已成为生成人工智能(Gen AI)时代重要的新技术技能之一。设计一个好的提示更像是一门艺术,而不是一门科学,它涉及精心设计正确的请求,让聊天机器人(例如 ChatGPT 或 Google 的 Gemini)执行您想要的操作。 

一个好的提示有时可以决定机器人输出的好坏和糟糕。 

谷歌 Gemini 大语言模型的一项新功能 Gems 于上周推出,提供了快速工程的速成课程。如果您花费大量时间使用 Gen AI 或打算广泛使用该技术,那么该功能值得一试。 

Gems 是您可以保存在 Gemini 仪表板中的重点聊天会话。他们应该帮助完成一些任务,比如集思广益制定公司战略、改善你的学习习惯或提高你的写作水平。 

Gems 类似于其他方法,让 Gen AI 用户制作提示并保存提示以供以后使用。例如,OpenAI 为第三方开发的 GPT 提供市场。 

您可以将 Gems 视为一种更基本的应用程序,可以根据您自己的目的进行构建。 

Gems 也类似于 ChatGPT 的自定义指令,这些指令是您在设置中保存的提示材料,ChatGPT 在响应时应该合并这些材料。两者之间的区别在于,自定义指令适用于 ChatGPT 的每个实例,而 Gems 指令则特定于单个 Gem。

Gems 可能适用于 Android 上 Google Gemini 移动应用的部分用户,但并非适用于所有用户。如果您没有看到 Gems,请访问 gemini.google.com。 Gems 尚未在 iPhone 和 iPad 的 iOS 应用程序上运行; Apple 用户必须在网络上使用 Gemini。

只有 Google Gemini Advanced 计划或商业版本的订阅者才能使用 Gems(起价为每月 19.99 美元,作为 Google One 订阅的一部分)。 

如果您要从头开始制作自己的 Gem,则首先要从 Gemini 侧边栏转到 Gem 管理器屏幕:

单击“新 Gem”并为您的 Gem 提供名称和/或描述,例如“法语导师”。然后,您将输入说明。这是重要的部分。你用指令告诉双子座这个 Gem 的功能应该是什么——例如“帮助我学习法语”——以及你想要如何继续,比如对话风格。这里没有提示,因此您正在尝试开发自己的提示风格:

不过,您可以通过使用 Google 在 Gems 管理器中提供的五个预构建 Gems 之一来获得一些提示:头脑风暴者、职业指南、编码伙伴、学习教练和写作编辑器: 

当您使用小“复制”图标复制任何这些 Gem 时,该复制操作会显示 Google 为 Gem 填写的所有说明。将其视为快速工程的模板,您可以从中进行构建。您可以将说明放在说明字段中,添加、删除或修改 Google 提供的样板文件。 

如果您以后想到更多提示元素,可以添加它们。只需返回侧边栏并返回 Gem 管理器屏幕,然后选择要编辑的 Gem 旁边的铅笔图标即可。

当您从侧边栏调用其中一个 Gems 时,您会根据提示开始输入内容,就像任何聊天体验一样。 

为了测试 Gems,我复制了 Brainstormer Gem 并尝试获取有关订阅技术新闻通讯的销售计划的帮助。我将其命名为“销售教练”,并编辑了 Google 的头脑风暴样板代码,用我的修改替换了提示文本。 

例如,对于提示的第一行“目的”,我插入了:“您的目的是指导我制定销售策略和策略。您将帮助我反思对特定潜在客户来说什么是有效的,什么是无效的”。我添加了几个要求,例如“解释每个提议的销售策略或策略背后的逻辑”。

完成所有修改后,我按下了“保存”按钮。

从那里,我与机器人进行了聊天。我解释了向特定潜在客户出售价值 30 美元的技术通讯订阅费的努力,该通讯将提供投资建议。我从提示开始:“我想制定一个计划,将我的订阅产品销售给潜在客户。” 

我与机器人进行了大约半个小时的多轮问答,其中包括来回起草一封给潜在客户的信,最后进行了角色扮演 Zoom 通话,其中宝石扮演了潜在客户的角色对销售说辞持怀疑态度。我还面临着输入令人信服的回应的挑战: 

《The Gem》评估了我作为销售人员的表现——“在应对犹豫不决的潜在客户所带来的挑战的同时,展示了对销售基础知识的良好掌握”——甚至提出了几个需要改进的方面:“你的沟通方式可以稍微温暖一些、更具吸引力一些。” ”。

作为一名职业销售人员,我不知道所有这些建议是否相当于良好的指导。它可能还达不到传奇教练的水平,比如华尔街之狼乔丹贝尔福特和他的直线系统。

尽管如此,这里似乎还是有一些价值的。如果您想返回并查看聊天会话,那么将整个聊天记录保存在侧边栏中是一个不错的选择。

经过练习后,一些限制变得非常明显。一是宝石虽然在半小时的交流中语气保持一致,但不会回到之前的点,只会向前移动。在真正的辅导课程中,教练应该能够将后面的对话与前面的对话联系起来。 

我还认为这种情绪对于协作活动来说是正确的,例如在生日聚会上集思广益或制作简历。

在我看来,这种限制是大型语言模型的一个普遍问题。该模型可能需要更有效地使用上下文窗口,即之前在交换中键入的所有内容。我怀疑这是一个工程挑战,需要进一步开发底层的 Gemini 模型。

其次,Gem 似乎依赖于其非常普遍的销售知识,这些知识来自用于开发 Gemini 的任何培训数据。对于这些重点用例,我怀疑 Gem 应用程序可以受益于检索增强生成 (RAG),这是一种日益流行的 Gen AI 技术,其中 AI 模型可以接入外部数据库。这种方法可能会让 Gem 获得更多资源来获取特定领域的销售知识。

第三,底层过程可能会受益于以句子形式存储简单的背景知识,这是 OpenAI 在其“记忆”功能中提供的功能。以这种方式存储背景知识意味着某人可以使用 Gem,而无需在每次聊天时重新发明东西。 

例如,如果您是一名销售人员,您应该能够存储背景信息,例如“我以 30 美元的价格出售一份订阅技术新闻通讯”,并让 Gem 在您每次聊天时自动合并该事实。

这让我想到了第四个也是最明显的遗漏——宝石没有过去谈话的记录。尽管存储了与 Gem 的每次聊天记录,但每次使用时 Gem 本身都会开始空白。您不能要求 Gem 探索先前会话中的某些内容,因为它不再是 Gem 上下文窗口的一部分,因为它已经成为过去。 

如果你想一次又一次地返回使用宝石,那就是一个很大的赤字。例如,如果您想要另一次辅导课程,您应该能够探索之前辅导课程中出现的问题,并在交流的基础上进行改进,作为一个附加过程,而不是从头开始。 

想象一下,现实世界中有一位教练——任何类型的教练,销售、健身、冰球等等——他从来不记得你在漫长的进步之旅中最后离开的地方。你可能会寻找一位更专注、更有记忆力的教练。

尽管存在这些缺点,Gems 仍然具有让用户快速掌握即时工程基础知识的价值。对于不知道即时工程存在的通才观众来说,这种功能非常有用。