网站搜索

这个新的 Google AI 工具可让您轻松从其他照片生成图像 - 无需提示


它是免费使用的,可以让您避免编写又长又详细的提示的麻烦。

撰写正确的提示和描述来创建人工智能生成的图像可能具有挑战性。通常,生成的图像会偏离目标,迫使您反复调整提示,直到获得正确的结果。现在,谷歌推出了一款新工具,旨在简化该过程,允许您根据其他图像创建图像。

Whisk 最初在美国推出,是最新的 Google 实验室实验,任何拥有 Google 帐户的人都可以免费访问。它由 Google 的 Gemini AI 提供支持,并提供多种从其他图像创建图像的方法。

如何使用 Whisk 创建图像

首先,请使用您的 Google 帐户登录 Whisk 主页。选择三个模板之一来生成图像。您可以选择一个贴纸,它会创建类似于消息应用程序中的平面图像。珐琅别针为图像增加了一点深度,而毛绒玩具则产生了三维图像。

默认情况下,Whisk 会根据您选择的模板自动选择样式的图像。接下来,选择要用于主题的图像。您可以选择页面上提供的图像之一或上传您自己的图像。双子座分析图像的风格和主题,然后将它们组合起来生成新图像。如果您不喜欢结果,可以更改主题图像并生成不同的结果。

虽然这个过程听起来很简单,但您可以发挥更多创意。要获得更多控制,请选择从头开始的选项。在这里,您可以通过上传自己的图像或编写传统的提示来选择主题、场景和风格的图像。如果您不确定从哪里开始,您可以向 Whisk 寻求灵感,它会为您生成一系列图像。

准备好后,告诉 Whisk 根据组合的选择生成新图像。作为响应,Whisk 根据混合显示多个图像。您可以通过添加或删除源图像或编辑提示来优化结果。

您生成的所有图像都会自动保存到您的 Whisk 库中。从那里,您可以删除任何不需要的图像并下载您喜欢的图像。下载内容保存为 JPG 文件,以便您将其与其他应用程序和服务一起使用。

Google 如何实现这种类型的图像生成?

Whisk 没有复制源图像来创建新图像,而是提取了一些关键元素。

谷歌产品管理总监 Thomas Iljic 在周一发布的博客文章中写道:“在幕后,Gemini 模型会自动为图像编写详细的标题。然后,它将这些描述输入到谷歌最新的图像生成模型 Imagen 3 中。” 。 “这个过程捕捉了你的主题的本质,而不是精确的复制品。这样,你就可以轻松地以新颖的方式重新组合你的主题、场景和风格。”

因此,生成的人物图像可能具有与原始图像不同的身高、体重、发型或肤色。如果您想引导结果朝特定方向发展,Google 还允许您编辑底层提示。

“在我们对艺术家和创意人员的早期测试中,人们一直将 Whisk 描述为一种新型创意工具,而不是传统的图像编辑器,”Iljic 补充道。 “我们构建它是为了快速视觉探索,而不是像素完美的编辑。它以新的和创造性的方式探索想法,让您可以浏览数十个选项并下载您喜欢的选项。”

相关文章