网站搜索

Stability AI 的文本到图像模型抵达 AWS 生态系统


想要大规模创建逼真的图像吗? AWS Bedrock 为开发人员添加了 Stability AI 的最佳模型。了解这一突破如何改变您的视觉内容策略。

这是一个工具箱的故事。 AWS Bedrock 是一个 AI 工具箱,它加载了 Stability AI 的一些新的强大工具。我们首先讨论工具箱,然后我们将了解开发人员在构建应用程序时可以使用的新强大工具。

TL;DR:开发人员现在可以在其基于 Bedrock 的应用程序中调用文本到图像功能。这意味着他们可以轻松地将人工智能生成的图像合并到自己的代码中。

AWS(Amazon Web Services)是亚马逊强大的云服务。该公司在庞大的 AWS 保护伞内提供广泛的服务和功能。需要了解的关键一点是,所有服务都是按需且可扩展的。这意味着您不必在开始部署应用程序之前在一堆服务器机架中构建数据中心和叉车。

AI 选择的基石

在我们的故事中,如果您想在代码中融入强大的 AI 功能,您不必从头开始开发这些功能,训练 AI 大语言模型 (LLM),甚至不需要弄清楚您需要什么服务器配置。会需要。您所需要做的就是输入您的信用卡号码,阅读一些文档,然后开始编写代码。

在云服务出现之前,我就创建了第一家互联网公司。相信我,与自己构建服务器基础设施相比,AWS 之类的东西是一个巨大而惊人的游戏规则改变者,特别是对于致力于初创公司预算的创始人来说。

AWS Bedrock 是 Amazon 的大型语言模型按需 (LLMoD) 产品。这些法学硕士被称为基础模型。 AWS Bedrock 提供来自 AI21 Labs、Anthropic、Cohere、Meta、Mistral AI 和 Amazon 的基础模型。

这对于开发人员来说非常强大,因为他们不必实现这些模型。他们只需要学习与他们交谈的协议,然后使用它们,即用即付。

但是像这样的服务还有另一个巨大的好处:您可以尝试不同的模型,看看什么最适合您的应用程序。如果您必须构建自己的基础架构,然后设置和配置每个模型,您可能只会选择一个并接受它,因为切换工作太耗时且压力太大。

但使用 Bedrock,您只需切换一些参数,然后就可以开始比赛并测试不同的基础模型。它既简单又快速,为您提供了一种比较和对比正在运行的人工智能解决方案的方法,而不是仅仅根据规格列表进行猜测。

图像生成选择的稳定性 AI

本公告是关于 Stability AI 在 AWS Bedrock 工具箱中添加三个新的强大工具。这些模型均采用文本提示并生成图像,但它们的整体功能有所不同。

  • Stable Image Ultra 擅长创建高品质、逼真的输出。它用于需要高分辨率和精细细节的项目,例如高端营销活动。
  • Stable Diffusion 3 Large (SD3 Large):该模型擅长快速生成大量图像。这些图像通常质量很高,但它们不会成为精美杂志传播的主要图像。相反,他们更有可能推出大量游戏资产或目录条目或任何需要大量图像的内容,并且速度快且质量好。
  • 稳定图像核心:这是预算选项。它可以创建漂亮的图像,但没有超高细节。它也很快。

您可以在这里看到工具类比的适用性。当您打开工具箱时,您可以选择适合您的项目的电动工具。有时,您需要一把冲击钻;有时,您需要一把电动螺丝刀。同样,有时您需要一个能够生成极其详细的图形工具。其他时候,您只想要相当便宜和快速。

通过将所有三个模型添加到 Bedrock,亚马逊和 Stability AI 为开发人员提供了随时随地需要的选择。

这些可以怎么用呢?

让我们举一个例子。我的妻子经营一家与电子商务爱好相关的公司。每个月,她都会在社交媒体上发布一个主题,激励她的追随者创建一个项目。早在良好的文本到图像生成人工智能出现之前,我就使用 Photoshop 根据一些品牌资产为她创建了一个图像。我花了几个小时,而且图像从来都不是那么好。

但后来我得到了中途订阅。现在,她每个月都会给我主题,然后我写一个快速的中途提示。然后,她从四张或更多图像中选择最适合主题的一张。我不需要几个小时,而是几分钟。每个主题图像看起来都不像我粘贴的剪贴画,而是完美地代表了她的业务和主题。

然后,她拍摄这些图像,复制并粘贴它们,并将它们发布到社交媒体和她的网站上。

但是如果我们使用具有稳定扩散的基岩呢?我们可以直接从仪表板内向她的电子商务仪表板添加本月主题的功能。她只需输入提示,获取一些样本,然后单击即可将这些图像发布到她的网站上。该流程将全部集成到她的仪表板工作流程中。

进行这种集成不需要大量的人工智能理论和实践。它所需要的只是从她当前的仪表板到 Bedrock 的一系列 API 调用,并处理从这些调用返回的图像资产。人工智能任务可以直接集成到她的垂直应用程序的其余部分中,专门针对她的业务进行调整。

所以,这就是潜力。想想媒体和娱乐领域,营销人员可以快速制作营销资产;零售业,经理可以快速制作逼真的产品视觉效果;广告,需要相当快速、轻松地创建具有丰富细节的高端图像;以及游戏内设计,游戏设计师可以使用这些工具构建完整的资产库。

当然,有些人会认为这会淘汰艺术家并抢走工作岗位。毫无疑问,在某些应用中会出现这种情况。但反之亦然。我妻子的小企业永远不会聘请专门的艺术家。相反,我戴上了艺术总监的帽子(这是我当时作为一家小公司创始人所扮演的众多角色之一)并制作了相当平庸的图像。人工智能只是简单地提高了我们的游戏水平,同时节省了我们的时间。

对于许多企业来说,这是双赢的。

您可以在社交媒体上关注我的日常项目更新。请务必订阅我的每周更新时事通讯,并在 Twitter/X 上关注我:@DavidGewirtz、Facebook 上:Facebook.com/DavidGewirtz、Instagram 上:Instagram.com/DavidGewirtz 和 YouTube 上:YouTube.com/DavidGewirtzTV。