网站搜索

就连 Nvidia 的 CEO 也对 Google 的 NotebookLM AI 工具着迷


Luma AI 声称其 Photon 图像创建器比目前可用的任何同类模型都要快。

生成人工智能图像模型的列表不断增长。

周一,人工智能公司 Luma 发布了其新的文本到图像模型 Photon。该模型面向设计师和创意人员,以 Luma 的 Dream Machine 视频生成器为基础,让用户可以根据上传的图像创建短视频剪辑。

与 Dream Machine 一样,Photon 是为所有人设计的,目标是那些“在我们周围构建世界的人,从设计师、电影制作人、视觉思想家到小型企业和教育工作者”,该新闻稿解释道。这包括从时尚到建筑的所有用例。 

Photon 具有多图像输出和清晰的文本渲染功能,建立在 Luma 定制的 Universal Transformer 架构之上,该公司声称该架构使其“比其他同类型号更快、更便宜 800%”。与类似的生成器一样,用户可以随时调整提示并编辑和自定义生成的图像。 

Luma 还宣布了 Photon API,可能会在 2024 年底之前发布。可扩展的 API 将允许开发人员创建文本到图像和图像到图像的内容。

a16z 普通合伙人 Anjney Midha 表示:“Luma AI 的真正魔力在于成为每个创作者独特创意 DNA 的家园——他们的参考、他们的风格、他们的历史——而 Dream Machine 则随着每个用户的创意之旅而学习和发展。” Luma AI 董事会成员在新闻稿中表示。 

Luma 希望用户将 Dream Machine 和 Photon 视为真正的创意合作者,能够理解用户的独特背景和需求。其中一项功能允许用户上传一个人的照片,并创建一个可重复使用的“角色”,Photon 可以在多个单图像场景中描绘该“角色”,这是头脑风暴活动的理想工具。用户可以上传该人的肖像,并在提示中包含“@character”以激活该功能。 

然而,在 ZDNET 的演示中,Photon 在为某些位置的角色渲染自然表情时似乎遇到了一些问题,这立即让人想起了对深度伪造和其他潜在滥用的担忧。 

Luma 的使用指南包括有关内容审核的注释,表明该公司将删除某些生成的图像。  

值得注意的是,Luma 表示 Photon 的输入和输出数据不用于训练该公司的模型。当在演示期间被问及 Luma 的训练数据集时,首席执行官 Amit Jain 表示,他无法透露其中包含哪些内容,以及是否包含从互联网上抓取的材料或许可内容。 

就版权问题而言,指南有点模糊。该公司要求用户“不要请求或生成侵犯版权或商标材料的内容”并且“始终尊重知识产权”。 

最后,该公司还推出了 Dream Machine 的新界面,现已在网络和 iOS 上提供。据该公司称,它可以与自然语言一起使用:无需学习如何成为一名更好的提示工程师。 

新界面易于使用,让人想起其他生成器,它们可以识别提示中的关键描述符,并提供类似替代方案的下拉菜单,以防您想修改您的想法或探索不同的变化。该服务面向任何想要探索设计概念、迭代产品创意、集思广益以及通过 Luma 方便的情绪板基础设施与团队成员协作的用户。 

“视觉人工智能服务”还提供图像和视频的个性化功能,以及免费和付费订阅层,每月 10 美元起。 

相关文章