网站搜索

Stability AI 的文本到图像模型抵达 AWS 生态系统

想要大规模创建逼真的图像吗? AWS Bedrock 为开发人员添加了 Stability AI 的最佳模型。了解这一突破如何改变您的视觉内容策略。

这是一个工具箱的故事。 AWS Bedrock 是一个 AI 工具箱,它加载了 Stability AI 的一些新的强大工具。我们首先

阅读更多 →

OpenAI 推出文本转视频模型,结果令人惊讶。你自己看看

好莱坞电影制片人,你可能想留意索拉。

Sora 生成的视频的静止帧。 OpenAI 的提示是:“相机正对着意大利布拉诺岛色彩缤纷的建筑。一只可爱的斑点狗透过一栋建筑底层的窗户往外看。很多人在建筑前的运河街道上散步和骑自行车。”

Open AI 已经分别通过 DALL-E 3 和 ChatGPT 在图像和文本生成

阅读更多 →

Android Auto 将如何使用人工智能来总结传入的文本对话

虽然该功能尚未上线,但谷歌现在正在分享一些有关隐私等方面的见解。

当三星 Galaxy S24 上个月推出时,它配备了人工智能驱动的功能,包括 Magic Editor、Circle to Search、实时语言翻译等。

与此同时,谷歌宣布了 Assistant 的几项新的人工智能功能,其中包括在连接到 Android Auto 时总结长消息和群聊的能力。

该功能尚未正式推出,但借助 Google 社区帮助页面上的新支持文档,我们可

阅读更多 →

谷歌新的无限注意力技术可让您将无限文本输入到法学硕士中

这项技术可以为令人着迷的人工智能实现铺平道路。

当今的大型语言模型 (LLM) 在给出结果之前对您可以输入的信息量有限制。谷歌推出了一种改变这种情况的方法:一种允许法学硕士接受无限量文本的方法。这项技术被称为“Infini-attention”,无需牺牲内存和计算能力,就能创造出更高效且具有潜在影响力的 LLM 结果。

“有效的记忆系统不仅对于理解法学硕士的长期背景至关重要,而且对于推理、计划、不断适应新知识,甚至对于学习如

阅读更多 →

长上下文窗口对于像 Gemini 这样的 AI 模型意味着什么?

如果您熟悉人工智能模型和聊天机器人,您可能听说过“上下文”一词的使用方式与您习惯的不同。这就是这意味着什么。

谷歌刚刚宣布将升级其 Gemini Advanced 服务,提供 100 万个上下文模型,很快就会跃升至 200 万个。

想象一下,你狂看一部电视剧,但一次只能记住一集。当您继续观看下一集时,您会立即忘记刚刚观看的所有内容。现在,想象一下您可以记住您看过的电视节目的每一集和每一季;这会让你理解故事、人物和曲折。 

在讨论人工智能 (AI) 模型时,一次只记住一个情节并在进入下一情节时被迫忘记它的能力代表了一个较短的上下文窗口。

阅读更多 →

Photoshop vs. Midjourney vs. DALL-E 3:只有一款 AI 图像生成器通过了我的 5 项测试

Photoshop 的 AI 如何对抗 DALL-E 和 Midjourney?我在涉及巨型机器人和未来场景的创造性冲突中测试他们的技能。

Photoshop AI提示:蒸汽朋克世界中的笔记本电脑(蒸汽朋克效果)

Adobe 本周发布的 AI 公告相当重要,尤其是 Illustrator 中基于 AI 的生成矢量功能。 Photoshop 进行了一系列小改进,但没有像今年年初宣布的生成填充功能那样改变游戏规则。

也就是说,Adobe 刚刚宣

阅读更多 →

TikTok母公司推出AI文本转视频生成工具

字节跳动的新应用程序通过在同一平台上生成图像和视频,比人工智能竞争对手领先一步。

字节跳动因创建广受欢迎(且颇具争议)的短视频应用程序 TikTok 而在美国闻名,该公司以其最新版本——极萌 AI 正式进军人工智能领域。 

正如路透社周二首次报道的那样,字节跳动旗下的 Faceu Technology 在 Apple App Store 上向中国用户推出了文本转图像和文本转视频生成器 Jimeng AI。据报道,该应用程序于 7 月 31 日在 Android 版

阅读更多 →

苹果新的人工智能模型根据用户的文字提示编辑照片

该公司还因 2023 年收购其他科技巨头中人工智能初创公司最多而成为新闻焦点。

Hugging Face 上的 MGIE 演示照片。 

苹果刚刚推出了一个开源人工智能模型,可以执行基于文本的图像编辑命令。该模型名为 MLLM 引导图像编辑 (MGIE),是与加州大学圣巴巴拉分校合作开发的。 

MGIE可以执行各种图像编辑任务,如裁剪、调整大小和旋转;以及亮度、色彩平衡和对比度的调整——所有这些都是按照用户的文本提示进行的。本周发表的一份会议论文概述了 MGIE 功能和性能的详细情况。 

阅读更多 →

有人会错误地指控您使用人工智能生成的文本吗?这可能就是为什么

如果您的母语不是英语,您应该知道 GPT 检测器对您有偏见。

人工智能(AI)在过去几个月中越来越受欢迎,但包括教育在内的一些领域仍然存在争议。这种担忧主要集中在学生使用生成式人工智能工具(例如 ChatGPT)完成工作(包括撰写论文或创建代码)的潜力。

一些教授允许在课堂上使用该技术,另一些教授则禁止,还有一些教授自行决定是否允许使用,其中可能包括审查所有学生使用 GPT 检测器的工作。 Patterns 最近发表的一篇经过同行评审的论文显示,研究人员发现,当文本由

阅读更多 →

Meta 推出新的文本转音乐人工智能工具,与谷歌竞争

有了人工智能,知道如何输入提示可能是生成歌曲所需的唯一技能。

人工智能已经慢慢渗透到音乐行业,创造出病毒式传播的歌曲,让我们最喜欢的歌手的声音起死回生,甚至有资格获得格莱美奖(某种程度上)。 Meta 发布了新的人工智能工具,这将使使用人工智能生成音乐变得更加容易。

周二,Meta 发布了 AudioCraft,这是一套生成式 AI 模型,据 Meta 称,可以从文本中创建“高质量且逼真”的音乐。

阅读更多 →