我尝试了 Google 的 Pixel Screenshots,这就是我想要的 AI 功能的一切
它不会将我无聊的办公室背景变成一片花田,但能够轻松解析数百张屏幕截图感觉像是一个重大胜利。
根据我手机上的图库应用程序,我保存了 361 张屏幕截图,包括帐单、重要日期、模因以及我一直想重新访问但不相信我的浏览器会添加书签的网络文章。如果您要求我在相册中查找特定图像,您必须给我一分钟的时间。也许更长。
理论上,谷歌新的像素屏幕截图功能应该会加快这一过程。现在,我只需输入关键字或问题,例如“联合爱迪生公司九月账单”或“下周的足球比赛在哪个体育场举行?”手机将填充最相关的屏幕截图。它的作用就像魔术一样。或者,我应该说,它的工作原理就像人工智能一样。
Pixel Screenshots 的人工智能部分比新定义更符合我所说的“旧定义”,这意味着它更多地与自动化后端处理有关,而不是内容生成。您不是在这里重新定义图片、创建新的表情符号或生成图像标题;而是创建新的表情符号。相反,Pixel 9 的 Gemini Nano 会从屏幕截图中提取尽可能多的信息,进行存储,然后在出现提示时检索它。
整个像素屏幕截图过程都在设备上进行,因此使用该功能时不会涉及互联网及其所有危险。谷歌告诉我,出于安全和隐私原因,它计划保持这种方式(阅读:该公司希望避免类似于微软召回失败的情况),我很高兴它是这样的。
除了截屏比我应该做的更多的事情之外——因为同时按下两个按钮比下载完整的网页或在记事本中保存 URL 容易得多——我通常不会考虑多少个人信息最终被捕获在框架中。浏览一下我手机的屏幕截图相册,就会发现家庭住址、亲密朋友和家人的用户名、联系电话以及其他我不想落入坏人手中的小玩意儿的信息。我离题了。
从我对 Pixel Screenshots 的简短演示中,我印象最深的是三件事:手机提取图像结果的速度(因为这一切都在本地工作)、上传和捕获更多图像以供将来检索的能力,以及该功能如何与自然行为无缝配合。最后一点,您不必特意标记或手动传输屏幕截图即可使该功能正常工作;您捕获的所有内容都会自动流入专用应用程序。
一些更精细的细节告诉我,Pixel Screenshots 投入了多少心思,例如能够在 Chrome 或 YouTube 上快速启动捕获图像的 URL,以及在您最初对某些内容进行屏幕截图时设置提醒的选项。这感觉不仅仅是一个归档功能;它可能会改变我们互动和为数字内容添加书签的方式。
当智能手机制造商花更多的时间来推销人工智能功能而不是相机硬件时,Pixel Screenshots 是一个罕见的赢家。我几乎被谷歌的人工智能愿景所折服,这可能足以让我进入双子座的宇宙。