iOS 17 的 Safari、Poe 免费模型、Pixel 8 的相机

文章正文
发布时间:2023-06-18 16:38

与此前「iPad Power User」内容框架不同,「Digital Explorer」的内容不再以流程、应用、系统、硬件进行划分,而是以场景作为切入点。一如我在之前多期会员通讯以及生产力相关的电子书里所言,对于绝大多数人来说,我们使用数字工具——包括但不限于智能手机、平板电脑、笔记本——的时候,大致分为以下三个场景:

· 信息消费:这可能是最常见的场景,比如我们现在已经将大量时间用于消费短视频,这个场景里,我们重点探讨如何优化信息消费,减少注意力的浪费;

· 信息加工:从文件管理到笔记整理,从任务规划到项目设计,这个场景会涵盖一系列整理、加工信息的流程和应用;

· 信息创造:无论是拍摄、编辑短视频还是撰写一封会员通讯(比如现在这封),都是围绕信息的创造行为;

基于上述三个场景,每期的「Digital Explorer」将结合最近的应用更新、新发现的应用,以及系统新特性或硬件新功能,提炼出一系列技巧或流程,旨在帮助包括我在内的所有「信息工人」更好提升信息处理的效率。

需要提醒的是,鉴于我个人能力有限,这份邮件通讯不可能覆盖每一个人的信息处理需求,如果各位读者有自己的想法、观点或技巧,欢迎随时发邮件给我(zhaosaipo@gmail.com)。而在接下来的日子里,我会在自己有限的能力范围内,通过整理自己的发现和实践,努力构建起一个高效处理信息的工具箱。

接下来,欢迎和我开启本周的数字工具探索之旅。

信息消费 社交媒体

iOS 上的微信上周更新到 8.0.38 版本,更新日志依然非常简洁:解决了一些已知问题。不过实际使用中,会发现几个值得关注的变化:

· 聊天时发送照片的大小,已经不再限制于 25M,最大支持到 1GB 照片的发送;

· 朋友圈状态的「置顶」功能还在灰度测试中,感兴趣的朋友可以通过点按任何一条自己的朋友圈状态,看看「修改可见范围」的选项部分里是否有「置顶」选项;

你可以在 App Store 更新微信。

如果你经常在移动设备上浏览 Reddit,那么一定听过或用过其第三方客户端 Apollo,但到本月底,Apollo 将因为无法支付 Reddit 高昂的 API 调取费用而关闭。

Reddit 上调 API 费用的导火索是包括 OpenAI 在内的众多大模型公司,都会将 Rediit 社区里的内容作为训练大语言模型的语料,此前很长一段时间,Reddit 的 API 调取费用非常便宜,这也使得围绕 Reddit 的第三方开发非常活跃,Apollo 就是其中最具代表性的产品。

但随着 OpenAI 的走红,Reddit 开始考虑提高 API 调取费用,这当然是为了彰显 Reddit 社区的数据价值,但此举也让大量 Reddit 第三方开发者无法承受,根据 Apollo 开发者提供的数字:

他们给出的价格是每1,000个API调用0.24美元。我迅速将其输入我的应用程序中,并发现它与Twitter极高的API价格相差不大,为12,000美元,根据我的当前使用情况,每月将花费近 200 万美元或每年超过 2000 万美元。这不是夸张,只是将上个月Apollo进行的70亿次请求乘以每次请求的价格而已。

这起事件还在持续发酵中,未来或许还有众多变数,但从 Twitter 到 Reddit,越来越多 Web 2.0 时代的社交媒体变成了「围墙花园」。

浏览器

iOS 17 为 Safari 增加了多项功能,比如:

· 当开启浏览器无痕浏览时,支持调用 FaceID 或指纹进行保护,开启后,用户每一次访问都需要解锁才能继续浏览;

· 允许用户建立「个人资料」,不同资料之间的历史记录、浏览器扩展、Cookies 等都会隔离;

除此之外,我在使用了近一周之后也有一些发现,比如大幅优化的「网页翻译」功能,翻译速度极快,而且质量也不错,让我怀疑这个功能背后也有Transformer 模型的加持。

再比如,一个有趣的功能点「听取网页」,调用 Siri 的声音直接阅读网页上的内容,非常方便:

还有一个值得尝试的功能,当用户在无痕模式浏览网页时,苹果会识别某些 URL 里的跟踪参数(比如某些邮件服务商的追踪参数),并会自动删除这些参数,以进一步保护用户隐私。

最近还有两个浏览器更新的消息:

· 微软为桌面版 Edge 浏览器上的 Bing 搜索增加了语音输入功能,目前已经支持中文、英语、日语等多种语言;

· macOS 上的开源浏览器 Brave 新增了「垂直标签页」的功能,能够一定程度减少拥挤的标签页,各位可在 Brave 浏览器的「设置/外观」里灵活设置;

信息加工 大模型应用

ChatGPT 上周为苹果用户推送了一个新版本,带来一组非常实用的功能:

· 全面适配 iPadOS 的新特性,支持全屏、分屏、拖拽等功能,提升了在大屏上使用 ChatGPT 的体验;

· 与 Siri/快捷指令全面整合,这意味着用户可以直接通过 Siri 或快捷指令调取 ChatGPT 里的能力,各位可以根据自己的实际需求,编写相应的快捷指令;

你可以在 App Store 免费下载或更新 ChatGPT,目前这款应用还未在中国区 App Store 上架,建议使用美区 Apple ID 登录,同时还能通过应用内购买 ChatGPT Plus,价格与网页版一致,每月 20 美元。

接着谈大模型,我最近发现「Poe」应用里的 Sage 模型非常好用:

· 速度非常快,比如翻译一段英文,几乎瞬间完成;

· 中文处理能力一点不弱于 ChatGPT,Sage 基于 GPT-3.5-Turbo,Quora 官方称,Sage 适用于非英语语境中的文本处理;

更重要的是,Sage 无需订阅 Poe 高级版即可使用,而且是 Poe 的默认模型,打开 Poe 应用或网页即可使用,如果你的大模型应用场景主要是围绕非英语的文本处理,不妨试试 Sage。

在桌面浏览器上,我们可以通过安装浏览器扩展 ChatGPTBox 将 Poe 里的各个模型整合到浏览器右键菜单里,如下图所示,安装完该扩展之后,你可以在扩展设置里勾选需要使用的模型,比如选择 Sage:

请在浏览器里打开并登录 Poe,然后在任何页面,选中某段文字,即可快速调用 Sage 模型的能力:

另外,ChatGPTBox 也支持使用右键菜单快速启动:

上述所有调用、处理的记录都会同步到 Poe 应用里,非常方便。

由于工作的原因,我需要经常将网页上的部分文章内容或全部内容交给大模型处理,让模型帮我翻译、分析结构或总结大意等,但在 iPhone 上复制、粘贴全文并不方便,分享一个在 iPhone 上高效使用大模型应用进行文本分析的技巧:

· 使用 Safari 打开网页文章;

· 点按 Safari 地址栏,找到「显示阅读器」;

· 点按共享菜单,找到「邮件」;

· 在「邮件」的编辑发送页面唤出光标,可弹出「全选」;

· 点按「全选」,复制后粘贴到大模型应用(比如 ChatGPT)即可;

iPadOS 17 的台前调度

我曾多次提及 iPadOS 或 macOS 上的「台前调度」既是窗口管理,也是注意力管理,在上周发布的 iPadOS 17 第一个开发者测试版里,我们可以看到苹果对于这项功能的新思考,Macstories 创始人 Federico Viticci 这样写道:

· 窗口大小和位置设置有了更大的自由度。当你调整窗口大小时,虽然仍然基于预设的选项,但调整过程感觉更加流畅;

· 你现在可以自由地将窗口放置在任何位置,并根据需要使它们叠放;

· 增加了基于「Shift」的键盘快捷键,现在 iPad 用户可以和 macOS 用户一样,通过「Shift+单击」的方式快速将程序坞上的应用添加到当前工作区里。

但正如 Federico Viticci 所言,目前这个版本还只是苹果第一个开发者测试版,距离真正意义上的 iPadOS 17 还有相当一段距离,苹果在此期间会有很多迭代或倒退,现有的体验并不等同于正式版本,只能说,拭目以待吧。

信息创造 创造现实

相机的发展历史,从另一个角度去看也是不断降低「创造现实」门槛的历史,手机相机能力的不断提升,更是将「创造现实」普惠到每个人。

科技媒体 AndroidAuthority 最近披露了 Google 下一代 Pixel 手机的相机能力:

· 硬件:采用三星 ISOCELL GN2 广角镜头,结合 Tensor G3 处理器的能力,新相机模组的硬件配置可以在暗光环境里获得更好的成像效果,并且还能拍摄 8K/30fs 的视频;

· 软件:拥有自动调整闪光灯亮度的功能,并且还支持场景分割,基于 AI 能力将拍摄场景的不同部分进行不同处理,这也是高通骁龙 8Gen2 里的一个特性;

上图就是 Pixel 8 系列的相机模组图片,我很期待这部手机。

与相机「创造现实」的缓慢发展速度形成鲜明对比的,则是生成式 AI 的快速迭代,新版本的 RunwayML 将 Gen-2 模型全面开放,大幅提升了文本生成视频的能力。

你可以通过 App Store 快速免费下载这款生成类应用,但如果生成的视频较多,用户还是需要内购获取「积分」,或者以订阅形式成为会员,15 美元/月或 144 美元/年。

相较于上一代模型,Gen-2 的确带来肉眼可见的提升,但生成的视频依然存在颗粒感,有点旧视频的感觉,当然在处理诸如人类手指和其他物体之间关系时也存在问题。

从这个角度去看,现阶段的 RunwayML 更像是生产力玩具,而无法作为生产力工具,鉴于大模型的进化速度,我们有理由期待,这款工具以及类似产品未来将改变影像内容的生产流程。

创造文本

全球最大的开源博客程序 Wordpress 推出基于 AI 的写作助手功能,这项功能被集成到官方插件 Jetpack 里,可以快速生成博客标题、调整文章表达语气以及根据某些关键词或句子生成一篇文章等,同时还支持字母拼写、语法检查以及语言翻译(现在支持 12 种语言)。

我个人体验之后给出的评价只能说是「一般」,一方面现阶段有太多类似的工具,而且基本上都是在调用 OpenAI 的 API;另一方面,对于一些重度用户而言,我更建议直接使用 OpenAI 的大模型或 API,毕竟,自己动手的话,还可以通过优化提示词,进一步调整文章生成的效果。

如果你使用 Wordpress 作为博客程序,可通过这里下载这款插件,免费用户可以调用 20 次 AI 生成功能,付费订阅的价格为 10 美元/月。

最后分享一组关于创造工具的评测:

· iPad 版本的 Logic Pro 更像是普通人感受苹果这款专业音乐制作软件的入门之选,它带来一些适配 iPad Pro 的功能,但局限性依然很大;

· iPad 版本的 Final Cut Pro 对于从未使用过这款软件的人来说,是一个非常不错的工具,但如果你已经积累了丰富的工作流程,可能会有点无所适从;

· 15 英寸的 MacBook Air 已经开售,中国区售价10499 人民币起,Verge 的评价非常高,机身轻薄、电池耐用、性能强劲;

· Ars Technica 对搭载 M2 Ultra 的 Mac Studio 进行了评测,认为这是一款快速、高效并且安静的桌面计算机,也比新款 Mac Pro 更具性价比,目前中国区 Mac Studio 售价为 16499 元起(搭载 M2 Max 处理器),而搭载 M2 Ultra 的型号最低是 32999 元。