人生搜索引擎免费用:开源版哈利波特“冥想盆”登 GitHub 热榜,支持中文
哇喔!惊喜连连!网上现在有免费软件可以帮你回忆过去看过和处理过的所有内容了!简单来说,只要输入相关搜索词,这个软件就能帮您一键轻松找到“之前好像在哪看过”的电脑文件。
使用方法 be like(没错,有中文版):
你品,你细品。这感觉像《黑镜》里的“你的全部历史”那一集,描绘了一种未来生活,人人都植入芯片,能随时读取过去记忆。
更有趣的是,开发这个软件的人将其命名为 Pensieve (冥想盆),这个名称源自“哈利波特”系列中的大水盆,可提取和回顾记忆。
太贴切了对吧!实际上,该项目受之前火爆的“记忆助手软件”Rewind 和微软的 Windows Recall 功能启发。然而,Rewind 需要付费(基础版 12 美元/月),而微软的则一拖再拖。所以,既免费又即刻可用的Pensieve 真香啊!
代码更新后很快就登上了 GitHub 热榜~
回忆电脑屏幕上的所有内容
先看一下 GitHub 页面上Pensieve(原名Memos)的官方介绍:
一个以隐私为核心的被动录制项目。它可自动记录屏幕内容,建立智能索引,并提供方便的网页界面以检索历史记录。
听起来有点抽象?别着急,现在咱们来回忆一下Rewind 和 Windows Recall 吧。
首先说微软推了很久的大饼 ——Windows Recall。这个功能是今年5月首次提出的,当时微软计划将其作为Copilot + PC的旗舰功能推出。
当时的卖点是,用户可以通过自然语言搜索轻松回忆任何文件或网页浏览记录。
然而,由于安全方面的担忧,该功能的发布一再延迟,且至今未上线。
微软最初计划于6月18日发布,但由于安全问题,未能如期上线。
随后微软改进了该功能,增加了高级加密和Windows Hello认证,数据存储在VBS安全区中,第三方应用和用户无法访问,同时截图会自动过滤掉密码和信用卡信息等敏感内容。
微软计划在10月底开始测试Windows Recall的新版。
至今,该功能仍然未上线,微软仍在忙着改进……
对于“记忆助手”Rewind,虽然发展蓬勃,但是它是收费的。
Rewind成立于2020年,主打通过AI技术捕捉并整理用户全部的生活内容。
具体功能与Windows Recall相似,帮助用户记录并回溯在手机或电脑上看过的所有信息。
不过,和简单回忆相比,Rewind走得更远了。
它接入了GPT-4,能够对这些“记忆”做更深入的处理,用户可以通过提出问题、创建摘要等方式与系统交互。
随着Rewind功能越来越完善,它也受到了资本的青睐。
截至今年初,Rewind已完成两轮融资,共计2790万美元,估值约为35亿美元(25.34亿人民币),而且OpenAI CEO Sam Altman 和a16z都参与了这两轮融资。
相比之下,根据项目作者说,Pensieve最大的特点在于:
允许用户完全控制自己的数据,确保数据不会传输到不可信任的数据中心。
具体来说,Pensieve有以下几点特点:
简单安装,只需通过pip安装依赖项即可使用;
所有数据都在本地存储,允许完全本地操作和自主数据管理;
支持全文和向量搜索;
与Ollama(一个支持本地部署LLM的开源框架)集成,增强搜索能力;
支持Mac和Windows(Linux支持正在开发中);
兼容任何OpenAI API模型(如OpenAI、Azure OpenAI、vLLM等);
允许用户选择和设置语言模型(包括中文和英文);
通过插件扩展功能;
下面重点讨论几个关键问题。
首先,需要多少存储空间。
作者估计,每月工作日约20天,产生的截图文件大小约为8GB。截图会去重,如果连续截图内容变化不大,则只会保留一张截图。
SQLite数据库大小取决于截图索引的数量,10万张截图索引占用约2.2GB的存储空间。
其次,功耗和硬件设备问题。
Pensieve默认需要两个计算密集型任务:1)OCR任务,用于从截图提取文本;2)嵌入任务,用于提取语义信息并建立向量索引;
对于前者,作者使用CPU执行,并根据操作系统优化以最小化CPU使用。
而对于后者,作者建议根据设备选择:
NVIDIA GPU设备优先使用GPU;
苹果设备优先使用Metal GPU;
其他设备使用CPU;
为避免影响用户日常使用,Pensieve会采取优化措施。
一方面,Pensieve可根据用户的活动模式动态调整索引构建频率。也就是说,在用户使用电脑时,会减少索引构建的优先级,以降低系统资源占用。
另一方面,Pensieve设计时考虑到电池寿命,它会监控电池状态,当电池电量低于某个阈值时,会自动减少资源消耗以延长电池使用时间。
最后,如何保证隐私安全。
Pensieve作者提出4点措施确保用户隐私:
1、完全开源且易于理解的Python代码,允许任何人审查以确保没有后门或恶意软件。
2、本地化数据存储。Pensieve将所有数据存储在用户的本地设备上,而不是上传到云端服务器。
3、易于卸载:Pensieve提供了简单的卸载过程,用户可以轻松从系统中移除。
4、数据处理完全由用户控制。用户可以自由选择何时启动或停止记录,以及如何管理和查询自己的数据。
此外,作为独立项目,Pensieve所使用的机器学习模型(包括VLM和嵌入模型)都允许用户选择。
试试安装这个工具
总的来说,使用Pensieve包括以下几个步骤:
安装Pensieve
初始化Pensieve配置文件和sqlite数据库
使用两行命令启动服务
在浏览器中打开并访问Web界面
值得一提的是,Pensieve作者还特别提供了“食用指南”,简单总结如下:
1、选择适当的嵌入模型
因为Pensieve使用嵌入模型提取语义信息并构建向量索引,所以选择合适的嵌入模型至关重要。
根据语言偏好,作者提供了中英两种模型。
2、使用Ollama进行视觉搜索
默认情况下,Pensieve仅开启OCR插件从截图提取文本并构建索引。然而,这种方法局限了没有文本的图像的搜索效果。
因此,我们需要一个与OpenAI API兼容的多模态图像理解服务,而Ollama正好胜任。
需要注意的是,在启用VLM功能前,对硬件有一定要求:
推荐配置:至少有8GB VRAM的NVIDIA显卡或搭载M系列芯片的Mac;
不推荐CPU模式,因为会导致系统卡顿;
3、全文索引
由于Pensieve默认情况下并非立即索引所有截图,因此,需要使用以下命令才能实现全文索引功能。
更多安装细节请查看原项目库,地址在这里~
GitHub:
https://github.com/arkohut/pensieve?tab=readme-ov-file
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考。
1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。