人生搜索引擎免费用:开源版哈利波特“冥想盆”登 GitHub 热榜,支持中文

xxn 阅读:44566 2024-11-20 14:03:14 评论:0

哇喔!惊喜连连!网上现在有免费软件可以帮你回忆过去看过和处理过的所有内容了!简单来说,只要输入相关搜索词,这个软件就能帮您一键轻松找到“之前好像在哪看过”的电脑文件。

使用方法 be like(没错,有中文版):

你品,你细品。这感觉像《黑镜》里的“你的全部历史”那一集,描绘了一种未来生活,人人都植入芯片,能随时读取过去记忆。

更有趣的是,开发这个软件的人将其命名为 Pensieve (冥想盆),这个名称源自“哈利波特”系列中的大水盆,可提取和回顾记忆。

太贴切了对吧!实际上,该项目受之前火爆的“记忆助手软件”Rewind 和微软的 Windows Recall 功能启发。然而,Rewind 需要付费(基础版 12 美元/月),而微软的则一拖再拖。所以,既免费又即刻可用的Pensieve 真香啊!

代码更新后很快就登上了 GitHub 热榜~

回忆电脑屏幕上的所有内容

先看一下 GitHub 页面上Pensieve(原名Memos)的官方介绍:

一个以隐私为核心的被动录制项目。它可自动记录屏幕内容,建立智能索引,并提供方便的网页界面以检索历史记录。

听起来有点抽象?别着急,现在咱们来回忆一下Rewind 和 Windows Recall 吧。

首先说微软推了很久的大饼 ——Windows Recall。这个功能是今年5月首次提出的,当时微软计划将其作为Copilot + PC的旗舰功能推出。

当时的卖点是,用户可以通过自然语言搜索轻松回忆任何文件或网页浏览记录。

然而,由于安全方面的担忧,该功能的发布一再延迟,且至今未上线

微软最初计划于6月18日发布,但由于安全问题,未能如期上线。

随后微软改进了该功能,增加了高级加密和Windows Hello认证,数据存储在VBS安全区中,第三方应用和用户无法访问,同时截图会自动过滤掉密码和信用卡信息等敏感内容。

微软计划在10月底开始测试Windows Recall的新版。

至今,该功能仍然未上线,微软仍在忙着改进……

对于“记忆助手”Rewind,虽然发展蓬勃,但是它是收费的。

Rewind成立于2020年,主打通过AI技术捕捉并整理用户全部的生活内容。

具体功能与Windows Recall相似,帮助用户记录并回溯在手机或电脑上看过的所有信息。

不过,和简单回忆相比,Rewind走得更远了。

它接入了GPT-4,能够对这些“记忆”做更深入的处理,用户可以通过提出问题、创建摘要等方式与系统交互。

随着Rewind功能越来越完善,它也受到了资本的青睐。

截至今年初,Rewind已完成两轮融资,共计2790万美元,估值约为35亿美元(25.34亿人民币),而且OpenAI CEO Sam Altman 和a16z都参与了这两轮融资。

相比之下,根据项目作者说,Pensieve最大的特点在于:

允许用户完全控制自己的数据,确保数据不会传输到不可信任的数据中心。

具体来说,Pensieve有以下几点特点:

  • 简单安装,只需通过pip安装依赖项即可使用;

  • 所有数据都在本地存储,允许完全本地操作和自主数据管理;

  • 支持全文和向量搜索;

  • 与Ollama(一个支持本地部署LLM的开源框架)集成,增强搜索能力;

  • 支持Mac和Windows(Linux支持正在开发中);

  • 兼容任何OpenAI API模型(如OpenAI、Azure OpenAI、vLLM等);

  • 允许用户选择和设置语言模型(包括中文和英文);

  • 通过插件扩展功能;

下面重点讨论几个关键问题。

首先,需要多少存储空间。

作者估计,每月工作日约20天,产生的截图文件大小约为8GB。截图会去重,如果连续截图内容变化不大,则只会保留一张截图。

SQLite数据库大小取决于截图索引的数量,10万张截图索引占用约2.2GB的存储空间。

其次,功耗和硬件设备问题。

Pensieve默认需要两个计算密集型任务:1)OCR任务,用于从截图提取文本;2)嵌入任务,用于提取语义信息并建立向量索引;

对于前者,作者使用CPU执行,并根据操作系统优化以最小化CPU使用。

而对于后者,作者建议根据设备选择:

  • NVIDIA GPU设备优先使用GPU;

  • 苹果设备优先使用Metal GPU;

  • 其他设备使用CPU;

为避免影响用户日常使用,Pensieve会采取优化措施。

一方面,Pensieve可根据用户的活动模式动态调整索引构建频率。也就是说,在用户使用电脑时,会减少索引构建的优先级,以降低系统资源占用。

另一方面,Pensieve设计时考虑到电池寿命,它会监控电池状态,当电池电量低于某个阈值时,会自动减少资源消耗以延长电池使用时间。

最后,如何保证隐私安全。

Pensieve作者提出4点措施确保用户隐私:

1、完全开源且易于理解的Python代码,允许任何人审查以确保没有后门或恶意软件。

2、本地化数据存储。Pensieve将所有数据存储在用户的本地设备上,而不是上传到云端服务器。

3、易于卸载:Pensieve提供了简单的卸载过程,用户可以轻松从系统中移除。

4、数据处理完全由用户控制。用户可以自由选择何时启动或停止记录,以及如何管理和查询自己的数据。

此外,作为独立项目,Pensieve所使用的机器学习模型(包括VLM和嵌入模型)都允许用户选择。

试试安装这个工具

总的来说,使用Pensieve包括以下几个步骤:

  • 安装Pensieve

  • 初始化Pensieve配置文件和sqlite数据库

  • 使用两行命令启动服务

  • 在浏览器中打开并访问Web界面

值得一提的是,Pensieve作者还特别提供了“食用指南”,简单总结如下:

1、选择适当的嵌入模型

因为Pensieve使用嵌入模型提取语义信息并构建向量索引,所以选择合适的嵌入模型至关重要。

根据语言偏好,作者提供了中英两种模型。

2、使用Ollama进行视觉搜索

默认情况下,Pensieve仅开启OCR插件从截图提取文本并构建索引。然而,这种方法局限了没有文本的图像的搜索效果。

因此,我们需要一个与OpenAI API兼容的多模态图像理解服务,而Ollama正好胜任。

需要注意的是,在启用VLM功能前,对硬件有一定要求:

  • 推荐配置:至少有8GB VRAM的NVIDIA显卡或搭载M系列芯片的Mac;

  • 不推荐CPU模式,因为会导致系统卡顿;

3、全文索引

由于Pensieve默认情况下并非立即索引所有截图,因此,需要使用以下命令才能实现全文索引功能。

更多安装细节请查看原项目库,地址在这里~

GitHub:

  • https://github.com/arkohut/pensieve?tab=readme-ov-file

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考。

声明

1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。

搜索
排行榜
关注我们

扫一扫关注我们,了解最新精彩内容