Mac 用户的 RAG 交互：通过 Chat-with-MLX 与数据对话-今日头条

最近，Nvidia 推出了 Chat With RTX 功能，让我这个 Mac 用户感到非常羡慕。

虽然我尝试过多种 RAG（Retrieval-Augmented Generation）方法，但仍然希望能有一个适合 Mac M系列芯片的高效 RAG 解决方案。

这不来了。

https://github.com/qnguyen3/chat-with-mlx

作者推上的简介：

多模态与多语言项目的负责人，在 Ontocord 工作。现在与 NousResearch 有合作关系。此前曾在 OpenAI 工作。

推荐此程序的3个理由：

1. 安装方便

支持添加其他模型，详情请看 Github。

2. 程序使用 MLX

MLX 是苹果公司（Apple）专为其自家的硅片设计的一款机器学习研究框架，它由苹果的机器学习研究团队倾力打造。

MLX的亮点：

1）熟悉的API设计：MLX提供了类似于NumPy的Python API，使用户易于上手。同时，它还支持C++、C和Swift的API，保持与Python API的高度一致性。MLX还包含高级功能包如mlx.nn和mlx.optimizers，其API设计紧跟PyTorch，简化了复杂模型的构建过程。

2）灵活的函数转换能力：MLX支持自动微分、自动向量化和计算图优化，提升模型训练和优化的效率。

3）惰性计算机制：通过采用惰性计算，MLX能够仅在数据真正需要时才进行计算和呈现，有效提高计算效率。

4）动态图构建：MLX能动态构建计算图，即使函数参数的形状变化，也不会导致编译速度变慢，使得调试过程更为简单直观。

5）支持多设备运算：MLX能够在任何支持的设备上顺畅运行，无论是CPU还是GPU。

6）统一内存管理：与其他框架不同，MLX采用统一内存模型，数据存储在共享内存中，无需在不同设备间传输数据，极大提升了运算效率和数据处理速度。

3. 该程序不仅支持与本地文件（doc(x)、 pdf、 txt）的处理，还能够处理来自YouTube链接的内容。

Chat-with-MLX 界面