开始使用适用于 Apple 芯片的 MLX

  • admin
  • 2026-02-06 19:10:20

0:00 - 简介

MLX 是专为 Apple 芯片打造的开源阵列框架。它能够高效地执行机器学习任务,并允许你使用 Python 和 Swift 直接在设备上运行大型语言模型。

1:15 - MLX 概览

这个高性能机器学习框架针对 Apple 芯片进行了优化,可以在 CPU 和 GPU 上快速完成数值计算和机器学习任务。它拥有类似 NumPy 的核心 API,而高级 API 则类似于 PyTorch 和 JAX。

你可以在 LM Studio 等应用程序中使用它,通过大语言模型在设备端生成文本。MLX 提供了 Python、Swift、C++ 和 C 的 API。

MLX 在 MIT 许可协议下开源,并且在 Hugging Face 上拥有活跃的社区。

4:21 - 主要功能

MLX 非常高效,因为它针对 Apple 芯片量身定制,充分利用了芯片的统一内存架构。由于在 CPU 和 GPU 之间共享内存,因此无需拷贝数据;操作只需指定所需的设备即可。

MLX 不会立即执行计算,而是构建计算图,仅在需要获取结果时才执行。

通过函数变换,MLX 可以将函数作为输入并返回新的函数,便于进行自动微分和其他优化。

MLX 包括了用于构建和训练神经网络的高级软件包,以及常用机器学习操作。这些软件包采用模块化设计,类似 PyTorch 等热门框架,方便开发者轻松切换。

10:15 - 加速 MLX

使用“mx.compile”进行函数编译会将多个 GPU 内核启动融合到单个内核中,从而减少内存带宽和执行开销。

对于更复杂的操作,“mx.fast”子软件包提供了高度优化的常用机器学习操作 (例如 RMSNorm 和注意力机制) 专用实现。

MLX 支持量化,能以更少的内存开销实现更快、更高效的推理,从而在不过度影响质量的情况下降低精度。

大规模计算可以利用“mx.distributed”子软件包在多台机器之间分配任务。

17:30 - MLX Swift

MLX 还提供 Swift API,这个 API 实现了同样的效率提升,可在 Xcode 中跨 Apple 平台无缝开发。

要开始使用并了解详细信息,请访问 MLX 网站或下载示例代码库。