用苹果 M5 Max 跑大模型真的省钱吗？有人算了一笔账

先上结论：

使用 14寸 MacBook Pro M5 Max 高配，64GB 内存的情况下，速度比云端大模型慢、实际成本也比云端大模型贵…

推荐：直接向大模型厂商付费充值使用。

这是来自 williamangel 的一组数据，文章主要在计算「本地跑 LLM 到底贵不贵」，使用了 Google Gemma 4 31B 模型，把电费、硬件折旧、tokens/s 这些数据摊开之后，结论是：

很多情况下，本地 Apple Silicon 跑模型，成本已经高于直接调用在线 API。

设备	配置	官方价格
Apple 14′ MacBook Pro	M5 Max + 64GB RAM	$4299

方案	百万 tokens 成本	速度
本地 Apple Silicon 推理	~$1.50 / 百万 tokens	数十 tokens/s
在线 OpenRouter 同级模型	约为本地的 1/3	约 2 倍速度

原文：