用苹果 M5 Max 跑大模型真的省钱吗?有人算了一笔账

用苹果 M5 Max 跑大模型真的省钱吗?有人算了一笔账 1

先上结论:

使用 14寸 MacBook Pro M5 Max 高配,64GB 内存的情况下,速度比云端大模型慢、实际成本也比云端大模型贵…

推荐:直接向大模型厂商付费充值使用。

一些数据

这是来自 williamangel 的一组数据,文章主要在计算「本地跑 LLM 到底贵不贵」,使用了 Google Gemma 4 31B 模型,把电费、硬件折旧、tokens/s 这些数据摊开之后,结论是:

很多情况下,本地 Apple Silicon 跑模型,成本已经高于直接调用在线 API。

电费成本

功耗每小时电费每日电费(24小时满载)
50W$0.009$0.216
100W$0.018$0.432
文中取整后估算~$0.02~$0.48

M5 Max MacBook Pro 硬件成本

设备配置官方价格
Apple 14′ MacBook ProM5 Max + 64GB RAM$4299

按设备寿命摊销后的硬件成本

使用寿命年成本每小时硬件成本
3 年$1433$0.16358
5 年$860$0.09815
10 年$430$0.04908

本地 LLM 综合成本(电费 + 硬件)

使用寿命每小时总成本(约)
3 年~$0.18/h
5 年~$0.11/h
10 年~$0.07/h

最终:Token 成本估算

方案百万 tokens 成本速度
本地 Apple Silicon 推理~$1.50 / 百万 tokens数十 tokens/s
在线 OpenRouter 同级模型约为本地的 1/3约 2 倍速度

原文:

写留言

Enable Notifications OK No thanks