作者: 青小蛙

你无法想象:OpenAI 中文训练数据有多脏 5

你无法想象:OpenAI 中文训练数据有多脏

前些日子,OpenAI 为了开源,而开源了 GPT-oss 模型的全部参数。很快就有开发者对 GPT-oss 模型做了一番深入分析,通过特殊算法、参数检测以及与模型的交互,非常直白的向我们展示了… OpenAI 的中文训练数据,真的很脏啊 这是今年9月份 …
2025年终端模拟器排行榜|Unicode 篇 11

2025年终端模拟器排行榜|Unicode 篇

回顾:青小蛙写过一篇《终端(Terminal)、TTY 和 Shell,还有 SSH,一次搞懂它们到底是什么?》,可以先看,然后再来看排行榜。 Jeff Quast 有一篇总结了终端在 Unicode 支持、性能、功能扩展方面的情况的文章: …
Enable Notifications OK No thanks