标签: 大模型

你无法想象:OpenAI 中文训练数据有多脏 1

你无法想象:OpenAI 中文训练数据有多脏

前些日子,OpenAI 为了开源,而开源了 GPT-oss 模型的全部参数。很快就有开发者对 GPT-oss 模型做了一番深入分析,通过特殊算法、参数检测以及与模型的交互,非常直白的向我们展示了… OpenAI 的中文训练数据,真的很脏啊 这是今年9月份 …
Enable Notifications OK No thanks