Рет қаралды 11,003
6月14号,英伟达宣布发布Nemotron-4 340B通用模型,专为生成训练大语言模型的合成数据而设计,有可能彻底改变训练大模型时、合成数据的生成方式。这个突破性的进展,可能标志着AI行业的一个重要里程碑,那就是现在无需昂贵的真实世界数据,用合成数据就可以创建出性能强大的、特定领域大模型了,而且,Nemotron-4 340B的性能已经超越Mixtral 8x22B、Claude sonnet、Llama3 70B和Qwen 2,甚至可以和GPT-4一较高下。今天我们就来聊聊这个模型。
技术报告链接:d1qx31qr3h6wln...
#nvidia #nemotron #gpt4