开云体育
开云体育阿里Qwen发布超强推理模型:仅320亿参数比肩DeepSeek-R1!
在科技领域的又一重大突破,阿里Qwen团队于3月6日正式推出其新研究成果——QwQ-32B大语言模型。这款拥有320亿参数的模型,凭借着仅为DeepSeek-R1(6710亿参数,其中370亿被激活)约1/21的参数量,却在性能上实现了惊人的跨越,展现出超乎想象的能力。
通过强化学习技术,QwQ-32B在数学推理、编程能力和通用能力的基准测试中表现出色。不仅在AIME24评测集中证明了其在数学能力上与DeepSeek-R1相媲美,甚至在LiveCodeBench中的代码评估中同样力压竞争对手,明显领先于o1-mini和相同尺寸的R1蒸馏模型。
更为引人注目的是,QwQ-32B的表现超过了由meta首席科学家杨立昆主导的“最难LLMs评测榜”LiveBench,以及谷歌提出的指令遵循能力IFeval评测集和加州大学伯克利分校的BFCL工具调用测试。更高的得分使得QwQ-32B在多项测试中都胜过了DeepSeek-R1。
如今,QwQ-32B已经在HuggingFace和ModelScope平台上开源,科技爱好者们可以通过QwenChat直接进行体验,毫无疑问,这次发布将助力人工智能的未来发展,开启全新篇章。从参数量到实际应用,QwQ-32B展现出了令人惊叹的潜力,未来是否能颠覆行业格局,值得我们拭目以待!返回搜狐,查看更多