开云体育

开云体育阿里Qwen发布超强推理模型:仅320亿参数比肩DeepSeek-R1!

2025-03-06
浏览次数:
返回列表

  开云体育[永久网址:363050.com]成立于2022年在中国,是华人市场最大的线上娱乐服务供应商而且是亚洲最大的在线娱乐博彩公司之一。包括开云、开云棋牌、开云彩票、开云电竞、开云电子、全球各地赛事、动画直播、视频直播等服务。开云体育,开云体育官方,开云app下载,开云体育靠谱吗,开云官网,欢迎注册体验!

开云体育阿里Qwen发布超强推理模型:仅320亿参数比肩DeepSeek-R1!

  在科技领域的又一重大突破,阿里Qwen团队于3月6日正式推出其新研究成果——QwQ-32B大语言模型。这款拥有320亿参数的模型,凭借着仅为DeepSeek-R1(6710亿参数,其中370亿被激活)约1/21的参数量,却在性能上实现了惊人的跨越,展现出超乎想象的能力。

  通过强化学习技术,QwQ-32B在数学推理、编程能力和通用能力的基准测试中表现出色。不仅在AIME24评测集中证明了其在数学能力上与DeepSeek-R1相媲美,甚至在LiveCodeBench中的代码评估中同样力压竞争对手,明显领先于o1-mini和相同尺寸的R1蒸馏模型。

  更为引人注目的是,QwQ-32B的表现超过了由meta首席科学家杨立昆主导的“最难LLMs评测榜”LiveBench,以及谷歌提出的指令遵循能力IFeval评测集和加州大学伯克利分校的BFCL工具调用测试。更高的得分使得QwQ-32B在多项测试中都胜过了DeepSeek-R1。

  如今,QwQ-32B已经在HuggingFace和ModelScope平台上开源,科技爱好者们可以通过QwenChat直接进行体验,毫无疑问,这次发布将助力人工智能的未来发展,开启全新篇章。从参数量到实际应用,QwQ-32B展现出了令人惊叹的潜力,未来是否能颠覆行业格局,值得我们拭目以待!返回搜狐,查看更多

搜索