基本上可视为阿里版的R1,响应的行为和R1十分类似,R1答不对的QwQ也答不对。 用五道题测了一遍新版QwQ,五题全错,表现和R1类似。(好吧,我只跑了一遍,看评论区又跑了几次,前两题QwQ正确率明显高于R1) 注:样本5是针对o3 mini特性新制作的问题(迷惑点耦合+可能性穷举),o3 ...
公司动态 经济观察网讯 阿里Qwen团队2月25日在社交媒体发布了深度思考模型Thinking(QwQ)预览版。这是在QWQ-MAX-PREVIEW支持下,一个基于Qwen2.5-Max的推理模型。QwQ可同时支持深度思考和联网搜索,并会展示完整的思维链。此外,该团队宣布,QWQ-MAX正式版本即将发布,Android和iOS应用程序也会同步发布。(编辑 万佳) ...