研究团队提出了一种无训练、即插即用的解码策略——Confident Decoding(置信解码)。 传统认知默认:随着网络深度单调递增,思考结果也会变得更准确。 各类开源自回归大语言模型(LLM)的生成,也总是从最后一层输出。 然而,来自Qwen团队、清华大学、南洋 ...