输入“/”快速插入内容

融入提示技巧(高级)

2024年7月23日修改
思维链提示工程
思维链(CoT)提示过程是一种最近开发的提示方法,它鼓励大语言模型解释其推理过程。下图显示了 %%few shot standard prompt|few shot standard prompt%%(左)与链式思维提示过程(右)的比较。
常规提示过程 vs 思维链提示过程
思维链的主要思想是通过向大语言模型展示一些少量的 %%样例%%,在样例中解释推理过程,大语言模型在回答提示时也会显示推理过程。这种推理的解释往往会引导出更准确的结果。
示例
以下是演示。通过使用思维链提示过程成功解决相同的问题。
//逻辑思维链
代码块
赵粥粥打算去涠洲岛玩,以下那种方式是更快的旅游方式?
选项1:乘坐1000分钟的公共汽车,然后半小时的火车,最后90分钟的渡船。
选项2:乘坐800分钟的公共汽车,然后1小时的火车,最后一个半小时的渡船。
选项3:乘坐3小时的飞机,但需要提前2小时到达,然后是40分钟的汽车,最后2个小时的渡船
思考逻辑:1个小时=60分钟,你可以将所有时间换算为分钟
思考逻辑:1个小时=60分钟,你可以将所有时间换算为分钟”这一段,便是思维链具象化的结果,你可以在文本中直接加上这段话,这有助于生成更正确的回答。
结论
思维链已被证明对于算术、常识和符号推理等任务的结果有所改进。
限制
思维链也存在一些限制,较小的模型编写了不合逻辑的思维链会导致精度比标准提示更差。通常,模型从思维链提示过程中获得性能提升的方式与模型的大小成比例
零样本思维链
思维链的过程,就像是人类思考的过程。但相比人类会有很多情感的干扰,思维链则更像是AI基于自身掌握的知识,进行的逻辑思考。
而我们的指令,就起到了触发AI进行“思考”这样的过程。
零样本思维链(Zero Shot Chain of Thought,Zero-shot-CoT)提示过程(1)是对 %%指令%%(2) 的后续研究,引入了一种非常简单的零样本提示。他们发现,通过在问题的结尾附加“让我们一步步思考。”这几个词,大语言模型能够生成一个回答问题的思维链。从这个思维链中,他们能够提取更准确的答案。