输入“/”快速插入内容

歸藏翻译:简单易懂,强烈推荐-Codesignal提示工程教程 #1

2024年3月21日修改
歸藏 歸藏的AI工具箱 2024-03-21 01:01 北京
Sense 介绍
非常好的提示工程教程,很多技巧以前没见过,通俗易懂,整理不易觉得有用可以转发给你的朋友或者点赞。
刚刚Codesignal推出了一个非常通俗易懂并且给出了丰富实践经验的免费提示工程教程。
如果你之前看过一些提示工程的教程但是都很复杂看不懂的话。强烈建议你看一下这个,可以很好的帮助你学习提示词书写。
我也完整翻译了第一部分的教程,但是还是建议你去做一下课后习题加深记忆。
本篇正文共 6427 字,仔细阅读约 17 分钟
大语言模型 (LLM) 是下一个单词预测机器
介绍
欢迎来到大语言模型(LLMs)和提示技术基础的迷人世界!在这第一课,我们将深入探索大语言模型究竟是什么。先给你透个底儿——它们本质上是下一个词的预测机器。听起来简单,但背后的原理远比你看到的要复杂。不管你是编程领域的新手还是对这些技术奇迹充满好奇,你都找对地方了。让我们一起踏上这激动人心的旅程,一步步揭开大语言模型的神秘面纱,从它们的核心功能开始。
理解LLMs作为下一个词预测机器
想象一下,当你在写短信或电子邮件时,你的手机推荐可能想输入的下一个词。这正是大语言模型(LLMs)的一个非常基本的示例。但像GPT-3.5、GPT-4(更广为人知的是chatGPT)、Claude 2和LLaMA这些LLMs可比普通的预测功能强多了。它们不只是简单地在句子中推荐下一个词,而是能够基于接收到的输入生成连贯完整的文本段落。这一切都是通过连续预测下一个词实现的,而这些词则是基于它们已经处理过的文本。
从核心上讲,LLMs通过分析大量文本数据来学习。通过这种分析,它们掌握了语言的模式、微妙差异和结构。这使得它们能够自然地预测出一连串单词中接下来的那个词。就好比它们不断地在玩一个“填空游戏”,而且规模和速度都达到了惊人的程度。
LLMs如何进行预测?
你可能会好奇,LLMs是如何进行这些预测的。答案其实在于训练。LLMs接触了包括教科书、文章、网站等在内的庞大数据集。在这个训练阶段,它们学会了理解语言的上下文和流动性。它们掌握了包括语法、风格,甚至是文本的语调等方面。
当你用一个句子或问题来指导LLM时,它便利用自己所学的知识,预测接下来最可能的一个或几个词。这不仅是基于它在训练期间观察到的模式和规则的推测。
尝试一些提示工程(Prompt Engineering)
鉴于LLMs的概率本质,提示工程师(Prompt Engineers)面临的挑战是如何引导LLMs向着高度可预测和准确的结果方向发展。
在这门课程中,你将学习许多技巧,这些技巧将帮助你掌握高度可预测的LLM输出结果的艺术和科学。但在我们深入学习之前,让我们先从一些简单的练习开始,激活我们的思维。
掌握一致的格式和条理,实现有效提示
在这一课中,我们将探索一致的格式化和组织对于制作大语言模型(Large Language Models, LLMs)提示时的重要性。你或许会好奇,为什么像提示格式这样简单的事物,会显著影响你从AI得到的回应。就像人与人的交流一样,清晰和结构对于确保你的要求被理解并准确执行至关重要。让我们一起深入探讨,如何应用这些原则,使你与大语言模型的互动更加有效和可预见。
一致格式的重要性
对你的提示进行一致的格式化,不仅是为了让它们看起来整齐;它的真正意义在于向AI清楚地传达你的意图。想象一下,如果你在给某人讲解烘焙蛋糕的步骤时,不是按顺序排列,而是将它们混杂在一起,会发生什么?结果可能是混乱和一个不太美味的蛋糕。这一原则同样适用于大语言模型。通过以清晰、有条理的方式提出你的提示,你大大提高了得到期望结果的机会。
尽管构建提示的方法有很多种,在本课程中,我们会教授你CodeSignal上的提示工程师和AI专家们开发的Markdown提示框架(Markdown Prompts Framework, MPF)。
Markdown提示框架(MPF)
在本课程中,我们将看到许多MPF应用的实例,但目前,让我们先来看一个总览:
把你的提示分成Markdown章节,如: SECTION 这不仅有助于LLMs更好地理解你的提示,而且使你的提示非常易于快速浏览(尤其是在Markdown中渲染时,因为这些会以粗体显示),方便你的同事AI工程师在提示内容较多时快速找到并阅读相关部分。
在提示的顶部开始你的__ASK__部分 这样你和你的合作者可以从一开始就迅速理解提示的目标。
将每个部分格式化为Markdown项目符号列表,以便于阅读和理解。项目符号列表更容易浏览,而且倾向于引导大语言模型更好地遵循指示。
在尽量减少分节的同时,对于复杂的提示,包括以下关键章节:
ASK - 我们请求大语言模型做什么?
CONTEXT - 大语言模型需要了解什么信息,才能准确地回应?
CONSTRAINTS - 回应时需要遵循哪些限制?
EXAMPLE - 你满意的输出样例是什么?
应用MPF的例子
看一个格式欠佳的提示:
写一个短故事,关于一个宇航员发现了一个新行星。但故事中必须包括一只会说话的外星人、一场太空战斗,以及最后的反转:一切都是模拟。哦,请控制在100字以内。
使用MPF,我们可以将这个提示转换为一个结构更为清晰、易于理解的模型请求:
代码块
__ASK__
Craft a short story about an astronaut's discovery.
编写一个关于宇航员的发现的短篇故事。
__CONTEXT__
- The setting is outer space.
- The protagonist is an astronaut.
- 背景是外太空。
- 主角是一名宇航员。
__CONSTRAINTS__
- The story should be no longer than 120 words.
- Include the following elements:
- A talking alien.
- A space battle.
- A twist ending revealing everything was a simulation.
- 故事长度不得超过120字。
- 包括以下要素:
- 一个会说话的外星人。
- 太空大战。
- 一个扭曲的结局揭示了一切都是模拟。