GPTZero：普林斯顿学生开发的检测 ChatGPT 生成文本的应用

2024年12月8日修改

在当今科技飞速发展的时代，人工智能技术正逐渐渗透到我们生活的各个领域。其中，ChatGPT 作为一款具有强大语言处理能力的人工智能，引发了广泛的关注和讨论。然而，ChatGPT 的出现也带来了一些问题，比如学生可能会使用它来撰写论文，这引发了教育界对学术诚信的担忧。就在这时，普林斯顿大学的 22 岁大四学生爱德华·田（Edward Tian）开发了一款名为 GPTZero 的应用，旨在帮助检测文本是否是使用 ChatGPT 等人工智能工具生成的。

ChatGPT 虽然还远非一个完全准确和可靠的信息来源，但它已经让教师们担心学生们会在短时间内提交使用它撰写的论文。纽约市的学校最近禁止在其设备和互联网网络上使用 ChatGPT，以防止学生出现人工智能抄袭问题。这或许是防止学生作弊的一个重要举措，但这并不是一个非常有效的措施，因为学生仍然可以在学校以外的地方使用 ChatGPT 和其他类似工具。

而 GPTZero 的出现，为全球的教育工作者提供了一个检测机器生成文本的工具。因此，各机构和大学现在可以轻松地开始使用 GPTZero 来检测文本是人类撰写的还是机器生成的。

GPTZero 是如何工作的呢？它通过分析文本的两个指标——“困惑度”（perplexity）和“突发性”（burstiness）来判断文本的复杂性以及是否是人类生成的。“突发性”是指句子的扩散情况，基于人类倾向于以有节奏的模式混合长短句，而人工智能生成的句子则更可能是统一的。“困惑度”是衡量语言模型预测文本片段的好坏程度，它涉及到文本的随机性，以确定是否是由人工智能工具组合而成的。较低的困惑度意味着文本更容易预测，因此听起来更像是机器生成的。而人类更加明智和富有表现力，他们倾向于创作出具有更高困惑度的文本。

尽管该应用仍处于开发阶段，但已经有大量用户想要测试他们输入的文本是人类撰写的还是机器生成的，这导致其在推出的第一周内就有超过 3 万人使用，甚至因流量过高而崩溃。Streamlit，这个托管 GPTZero 的免费论坛，已经介入帮助田获得更多资源来调节网络流量。

田已经公布了多个案例，证明他的算法是准确的。然而，他也承认他的应用并非万无一失，如果文本非常随机，应用可能会出现错误，正如一些用户在测试时所报告的那样。田希望随着时间的推移改进该应用，并仍在努力提高测试版的准确性。开发能够区分人类撰写文本和机器生成文本的软件，可以为使用 ChatGPT 等工具带来更多的透明度和合理性。

为了验证该应用的效果，我们自己进行了测试。我们输入了一段人类撰写的文本：“The Apple MacBook Air M2 目前是首选。主要是因为它对许多人来说是一个实质性的选择。它拥有您所需要的一切——可靠的性能、长续航能力，以及一种可以被许多人使用的配置。最新的 MacBook Air 售价约为 1199 美元，但您也可以选择 2020 年的 MacBook Air M1 作为更便宜的替代品。然而，如果您正在寻找一个有价值的选择，那么 HP 的 Pavilion Aero 13 是一款出色的轻量级笔记本电脑，售价约为 550 美元，价格相当合理。”分析结果正确地表明这是人类撰写的内容，具有较高的困惑度得分。该工具在检测文本是否可能是人类撰写的方面非常快速！我们甚至测试了 ChatGPT 生成的文本，它也成功地检测到了。然而，对于较短的文本，AI 检测的准确性则有些不稳定。

那么，GPTZero 对于教育工作者检测人工智能生成的文本是否足够好呢？这取决于 ChatGPT 等 OpenAI 工具在未来几个月的发展情况。爱德华·田创建的这款应用将有助于协助教师和教育工作者识别人工智能生成的文本，但结果可能会因文本的长度以及其他因素而有所不同。

ChatGPT 于 2022 年 11 月 30 日发布，并在 5 天内突破了 100 万用户。随着时间的推移，人工智能写作工具可能会变得更加强大和准确。ChatGPT 可能会在未来的更新和发展中能够写出更像人类、更自然的内容。对于这样的情况，像 GPTZero 这样的模型将不得不以更创新的方式来检测人工智能生成的文本。

值得一提的是，田并不反对使用像 ChatGPT 这样的人工智能工具。他表示，GPTZero“并不是要成为阻止这些技术被使用的工具”。“但对于任何新技术，我们都需要能够负责任地采用它，并且我们需要有保障措施”。

总之，GPTZero 的出现为解决人工智能写作工具带来的问题提供了一种可能的解决方案。然而，我们也需要认识到，这只是一个开始，随着技术的不断发展，我们需要不断地改进和完善这些工具，以确保它们能够更好地服务于我们的社会和教育事业。同时，我们也需要加强对学生的教育，让他们明白学术诚信的重要性，以及如何正确地使用人工智能技术来辅助学习，而不是作弊。只有这样，我们才能真正实现人工智能技术的有益应用，推动社会的进步和发展。

GPTZero：普林斯顿学生开发的检测 ChatGPT 生成文本的应用​

GPTZero：普林斯顿学生开发的检测 ChatGPT 生成文本的应用