输入“/”快速插入内容

今年目标 1 亿活跃用户!Perplexity 联手 Arc 浏览器对抗 Google 背后产品逻辑

本文讨论了Perplexity创始人与Stripe CTO的对话,围绕Perplexity构建AI驱动搜索引擎的历程、技术、商业模式等展开交流,并探讨AI行业相关问题。关键要点包括:
1.
产品发展历程:从构建自然语言到SQL搜索工具起步,受Stripe启发获投资,后调整策略推出通用搜索,靠口碑增长,目前有清晰路线图。
2.
产品优势:速度快,通过建立索引、模型服务及优化协调机制实现;与Arc浏览器合作,成为其默认搜索引擎。
3.
盈利模式:倾向订阅模式,认为AI公司应尽早尝试盈利,这能增加企业可持续性和融资优势。
4.
数据挑战:规模扩大后获取数据将更困难,如无法引用Twitter数据,需应对数据偏见问题。
5.
广告思考:未来广告应更注重相关性和融入用户体验,像Instagram广告,平台需保持透明。
6.
行业展望:预测ChatGPT企业版应用有潜力,下一代消费应用初创公司可能更多采用开源模型。
7.
未来目标:2024年将月活跃用户和查询量在2023年基础上增长10倍,分别达到1亿和超500亿 。
🐵
有新 Newin 2024-03-25 10:02 浙江
近日,Perpleixity 创始人&CEO Aravind Srinivas 对话了现任 Stripe CTO David Singleton,讨论了 Perplexity 如何构建一种新的 AI 驱动的传统搜索引擎替代方案、迄今为止的历程,以及其背后的技术。Aravind 的核心观点包括:
早期商业模式的重要性:Aravind 强调了早期实现盈利的重要性,认为这有助于构建更可持续、长期的业务,并为公司带来更多的筹码和杠杆。
关于产品方向的思考:Aravind 讨论了如何在创业初期确定产品方向,强调了对产品市场契合度的认识和追求,并指出了不断调整和优化产品路线图的重要性。
广告模式的演进:Aravind 对广告模式进行了思考,强调了广告的相关性对于用户体验的重要性。他认为,未来的广告模式可能会更加融入用户体验,以提高广告的相关性和吸引力。
数据收集和处理的挑战:他谈到了在数据收集方面可能面临的挑战,尤其是在争取对特定网站的访问权限方面。同时,他也提到了数据收集中可能出现的偏见问题,以及如何应对这些问题。
关于内容生成的思考:Aravind 对于内容生成的影响提出了一些见解,特别是针对搜索引擎优化对内容质量的影响。他认为,通过为用户提供高质量的内容,大型语言模型(LLMs)可能会对内容的生成产生积极影响。
以下为这次对谈的全部内容:
为什么要创办 Perplexity?它是一款 AI 搜索引擎。市面上有很多搜索引擎。公司今天的情况如何?
我们大约一年半前开始了 Perplexity,绝对不是为了建立一个新的搜索替代品。我们非常努力,我希望我看错了,但事实并非如此。我们开始非常专注地解决一个特定的问题,即构建一个出色的自然语言到 SQL 的搜索。
我们受到搜索引擎和 Google 故事的启发,因为我们也是从学术界转变为企业家的人。那是我们能够借鉴的唯一例子,所以这影响了我们如何解决 SQL 问题。我们没有像编码助手一样构建 SQL 问题的解决方案,而是作为搜索数据库的一种工具。我们构建的其中一个工具,一个原型实际上与 Stripe 相关。
我们看了一下,人们如何使用 Stripe Sigma 对他们的 Stripe 数据进行分析?我们构建了这个自然语言到 Stripe Sigma 2,因为它是 Presto 的某个版本,并不是每个人都知道如何编写它。
我们的一个投资者,Nat Fridman,实际上正在使用它来进行一些分析,比如 Stripe 数据,所有这些对我们来说都非常激动人心,但我们从来没有从真实使用中找到任何大的多巴胺或者吸引力,那只是每周几百个查询。
如果我们只是一个普通的初创公司,没有人会给我们他们的数据。没有人知道我们是谁,所以我们只能爬取外部数据并以规模构建一个酷炫的演示。也许他们看到了会给我们一些数据。
我们通过爬取整个 Twitter 做到了这一点,构建了这个称为“ birth sequel”的东西。我们称之为垂直,因为我们不被允许使用 Twitter 的名字,因为商标。但它实际上只是从 Twitter 中爬取了所有内容,将其组织成一堆表,并为其提供搜索功能。这工作得很好。
这就是我们得到所有最初投资者的方式,这在某种程度上受到了 Stripe 的启发,比如 Patricl 和 John 是如何筹集资金的,他们向人们展示演示,然后得到了一些很酷的天使,比如 Twitter 尾声或 Elon Musk。
如果你看看 Stripe 的天使投资者名单,那真的很了不起,这就是我们得到一些很酷的投资者的方式,包括 Jeff Dean,他试用了 Twitter 搜索演示,并说:“我从未使用过这样的东西,但我真的很喜欢。”
那时,他还没有看到任何类似于我们今天所做的事情,这就是为什么现在我们不公开说他是投资者,因为有利益冲突。随着我们的进展,我们不断意识到我们所做的所有工作,例如获取外部数据、处理它、将其放入结构化表格,然后让元素进行搜索,可以改为在预处理方面做很少的离线工作,并在推断时让 LLM 做更多的后处理工作,因为 LLM 变得越来越聪明了。
我们可以看到,我们从很旧的 GPT-3 模型和 Codex 开始。随着 GPT-3.5 的推出,比如 DaVinci 2 或 DaVinci 3 以及 Turbo,我们可以看到它们变得更便宜、更快、更好。
因此,我们改变了我们的策略,试着只获取链接,然后尝试从这些链接获取原始数据,并在推断时在线进行更多的工作。
这给了我们一种新的优势, Google 没有为此构建。Google 是为了在预处理步骤中做所有的工作,这是他们的拿手好戏。在这一点上,没有人能够击败他们。
但是,首次你不需要做所有这些。你确实需要做一些以提高效率和速度,但不像过去二十年里他们所做的那样多。
因此,我们推出了这个通用搜索,它只是获取链接并以引文的形式进行摘要。我们并且在免责声明中提出了一个声明,这是一个很酷的演示,是通过 GPT-3.5 和必应进行串联的,我们希望与更大的公司合作。
因此,请通过这封电子邮件与我们联系,我们仍然试图开展企业业务。我们确实收到了来自惠普和戴尔的电子邮件,询问如果我们使用类似的东西会是什么样子?但最终发生的是我们的使用量持续增长。这不仅仅是最初的激增,我们再进一步,让它变得更加对话,这样你就可以根据过去的查询和过去的链接提出后续问题,它会保留上下文,这是迄今为止没有人展示过的体验,包括 ChatGPT 在当时与网页浏览或类似事物无关。
然后我们的使用量每周都在增长,没有任何营销,纯粹靠口口相传。这相当令人兴奋,我们公司没有人想为另一个人的内部搜索或企业搜索工作,每个人都想做一些困难或令人兴奋的事情。
所以我就说,看起来这个东西正在起作用,它可能永远不会真正起作用。Google 可能会打败我们,微软可能会打败我们,但我们还是应该尝试一下,看看会怎样?这就是 Perplexity 今天的运作方式。
你们的 PMF 契合度很高,产品通过口碑传播得很广泛。我经常使用 Perplexity,你们构建的体验中非常惊人的一点是它速度很快,你们是如何做到的?如何使这样的体验变得如此迅捷的?
这就是为什么——“我们是一个 Wrapper”的观点不适用的原因。如果你只是一个 Wrapper,你不可能如此迅速。
当我们推出时,我们是一个 Wrapper,非常慢。自那时以来,我们已经花了很多时间建立我们自己的索引,为我们自己提供模型服务。
第三部分实际上比前两部分更重要,它只是将这两件事协调在一起,确保搜索调用和 LLM 调用尽可能并行进行,以及将网页的部分划分成片段,非常快速地检索它们,还要进行大量的异步调用,并努力确保尾部延迟最小化,这些都是你们从 Google 那里学到的概念,并不需要创新和建设。
Jeff Dean 和其他人有一篇关于字节分析的论文,解释了为什么它们如此重要,所以我们有一个优势,建立在这些概念之上,我们不断地对两种类型的延迟改进,实际延迟改进和感知延迟同样重要。
你可以通过用户体验中的创新来做到这一点。例如,OpenAI 应该得到赞赏。在所有的聊天机器人中,你看到的是流式答案。巴特一开始并没有做到这一点。
Bard 有一个等待时间,你只能得到完整的答案。当答案开始流动时,你已经感觉到了回应。你正在阅读它,并且这是一个技巧,这是一个关于让你感觉到你得到了一个快速回应的秘诀。因此,你可以在用户界面上做很多微妙的事情,让它感觉很快。我们希望两者都做得很好。
你提到了学习一些行业人士的经验,比如在 Google 工作过一段时间。我想你自己也在 Google 工作过。我认为你团队的其他成员也在一些其他大型老牌公司工作过。在像 Google 这样的地方工作的经验对 Perplexity 有何意义?
我认为工程文化,像尊重和追求工程卓越,是 Google 为硅谷创造的一种文化。这种文化在一些公司,如 Meta、OpenAI,我相信 Stripe 也都采纳了,这是我们也试图做的事情,重视工程卓越,重视诸如延迟之类的事情。
这些在其他大多数公司中可能不会成为有趣的晚餐谈资,但它们应该成为你公司的一部分,即使全体大会上的人不理解,我仍然会详细解释某人是如何做出改变的,这降低了我们的尾部延迟,即使有人不关心尾部延迟,我也会认为它很重要。这是因为你要重视它,你的行动要重视它,要试图招聘那些重视这一点的人,并试图奖励那些做出非常好贡献的人。
告诉我们更多关于你们内部运作的情况。比如,你们现在有多少人?你们是如何招聘的?你们是如何进行新员工入职以便能够为这个使命做出贡献的?
我们现在大约有 45 个人。我实际上对最初的几个招聘非常尊重,我认为帕特里克在一次采访中给出的一条智慧,即前 10 个招聘决定了接下来的 100 个招聘,所以你必须非常小心。
因此,我们从未在面试中招聘过头 10 人,甚至前 20 人,我会说所有这些人都经历了试用过程,这就是为什么他们会得到一个任务,并且他们会工作 3~4 天,我们会为此支付报酬,除非他们有移民问题,我们无法支付他们,但我们会在他们的初始薪资中进行调整。
我们这样做的原因有两个:一个是我们不知道如何面试,就像没有人知道如何面试一个初创公司的创始人时,你不能采取大公司的面试流程,因为这会拖慢你的速度,而且它也不会给你带来合适的人选。所以唯一的办法就是,就像 GPT 风险一样,你实际上没有智能的秘籍。
因此,训练系统变得聪明的唯一方法就是使它模仿人类智能。所以获得优秀人才的唯一方法就是看看如果你给他们一个任务,在工作周内你本来会给他们的任务,他们是否能够做得很好,你是否感到印象深刻,你是否从中学到了东西?这对我们来说效果非常好。