输入“/”快速插入内容

Daily Summary|Vol. 20230516

01.产业新闻
本文包含对Sundar的采访记录,他在采访中讨论了搜索,谷歌和Alphabet AI 团队的重组,他对谷歌未来的愿景以及推动其增长的因素等等。
该Twitter帖子包含Copilot Chat的机密规则。
Firefox与谷歌的合同即将到期,微软希望浏览器将Bing作为默认搜索引擎。苹果与谷歌的默认浏览器合同将于明年到期,这为微软提供了一个机会,让Bing成为Safari的默认浏览器。微软看到了这种合作伙伴关系的潜力,可以提高Bing的使用量。这些交易可能无法保证必应的使用量增加。
02.研究动态
Blip是由Salesforce开发的一个模型,可用于视觉和语言任务。按照语言模型中调整它们以遵循指令的工作线,我们还可以调整这些视觉语言模型以遵循指令。这极大地提高了性能,在这种情况下,它甚至超过了 GPT-4 的已发布数量。
本文讨论了谷歌引入一种新的生成式AI模型Codey,旨在帮助程序员编写代码。Codey 是一种代码生成模型,可以为用户提供建议、识别错误,甚至完成整个代码块。它旨在通过帮助用户快速有效地找到解决方案来简化编码过程并提高开发人员的工作效率。
缩放定律表明,随着更多数据和计算能力的增加,大型语言模型(LLM)在预测单词方面将变得更好。但是,虽然增加数据集大小可能是可行的,但要使它们比当前状态大 10 倍以上,则存在潜在的障碍,例如成本。使用现有技术将LLM扩展到最大潜力的成本将远远高于地球的GDP。可能存在计算限制。由于用于拟合模型的数据和计算量很少,当前的缩放定律可能不准确。
全面介绍快速注入,这是 AI 领域使用的一个术语,用于描述故意将特定输入插入 AI 模型以获得所需输出的做法,包括为什么这是一个重要问题以及为什么许多提出的解决方案不会有效。
已经创建了一种新技术,该技术使用预设的文本到图像模型来提高模糊图像的质量。该方法巧妙地使用了专用编码器,无需更改现有的图像制作模型,节省了训练时间。此外,用户可以通过简单的调整来控制图像质量。该策略还比以前的方法更好地处理较大的图像。人工和真实世界图像的测试证明它比当前的解决方案更有效。
检测场景中的对象时,通常从一组预定义的类中提取。此外,询问有关场景的问题也具有挑战性。在这种情况下,我们可以使用强大的语言模型(Vicuna)和指令调谐的检测器来推理查询并因此检测对象。
现代 ML 需要跨许多硬件加速器(如 GPU)进行计算。在代码中做到这一点是很棘手的。Jax在许多实验性功能方面一直处于领先地位。Shmap是一系列创新中的另一项。它功能强大,可以轻松实施现代算法和可扩展的训练。
语言模型使用检索来获取最新信息或不适合上下文的信息。这种前瞻性检索使用谷歌搜索API和来自Open AI的大型语言模型来构建强大的检索问答系统。
Cohere是一家初创公司,提供类似于其他大玩家的语言模型API,它们具有一组可用于构建应用程序的强大模型。这所语言模型大学旨在让您快速了解现代语言模型,并展示如何使用 Cohere 的工具构建它们。
03. 产品体验
一个用于使用 Bard 的逆向工程API,由谷歌最新的LLM提供支持;帕LM-2。