AI写的AI 周报|Vol. 20230326

01.产业新闻
微软推出了一个名为Copilot for Work的新AI工具,旨在帮助用户在工作中变得更加高效、有创造力和有技能。它将大型语言模型与Microsoft Graph和Microsoft 365应用程序中的用户数据集成在一起,允许用户创建、分析、表达、协作和取得更多成果。
微软Bing近日上线了AI绘图产品-Image Creator,该功能由微软投资的 OpenAI 旗下的的 DALL-E 提供技术支持,用户只需提供Prompt(形容词)即可生成出各类的AI图片。目前Bing Image Creator无需排队,用户可以直接使用。但目前只支持使用英文描述词,并且生成的图片左下角都会有 Bing 的logo水印。
Runway宣布推出Gen-2,这是一个多模态AI系统,可以从文本生成逼真的视频。您可以在4种不同的模式下使用Gen-2:文本到视频、图像到视频、文本+图像到视频(使用驾驶图像和文本提示生成视频)、样式化(视频到视频)和故事板(将模型转化为全面的样式化和动画渲染)。请查看网站上的示例,如“山脉的航拍无人机镜头”和“纽约市阁楼的傍晚阳光透过窗户”。
无需Waiting list,你现在就可以登陆 Microsoft Loop 并直接体验啦。
GitHub Copilot正在快速发展,将引入聊天和语音界面,支持拉取请求,回答文档上的问题,并采用OpenAI的GPT-4,为开发者提供更个性化的体验。
谷歌期待已久的语言模型服务终于来了。Bard是Lambda的轻量级版本,Lambda是几年前训练的一个70B参数的对话型代理人。他们花了很多心思来确保安全和真实性,我们将在人们开始加入等待名单后看看它是否能够兑现承诺!
第二个玩家进入游戏。Adobe推出了其Firefly模型的私人测试版。由强大的视觉团队支持,并获得了大量数据的支持,这家艺术公司现在准备提供自己的生成图像模型。有一个越来越被认可的假设,即技术的重要性越来越小,而分发仍然是王道,当两者结合起来时,我们将看到会发生什么!
继 3 月份发布新的 GPT-4 引擎和 Whisper API 之后,OpenAI 周四宣布已开始为 ChatGPT 引入插件。这些将使聊天机器人能够与第三方 API 交互,根据开发人员定义的特定情况定制其响应,同时扩展机器人的能力范围。
英伟达公司已经推出了自己的基础模型即服务平台。该平台将首次在企业领域推出,为专有数据提供定制化解决方案。该平台具有多模式能力,可以处理各种类型的数据,包括文本、图像、视频甚至三维内容,从而可以构建定制的多模式语言模型和生成模型,以适应特定的用例。与Getty Images、Shutterstock和Adobe等行业领导者的合作确保了版权问题得到有效处理。