分享
AI写的AI 周报|Vol. 20230326
输入“/”快速插入内容
AI写的AI 周报|Vol. 20230326
01.产业新闻
🔗 微软推出面向Microsoft 365的下一代AI Copilot
微软推出了一个名为Copilot for Work的新AI工具,旨在帮助用户在工作中变得更加高效、有创造力和有技能。它将大型语言模型与Microsoft Graph和Microsoft 365应用程序中的用户数据集成在一起,允许用户创建、分析、表达、协作和取得更多成果。
🔗 微软Bing AI绘图上线
微软Bing近日上线了AI绘图产品-Image Creator,该功能由微软投资的 OpenAI 旗下的的 DALL-E 提供技术支持,用户只需提供Prompt(形容词)即可生成出各类的AI图片。目前Bing Image Creator无需排队,用户可以直接使用。但目前只支持使用英文描述词,并且生成的图片左下角都会有 Bing 的logo水印。
🔗 Runway宣布推出Gen-2(产品发布)
Runway宣布推出Gen-2,这是一个多模态AI系统,可以从文本生成逼真的视频。您可以在4种不同的模式下使用Gen-2:文本到视频、图像到视频、文本+图像到视频(使用驾驶图像和文本提示生成视频)、样式化(视频到视频)和故事板(将模型转化为全面的样式化和动画渲染)。请查看网站上的示例,如“山脉的航拍无人机镜头”和“纽约市阁楼的傍晚阳光透过窗户”。
🔗 微软协作平台 Microsoft Loop 可以体验啦
无需Waiting list,你现在就可以登陆 Microsoft Loop 并直接体验啦。
🔗 微软宣布 GitHub Copilot X发布
GitHub Copilot正在快速发展,将引入聊天和语音界面,支持拉取请求,回答文档上的问题,并采用OpenAI的GPT-4,为开发者提供更个性化的体验。
🔗 Google推出Bard语言模型
谷歌期待已久的语言模型服务终于来了。Bard是Lambda的轻量级版本,Lambda是几年前训练的一个70B参数的对话型代理人。他们花了很多心思来确保安全和真实性,我们将在人们开始加入等待名单后看看它是否能够兑现承诺!
🔗 Adobe自主开发的生成模型
第二个玩家进入游戏。Adobe推出了其Firefly模型的私人测试版。由强大的视觉团队支持,并获得了大量数据的支持,这家艺术公司现在准备提供自己的生成图像模型。有一个越来越被认可的假设,即技术的重要性越来越小,而分发仍然是王道,当两者结合起来时,我们将看到会发生什么!
🔗 OpenAI 正式发布 ChatPT插件系统
继 3 月份发布新的 GPT-4 引擎和 Whisper API 之后,OpenAI 周四宣布已开始为 ChatGPT 引入插件。这些将使聊天机器人能够与第三方 API 交互,根据开发人员定义的特定情况定制其响应,同时扩展机器人的能力范围。
🔗 英伟达进军基础模型即服务领域
英伟达公司已经推出了自己的基础模型即服务平台。该平台将首次在企业领域推出,为专有数据提供定制化解决方案。该平台具有多模式能力,可以处理各种类型的数据,包括文本、图像、视频甚至三维内容,从而可以构建定制的多模式语言模型和生成模型,以适应特定的用例。与Getty Images、Shutterstock和Adobe等行业领导者的合作确保了版权问题得到有效处理。
🔗 比尔·盖茨谈AI时代
比尔·盖茨称AI的发展是自引入图形用户界面以来技术进步中最重要的一步。盖茨特别关注AI在减少全球不平等方面的潜力,包括预防可预防疾病导致的儿童死亡、改善教育和缓解气候变化影响。然而,他也承认AI引发了伦理和社会问题,如劳动力置换、隐私和偏见,并呼吁政府和慈善组织确保技术减少不平等。
🔗 Canva 开放 10 项 AI 能力
Canva 开放 10 项 AI 新功能在其官方主页上,AI 能力将覆盖文稿、图像以及动画。
02.
研究动态
🔗 HuggingFace支持LLaMA(GitHub仓库)
Meta的开源模型,其权重本月早些时候被泄漏,现在已包含在流行的Transformers库中,目前仅在主分支上,但现在可以使用该模型训练Stanford的Alpaca,使用他们的训练代码。
🔗 Semantic Kernel(GitHub Repo)
语义内核(SK)是一个轻量级的SDK,可将AI LLM与传统编程语言集成。
🔗 DiffusionRet:扩散模型生成的文本-视频检索
该论文介绍了DiffusionRet,一种基于扩散的文本-视频检索框架,从生成视角建模文本和视频之间的相关性,即它们的联合概率p(candidates, query)。DiffusionRet通过生成损失和对比损失来优化生成器和特征提取器,利用生成和判别方法实现卓越的性能,即使在域外检索设置下也能在五个常用的文本-视频检索基准测试中取得优异的表现,并为相关领域带来了基本的见解。
🔗 谷歌提出SVDiff,一种个性化的文本到图像扩散模型
来自谷歌的研究人员提出了一种新的方法,称为SVDiff,以解决现有文本到图像扩散模型的个性化限制,包括过度拟合和低效的参数存储。SVDiff涉及微调权重矩阵的奇异值,从而产生一个紧凑而高效的参数空间,降低过度拟合、语言漂移的风险,并且具有显著较小的模型大小,使其更适合实际应用。
🔗 数据去重技术