输入“/”快速插入内容

Daily Summary|Vol. 20230914

01.产业资讯
在将 Firefly 生成式 AI 模型推出测试版一百七十六天后,Adobe 今天宣布 Firefly 现已在其 Creative Cloud、Adobe Express 和 Adobe Experience Cloud 中全面商用。例如,这意味着 Photoshop 中的生成填充和生成扩展等 Firefly 功能现在无需安装测试版即可使用。
Stability 声称该工具是第一个能够通过称为潜在扩散的技术创建用于商业用途的“高质量”44.1 kHz 音乐的工具。Stability 表示,经过音频元数据以及音频文件的持续时间和开始时间的训练,Audio Diffusion 的底层大约 12 亿个参数模型比之前发布的生成音乐工具能够更好地控制合成音频的内容和长度。
谷歌的慈善部门将投资2000万美元用于数字未来项目,以促进负责任的 AI 发展。该倡议支持全球机构,解决 AI 对社会的影响。Google.org强调通过合作来实现 AI 的潜在益处。
Roblox推出了一个 AI 助手,帮助创作者设计虚拟体验。该工具计划在今年年底或明年初发布,将实现高级游戏玩法和3D模型生成。
Adobe、IBM、Nvidia等公司已承诺遵守白宫关于 AI 安全与可信性的协议,呼应了Meta和Google之前的承诺。这些自愿协议强调在发布前进行测试和风险共担。在拜登政府领导下, AI 监管仍然落后于创新。
02.工程研究
光学字符识别(OCR)是从图像中提取文本的过程。它在包含大量行业术语或数学等特殊字符的文件上可能会失败。Facebook的研究工作展示了在学术领域的强大性能,能够实现许多旧文本的数字化。
研究人员通过对数千个手工标记的分子数据集进行图神经网络的训练,成功地训练出一种能够准确识别气味的模型。
这项研究探讨了像InstructGPT这样的先进 AI 写作助手是否使人们的写作听起来过于相似,可能导致公共对话的多样性减少。
研究人员推出了Scenimefy,一种将日常照片转化为详细的动漫风格图像的新工具。
通过使用分层检索器,Arcus将RAG扩展到星球规模。在根据语义内容将文档聚类成组后,可以逐步在这些组中进行过滤以缩小搜索空间。这样可以检索到更相关的上下文,减少虚假信息,并提高对星球规模数据语料库的可靠性。
MLCommons发布了一个新的基准测试,用于评估顶级硬件运行 AI 模型的速度,Nvidia排名第一,Intel排名第二。
03.资源效率
Whisper Turbo是OpenAI Whisper API的替代品,提供比原版快20倍的转录速度,使用Rust编写。