分享
Daily Summary|Vol. 20230815
输入“/”快速插入内容
Daily Summary|Vol. 20230815
01.产业资讯
🔗 亚马逊如何通过定制AWS芯片赶超微软和谷歌
亚马逊在2013年悄悄开始生产定制芯片。它推出了自己的基于Arm架构的服务器芯片,作为对AMD和英特尔x86 CPU的竞争对手。亚马逊在2018年推出了以 AI 为重点的芯片,比谷歌宣布其首款Tensor处理单元早了两年。本文探讨了亚马逊在为企业提供生成式 AI 应用基础设施方面的策略。
🔗 Nvidia Nemo语言+视觉模型
Nvidia 可以通过其 Nemo 模型轻松训练你自己的视觉-语言助手。
🔗 微软发布世界上最好的开源数学模型
微软的 WizardLM 小组发布了世界上最好的开源数学模型。它在解决多步问题时非常出色。这个模型有时会产生幻觉,这在数学上非常有趣,并提供解释。我认为对于那些有兴趣学习数学的人来说,这可能是最好的教育模型之一。
🔗 HuggingFace 文本生成界面的开源分支
Hugging Face 最近从其先前的开源包中移除了商业许可。该包现在已经由 Preemo 进行分支,将作为开源包继续开发。
🔗 吴恩达关于 LLM 世界模型的观点
最近的研究表明,像 Othello-GPT 这样的 LLM 构建了世界模型,这意味着它们在某种程度上理解了世界。该网络通过在没有明确游戏规则的情况下训练游戏步骤,识别出了潜在的8x8棋盘结构和游戏规则。这挑战了传统的观念,比如约翰·西尔的中文房间论,关于机器理解的论点。
🔗 ChainML 发布了 Council
ChainML 最近推出了 Council —— 一个开源的 AI 代理平台,可以轻松快速地开发和部署定制的生成式 AI 应用,使用协作式的 AI 代理。Council 与各种 LLM 模型集成,如 GPT-4、Llama 2 和 Claude 2,为商业应用解锁生成式 AI,实现了以前通过拥有复杂控制流的 AI 代理无法实现的用例。
02.工程研究
🔗 SDXL ControlNet
控制图像生成的最佳方法之一是使用边缘来对最终输出进行条件约束。最好的开源模型 SDXL 具有一个经过训练并且可以立即使用的 ControlNet 变体。
🔗 用于评估代码模型的安全系统
在与编写代码的语言模型一起工作时,一个难题是评估生成的代码的质量。这很困难,因为运行任意代码对于系统来说是危险的。代码可能做任何事情,包括删除所有内容。MosaicML 提供了一个安全的环境来评估生成的代码。
🔗 跟随任何事物:一款能够跟踪任何物体的机器人
一种名为“跟随任何事物”的机器人系统可以实时识别、跟踪和追随任何物体,即使它以前从未见过。这个智能机器人可以仅通过文本描述、图片甚至简单的点击来识别物体,所有这些都由普通笔记本电脑提供动力!
🔗 机器学习模型是记忆还是泛化?
本文探讨了微小模型的训练动态,并对其找到的解决方案进行了逆向工程。它展示了机械可解释性这一令人兴奋的新兴领域的例子。
🔗 在分类之前放大图像
在对图像进行分类之前,如果你放大图像中显著的部分,你可以在 ImageNet 数据集上获得98%的准确率。这对于实际的计算机视觉系统来说是一种有趣且相对简单的实现方法。
03.资源效率
🔗 Supabase Studio 3.0
Supabase Studio 3.0 正式推出,带来了一些重大的新功能,其中包括全新的 Supabase AI,集成到 SQL 编辑器、模式图以及新的包装器中。