• Jojo's NewsLetter
  • Posts
  • MetaGPT登顶GitHub榜单第一。现实版瓦力来了,Google发布新模型RT-2

MetaGPT登顶GitHub榜单第一。现实版瓦力来了,Google发布新模型RT-2

AI制作电影Genesis预告片走红。今日实测AI工具:2023年人人都能写歌,歌曲生成AI Suno

2023/07/31 Monday

希望大家周一也有一个好心情。今天AI界又有哪些有意思的新闻和趣事呢?请继续往下看吧。

🚀MetaGPT登顶GitHub榜单第一

🤖现实版瓦力WALL-E机器人来了,Google发布新模型RT-2

🎬首部AI制作电影Genesis预告片发布

🚀MetaGPT登顶GitHub榜单第一

上周五jojo新视频讲的MetaGPT在GitHub上爆火,一度登顶榜单第一,目前已经获得了7500个星标。

MetaGPT 模型可以抽象出了多个不同角色,包括产品经理、架构师、项目经理、工程师等,可在代码生成时,自己进行内部监督,提升最终输出的代码质量,可谓将一个软件开发公司直接融入进模型中。目前MetaGPT已经能实现一句话自动编写一个比较简单的软件项目。90后程序员也是作者吴承霖表示,生成一个完整的项目,最终只需要2美元(折合人民币约14.3元)左右。

如果大家还没看过视频或不知道怎么用MetaGPT的话可以点击下方视频链接。

皮克斯的《机器人总动员》相信各位朋友都看过吧?里面楚楚可怜的小瓦力从诞生以来就是互联网上最火的虚拟角色之一。最近Google旗下的 DeepMind 发布了新款 RT-2(Robotic Transformer 2),它是一种独特的视觉-语言-行动(VLA)模型,可以从网络和机器人的数据中学习,并将这些知识转化为控制机器人的通用指令。过去训练机器人需要很长时间,研究人员必须单独规划研究方向。现在借助 RT-2 等 VLA 模型的强大功能,机器人可以获得大量数据集后,推断下一步该做什么。

DeepMind 在一篇论文中表示,新模型以网络和机器人数据进行训练,也利用自家的 Bard 等大型语言模型的研究进展,与机器人自身数据相互结合,例如决定需要移动哪个机器臂关节等,甚至能够理解英语以外的其他语言指令。

DeepMind 举例,RT-2 可以让机器人在没有经过特定训练的条件下识别和扔掉垃圾,以 AI 试图理解垃圾是什么以及通常如何处理垃圾,来引导行动。

🎬首部AI制作电影Genesis预告片发布

这边好莱坞演员和编剧还在风风火火的罢工,那边AI已经开始在悄咪咪的制作电影和动画了。

一部由AI制作的科幻电影预告片《Genesis》最近在Reddit和Twitter(现在叫X,真是无力吐槽)走红。这个预告片是由德国的Elli by Volkswagent的高级产品设计师Nicolas Neuber创作,Midjourney处理图像、Runway处理视频、Pixabay处理音乐、CapCut剪辑视频。据悉,Neubert花了7个小时,用Midjourney生成了316个提示,将128张图像在Midjourney中升级,用Runway生成了310个视频,还有一个用texta生成的视频。预告片一共使用了44个视频。总成本:Runway 95美元,Midjourney 30美元(共125美元)。

然而关键的元素:概念、故事、编辑和音乐仍然由作者完成。除了《Genesis》外南方公园South Park也有非官方的AI版本了,不过因为South Park一向很黄很暴力我就不在这里贴了,各位可以去YouTube上搜索 “The Queepi Quandry"观看。

🔧今日实测AI工具推荐

Suno.ai- 2023年人人都能写歌,如果你想给自己或亲戚朋友写一首歌的话可以试试Suno
短视频教程: