1、Open-Sora 1.1版本发布
Open-Sora 1.1发布,这个新版本相较于之前的v1.0.0,具有更好的视频质量和更长的视频时长。
通过优化视频处理架构和使用更高质量的视觉数据,v1.1.0版本具有更强的性能和更高的推理效率,同时保持简洁的设计和数据效率。
译文:
📣 📣 📣 我们很高兴地宣布 Open-Sora Plan v1.1.0 的发布。
🙌 由于 ShareGPT4Video 对长视频进行注释的能力,我们可以生成更高质量和更长的视频。
🔥 🔥 🔥 我们将继续开源所有数据、代码和模型!
原文地址链接:
2、埃隆·马斯克的xAI在 B 轮融资中筹集了 60 亿美元
“xAI Corp”埃隆·马斯克去年成立的人工智能初创公司,刚完成了60亿美元的B轮融资,估值达到240亿美元。该公司计划利用这笔资金推出首批商业产品,并构建先进基础设施。
此外,xAI正计划建立一个拥有100,000个Nvidia GPU的超级计算机来支持其AI开发。
公司还推出了一个名为Grok的大型语言模型,可以生成文本和代码,并已向开发者开放了API。
这些资金也将用于开发更多工具,帮助软件团队更有效地使用其AI模型。
译文:
埃隆·马斯克(Elon Musk)刚刚为xAI筹集了60亿美元,现在估值为240亿美元。
特斯拉股东们,请仔细投票支持马斯克的薪酬计划。特斯拉要么将从xAI的投资中受益,要么最终与xAI和马斯克竞争
原文地址链接:
https://twitter.com/WholeMarsBlog/status/1795108387409014877
媒体新闻报道地址:
https://siliconangle.com/2024/05/27/elon-musks-xai-raises-6b-build-new-ai-services/
3、SignLLM:文字生成手语视频大模型
SignLLM是一款创新的多语言模型,能将文字描述转化为手语视频,支持美国手语和其他七种国际手语。
这个工具利用了一个丰富的多语言手语数据集“Prompt2Sign”,确保生成的手语视频既自然又流畅。
SignLLM的应用场景广泛,如教育、医疗、法律和日常生活,特别对听力障碍者非常有帮助,提供即时的手语翻译服务,改善沟通体验。
这种技术的推广有望极大提升手语使用者的生活质量和社会参与度。
译文:
SignLLM 是第一个可以从输入文本生成手语手势的多语言手语模型!
我不会说手语,谁能告诉我这些到底有多好?特别是因为手部变形 😅
9 个示例 + 链接 ⬇️
原文地址链接:
https://twitter.com/dreamingtulpa/status/1795060142473351423
4、GitHub推出了 Copilot Workspace将传统编码转变为自然语言交互
译文:
GitHub 首席执行官 Thomas Dohmke 推出了 Copilot Workspace,该工具允许用户通过编辑简单的英语来创建应用程序。这将开发从传统编码转变为自然语言交互。
原文地址链接:
https://x.com/7etsuo/status/1794949414903271840
5、杨立昆表示监管大模型为时过早
杨立昆表示,目前人工智能系统还是安全可控的,目前还没有一个真正能达到人类等级的大模型,现在对其监管以防止“生存危机”还为时过早
埃隆·马斯克表示需要提前做好监管的准备
网友表示,AI和以往的产品不同,他是一个黑匣子,我们不能精确的预测结果,这很有可能带来危害
杨立昆回复:进行实验的全部意义就是为了检查结果如何。 无论在哪个领域都是如此。
译文:
人工智能不是某种自然现象,它会突然出现并变得危险。
*我们*设计它,*我们*建造它。
我可以想象涡轮喷气发动机出现严重错误的数千种情况。
然而,在广泛部署涡轮喷气发动机之前,我们设法使涡轮喷气发动机变得非常可靠。
对于人工智能来说,这个问题是类似的:
“我们是否认为至少存在一种人工智能系统的设计,它同时是安全/可控的,并且可以以比人类更智能的方式实现目标?”
如果答案是肯定的,我们会没事的。
如果答案是否定的,我们不会构建它。
现在,我们甚至没有一丝人类级智能系统的设计。
所以现在担心还为时过早。
现在对其进行监管以防止“生存风险”还为时过早。
原文地址链接: