2024年将是AI视频之年@英伟达高级科学家 Jim Fan
开源LLM和服务的激增——其中一些是为了不设置安全护栏来防止恶意使用而建立的——意味着这个领域仍然是一个未知数。
AI设计师Tatiana Tsiguleva提到,V6版本对提示词的理解更加精准,不再需要奇怪的短语或单词。此外,她补充说,Midjourney中的“--s”参数可以调整艺术风格,较低的值会产生更接近提示的结果,而较高的值则会增强艺术创造力。
除了可以从文字生成音乐外,它还支持图像、视频和音频生成音乐,并且还可以编辑已有的音乐。该项目利用了MERT等编码器进行音乐理解,ViT进行图像理解,ViViT进行视频理解,并使用MusicGen/AudioLDM2模型作为音乐生成模型(音乐解码器)。用户可以轻松移除或替换特定乐器,调整音乐的节奏和速度。这使得用户能够创造出符合其独特创意的音乐作品。
快科技2024年1月1日消息,据媒体报道,在2023年,英伟达创始人兼首席执行官黄仁勋的身价飙升至440亿美元(约合3132.8亿元人民币)。