Stability AI开源旗下生图模型,人手一个Midjourney,做图圈炸了!

AI资讯2年前 (2023)发布 GPTHub
93 0

一次开源一次爽,一直开源一直爽。

昨天,StabilityAI在官网上宣布了令人振奋的消息!他们决定将旗下备受瞩目的文生图应用DreamStudio开源,并将其改名为StableStudio。这一重大举措标志着StabilityAI在图片生成领域迈入了全新的篇章,同时也展现了他们推广开源模型的坚定决心。

Stability AI开源旗下生图模型,人手一个Midjourney,做图圈炸了!

StableChat。这个聊天界面将与StableStudio紧密结合,为用户提供与AI模型互动的全新方式。

StabilityAI的开源决策引起了广泛的关注和期待。开源模型将吸引更多开发者和研究者的参与,共同推动生成性AI的发展。通过建立合作关系和社群,StabilityAI致力于打造一个由用户控制的AI界面,让用户在生成图像方面拥有更大的自主权和创造力。

StableStudio作为StabilityAI的旗舰项目,将继续承担着展示最新模型和功能的重要角色。然而,StabilityAI的雄心壮志是将StableStudio打造成一个独立的项目,并超越其他独立公司的成就。

StableStudio的起源可以追溯到Disco Diffusion下的动画工作室。随着Stable Diffusion的发布,StabilityAI将重心转向图像生成,并致力于为生成性AI创造出强大而多样化的体验。

随着即将推出的StableChat聊天界面,StabilityAI将进一步拓展用户与AI模型的互动方式,为用户提供更便捷、创新的体验。

Stability AI开源旗下生图模型,人手一个Midjourney,做图圈炸了!Stability AI开源旗下生图模型,人手一个Midjourney,做图圈炸了!

人手一个Midjourney?

Stability AI开源旗下生图模型,人手一个Midjourney,做图圈炸了!

今年3月,DreamStudio发布了最新的更新,其中包括稳定扩散微调(Stable unCLIP 2.1, Hugging Face)。该模型的分辨率为768×768,基于SD2.1-768。

这个新模型的一个显著特点是可以进行图像变化和混合操作。由于其模块化设计,它还可以与其他模型进行结合,例如KARLO。在这个模型中,有两个变体可供选择:Stable unCLIP-L和Stable unCLIP-H。它们分别以CLIP ViT-L和ViT-H图像嵌入作为条件。

现在让我们来看一些由StableStudio生成的图片,这些图片展示了其强大的图像生成能力。

Stability AI开源旗下生图模型,人手一个Midjourney,做图圈炸了!

不得不说,和Midjourney比真是不遑多让。

Stability AI开源旗下生图模型,人手一个Midjourney,做图圈炸了!

开源一直是StabilityAI家族的优良传统。

就在上个月,StabilityAI宣布推出了他们的第一个大语言模型——StableLM。

这个消息值得关注,因为StableLM也是开源的,用户可以在GitHub上找到相关资源。该模型的参数规模从3B和7B开始,未来还将推出15B到65B的版本。

此外,StabilityAI还发布了用于研究目的的RLHF微调模型,进一步展示了他们在开源方面的努力。

Stability AI开源旗下生图模型,人手一个Midjourney,做图圈炸了!

根据StabilityAI官方声称,Alpha版本的StableLM拥有30亿和70亿个参数,未来还将推出150亿到650亿参数的后续版本。

令人震惊的是,StabilityAI表示开发者可以尽情使用StableLM,只要遵守相关条款。无论是检查、应用还是改编基础模型,开发者都有充分的自由。

StableLM不仅功能强大,可以生成文本和代码,还为下游应用程序提供了技术基础。它是一个优秀的范例,展示了小型、高效的模型经过适当训练就能达到出色的性能

Stability AI开源旗下生图模型,人手一个Midjourney,做图圈炸了!

在早期,Stability AI与非营利性研究中心Eleuther AI共同开发了一系列语言模型,这为Stability AI打下了深厚的积淀。

例如,GPT-J、GPT-NeoX和Pythia都是两家公司合作训练的成果,它们是在The Pile开源数据集上进行训练的。随后,诸如Cerebras-GPT和Dolly-2等更多的开源模型也是这三个模型的后续产品。

回到StableLM,它是在基于The Pile的新数据集上进行训练的,该数据集包含了1.5万亿个token,大约是The Pile规模的3倍。该模型的上下文长度为4096个token。Stability AI即将发布的技术报告将公布模型的规模和训练设置。

Stability AI开源旗下生图模型,人手一个Midjourney,做图圈炸了!

 

© 版权声明

相关文章