🌈 应对风格化场景:该方法不仅局限于真实场景,还能应对风格化场景的挑战,通过文本提示如“水彩夜街”和“未来夜城”展示创造力和适应能力。
提示一如既往地重要,但提示工程(乱用令牌)的重要性将下降。
Midjourney更倾向于使用光影效果增加图片的真实感,这也是让人印象深刻的地方。在艺术性和还原性方面,Midjourney明显取得了胜利。AI生成的图像真实性甚至局限性都成为了吸引网友参与讨论、分享和二次创作的流量密码。
使用v0构建的任何内容都需要进行大量修改,否则最终看起来像是业余产品。我赞扬这个努力,但UI设计是复杂且动态的。我们还没有到AI能够始终产生一流UI设计的地步,但它为你的UI提供了一个起点。
LLaVA是一个端到端训练的多模态大模型,它将视觉编码器和用于通用视觉和语言理解的Vicuna相结合,具备令人印象深刻的聊天能力。而CogAgent是在CogVLM基础上改进的开源视觉语言模型,拥有110亿个视觉参数和70亿个语言参数。