谷歌推出了一款名为 Whisk 的全新 AI 图像生成工具,用户可以使用其他图像作为提示来生成新的图像,而无需依赖冗长的文字描述。用户只需上传多张图片,即可定义生成图像的主题、场景和风格。Whisk 支持选择性地使用文字提示,使创作过程更加灵活多样。如果用户没有合适的参考图像,还可以通过点击骰子图标,由系统自动生成一些图像作为提示,这些图像同样是通过 AI 技术生成的。
图像生成的便捷性
在使用 Whisk 时,用户可以在生成图像的最后阶段,在文本框中添加一些文字,以补充目标图像的具体细节,但这并不是强制步骤。Whisk 会根据提供的图像和文字提示生成新的图像,并为每张图像生成相应的文字说明。用户如果对生成的结果感到满意,可以选择收藏或下载图像;若需进一步调整,也可以通过添加更多文字或编辑图像提示来进行优化。
设计初衷与用户体验
谷歌在官方博文中提到,Whisk 的设计初衷是为了实现快速的视觉探索,而不是进行像素级别的精细编辑。尽管如此,Whisk 在初步使用中依然带来了有趣的体验。生成图像的过程通常只需要几秒钟时间,尽管生成的图像有时可能会显得有些奇特,但所有的内容都非常容易进行迭代和修改。
技术基础与未来展望
Whisk 使用了谷歌最新发布的 Imagen 3 图像生成模型,这一模型的引入使得 Whisk 具备了更强大的图像生成能力。谷歌承认,Whisk 可能存在一定的“偏差”,因此提供了编辑底层提示的功能,确保用户能够更好地控制生成结果的质量和方向。随着技术的进步,Whisk 将继续为用户提供更加丰富和个性化的图像生成体验。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...