谷歌发布AI图像生成工具Whisk：以图生图的新时代

1.4K 0

谷歌推出了一款名为 Whisk 的全新 AI 图像生成工具，用户可以使用其他图像作为提示来生成新的图像，而无需依赖冗长的文字描述。用户只需上传多张图片，即可定义生成图像的主题、场景和风格。Whisk 支持选择性地使用文字提示，使创作过程更加灵活多样。如果用户没有合适的参考图像，还可以通过点击骰子图标，由系统自动生成一些图像作为提示，这些图像同样是通过 AI 技术生成的。

图像生成的便捷性

在使用 Whisk 时，用户可以在生成图像的最后阶段，在文本框中添加一些文字，以补充目标图像的具体细节，但这并不是强制步骤。Whisk 会根据提供的图像和文字提示生成新的图像，并为每张图像生成相应的文字说明。用户如果对生成的结果感到满意，可以选择收藏或下载图像；若需进一步调整，也可以通过添加更多文字或编辑图像提示来进行优化。

设计初衷与用户体验

谷歌在官方博文中提到，Whisk 的设计初衷是为了实现快速的视觉探索，而不是进行像素级别的精细编辑。尽管如此，Whisk 在初步使用中依然带来了有趣的体验。生成图像的过程通常只需要几秒钟时间，尽管生成的图像有时可能会显得有些奇特，但所有的内容都非常容易进行迭代和修改。

技术基础与未来展望

Whisk 使用了谷歌最新发布的 Imagen 3 图像生成模型，这一模型的引入使得 Whisk 具备了更强大的图像生成能力。谷歌承认，Whisk 可能存在一定的“偏差”，因此提供了编辑底层提示的功能，确保用户能够更好地控制生成结果的质量和方向。随着技术的进步，Whisk 将继续为用户提供更加丰富和个性化的图像生成体验。