首页 > 科技 > > 正文
2024-02-22 11:15:11

Imagen 2是谷歌的下一代图像生成模型现已推出

导读 由于Imagen 2 和 Gemini Pro 的加入,该公司的人工智能聊天机器人Google Bard从今天开始变得更加智能。这两个人工智能模型将帮助巴德...

由于Imagen 2 和 Gemini Pro 的加入,该公司的人工智能聊天机器人Google Bard从今天开始变得更加智能。这两个人工智能模型将帮助巴德给出更好的响应和更高质量的图像。

谷歌去年发布了Gemini Pro,新的AI模型已经出现在巴德的部分地区。然而,Gemini Pro现在正在为巴德在全球范围内进行重大扩展提供支持。总的来说,Bard 目前有 40 多种语言版本,覆盖 230 多个国家和地区。

Bard 的最佳功能之一是双重检查,它允许用户只需轻按一下 Google 徽标即可验证 Bard 的响应是否准确。该工具将巴德的答案与类似的互联网结果进行交叉检查,以检查准确性。它旨在提高用户对 Bard 的信心,因为像所有人工智能聊天机器人一样,它有可能产生幻觉。从今天开始,双重检查可支持 40 多种语言,而之前仅限于英语。

然而,更大的补充是 Imagen 2,谷歌去年年底推出的文本到图像模型。关于为什么 Imagen 2 是之前图像生成模型的升级,Google 是这么说的:

谷歌在一份新闻稿中表示:“Imagen 2 接受了更高质量的图像描述配对训练,并生成更详细的图像,这些图像与人们语言提示的语义一致。” “它比我们以前的系统在处理细节方面更准确,并且更能够捕捉细微差别 - 在各种风格和用例中提供更加逼真的图像。”

Imagen 2 使用基于扩散的模型,旨在提供比同类图像生成工具更好的图像。例如,一些图像生成器难以处理文本、面部和手等内容。谷歌表示,Imagen 2 特别在创建更真实的脸部和手部方面进行了改进。

对于最终用户而言,Bard 中包含 Imagen 2 意味着根据文本提示生成的图像将更加美观,并且能够更准确地表示初始提示。

谷歌强调 Imagen 2 和 Bard 都使用“负责任的人工智能”,这已经意味着很多事情。Imagen 2 不会创建暴力、攻击性或包含色情内容的图像。此外,Imagen 2 还进行了一些训练,帮助它“避免”创建特定人物的图像。然而,根据该措辞,用户在某些情况下可能可以创建指定人物的图像。

使用 Imagen 2 生成的任何图像都将具有数字 SynthID 水印。用户在查看 AI 图像时看不到这些内容,但它们仍然存在并且可以检测到。