谷歌推出了其最新版本的文本生成图像模型 Imagen 4,并推出了高端版本 Imagen 4 Ultra。与前代产品 Imagen 3 相比,此次更新旨在显著提升文本渲染效果。目前,这两个版本已上线 Gemini API 的付费预览版,并在 Google AI Studio 提供有限的免费测试。
谷歌将 Imagen 4 定位为“适用于大多数任务”的通用模型,每张图像为定价 0.04 美元(IT之家注:现汇率约合 0.29 元人民币)。而 Imagen 4 Ultra 则被设计为能够更精准地遵循文本提示词的高端版本,其价格较普通版高出 50%,每张图像收费 0.06 美元(现汇率约合 0.43 元人民币)。谷歌声称,与 Dall-E 和 Midjourney 等其他图像生成器相比,Imagen 4 Ultra 的输出结果更为“出色(strong)”。
在展示环节中,谷歌展示了 Imagen 4 Ultra 生成的一系列图像,包括一幅三格漫画,内容是一艘小型宇宙飞船被一只巨大的蓝色太空蜥蜴攻击,漫画中还配有“嘎吱”等音效,甚至出现了令人费解的“哈迪”字样。该图像完全按照文本提示词生成,效果尚可,类似于 3D 应用程序中的卡通渲染效果。
另一个文本提示词是“京都复古旅行明信片的正面:樱花树下的标志性宝塔,远处的雪山,晴朗的蓝天,鲜艳的色彩”。Imagen 4 Ultra 按照提示生成了图像,虽然风格较为普通,但细节上基本符合要求。此外,还有展示登山情侣在岩石上挥手的图像,以及一幅“前卫”风格的时尚摄影图像。这些图像质量确实不错,也精准地符合了文本提示词,但整体仍然显得高度机械化。
尽管 Imagen 4 在性能上较前代有所提升,但其表现并未让人眼前一亮,尤其是在与市场领导者 Dall-E 3 和 Midjourney 7 相比时。此外,在最初的热情过后,公众对 AI 艺术的兴趣似乎正在消退,其主要应用场景似乎变成了社交媒体上的垃圾广告。
文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。
奥维云网(AVC)推总数据显示,2024年1-9月明火炊具线上零售额94.2亿元,同比增加3.1%,其中抖音渠道表现优异,同比有14%的涨幅,传统电商略有下滑,同比降低2.3%。
“以前都要去窗口办,一套流程下来都要半个月了,现在方便多了!”打开“重庆公积金”微信小程序,按照提示流程提交相关材料,仅几秒钟,重庆市民曾某的账户就打进了21600元。
华硕ProArt创艺27 Pro PA279CRV显示器,凭借其优秀的性能配置和精准的色彩呈现能力,为您的创作工作带来实质性的帮助,双十一期间低至2799元,性价比很高,简直是创作者们的首选。