,Techritual 香港科技电脑资讯网站,,Techritual 香港科技电脑资讯网站,,Apple AI 出来了!它能让你用文字描述来执相,08/02/2024, 十斗,175,,
这款名为 MGIE 的模型是苹果与加州大学圣塔芭芭拉分校合作开发的,它可以通过文本提示对图像进行裁剪、调整大小、翻转和添加滤镜。
MGIE 代表多模态语言模型引导图像编辑,可应用於简单和复杂的图像编辑任务,例如修改照片中的特定对象,使其呈现不同的形状或更明亮。该模型结合了多种不同的语言模型使用方式。
首先,它学习如何解读用户的提示,然後「想像」出修改後的效果(例如,要求照片中的天空呈现更蓝色,就会增加图像中天空部分的亮度)。
在使用 MGIE 编辑照片时,用户只需输入他们想要改变的图片内容。该论文举了编辑一张意大利辣肠披萨的图片的例子。输入提示「使其更健康」将添加蔬菜配料。一张在撒哈拉沙漠中的老虎照片看起来很暗,但在告诉模型「增加对比度以模拟更多光线」的指示下,照片变得更亮。
研究人员在论文中表示:「MGIE 不仅提供简短但含糊的指导,还能够明确地解读视觉意图,从而实现合理的图像编辑。我们从各个编辑方面进行了广泛的研究,并证明了我们的 MGIE 在保持竞争效率的同时有效提升了性能。我们还相信 MLLM 引导的框架将对未来的视觉与语言研究做出贡献。」苹果已经通过 GitHub 提供了 MGIE 的下载,但还在 Hugging Face Spaces 上发布了一个网络演示。该公司没有透露这款模型在研究之外的计划。
一些图像生成平台,如 OpenAI 的 DALL-E 3,可以通过文本输入对其创建的图片进行简单的照片编辑任务。作为图像编辑的首选,Adobe(Photoshop 的创建者)也拥有自己的 AI 编辑模型。其 Firefly AI 模型可以生成填充,为照片添加生成的背景。
按此即看更多:AI 人工智能 新闻
按此即看更多:免费使用 ChatGPT-4 的 6 个方法
按此即看更多:5 个「香港」免费使用 ChatGPT-4 的方法
,Techritual 香港River