OpenAI发最强图像生成模子API!可高档定制功能,价钱低至015元图
发布日期:2025-05-10 12:29    点击次数:107

迷水商城

智东西

编译 | 金碧辉

裁剪 | 程茜

智东西4月24日报谈,当天凌晨,OpenAI发布图像生成模子gpt-image-1,现在依然面向一起开拓者绽放API。该模子不仅大略生成高质地图像,而况不错完成一些更为高档定制的功能,比如不错通过竖立参数来限度审核明锐度,同期还不错限度质地、生成速率、配景、输出形态等。

迷水商城迷水商城

与ChatGPT之前的图像生告捷能比较,gpt-image-1不仅允许开拓者限度生成图像的明锐度、生生效用、配景、输出形态、渲染质地和压缩质地,而况在以下几个技巧层面作念了升级,对明锐度进行分级限度;使单张图像生成耗时从ChatGPT时期的平均3.2秒裁汰至0.8秒,完成生生效用优化;扩张输出形态至静态图、动态图、MP4、PSD等形态,升级到多形态输出守旧;将诀别率细化为三档,进行渲染质地分级;开拓均衡算法,作念到智能降噪。

此外,新模子守旧一次性生成多张图像,使用多张图像看成辅导词进行合成,罢了雷同Photoshop的蒙版功能以及改动图片透明度等功能,这些齐是之前版块所不具备的。

迷水商城

现在,gpt-image-1已通过API向公共开拓者绽放使用。在价钱方面,其API使用用度为文本输入每100万token 5好意思元(折合东谈主民币约为36.05元),图像输入每100万token 10好意思元(折合东谈主民币约为72.1元)。图像输出每100万token 40好意思元(折合东谈主民币约为288.39元)。按推行使用情况估算,生成低质地1024×1024图像老本约为每张0.02好意思元(折合东谈主民币约为0.15元),中等质地图像约为每张0.07好意思元(折合东谈主民币约为0.50元),高质地图像约为每张0.19好意思元(折合东谈主民币约为1.37元)。Adobe、Figma等繁多有名企业已将该模子集成到其产物中。

▲gpt-image-1模子的API价钱

OpenAI麇集独创东谈主兼CEO萨姆·阿尔特曼(Sam Altman)今天朝晨在酬酢平台X上推奖了该模子,并败露gpt-image-1模子与ChatGPT版块在图像生成速率、配景、形态上有不同之处。

▲图为萨姆·阿尔特曼今天朝晨在酬酢平台X上的发言

一、三大中枢亮点:多图生成、图像裁剪、图像变体

据OpenAI先容,gpt-image-1是OpenAI现在最新且开头进的图像生成模子。

正品迷水货到付款2024迷水商城

该模子第一个亮点是不错通过竖立n参数来进行图像生成端点,并笔据文本辅导创建图像。

▲图为gpt-image-1模子生成图像的具体参数

输入具体参数就不错生成一张图像质地高、高保确实图像。同期gpt-image-1能涵盖丰富各样的视觉立场,清高不同的创作需求。

第二个亮点是不错哄骗用户依然上传的一个或多个参考图像来创建新图像。

迷水商城365站群VIP

▲图为gpt-image-1模子使用4个输入图像来生成包含参考图像中物品的礼品篮的新图像。

迷水商城

第三个亮点是能哄骗精准的图像裁剪功能对用户上传的图像和蒙版进行“开拓”(inpainting)操作,蒙版透明区域将被替换,玄色区域保抓不变,且蒙版和要裁剪的图像必须形态和大小疏通,蒙疆土像还必须包含alpha通谈。

迷水商城

▲图为gpt-image-1模子哄骗图像裁剪功能进行“开拓”过的新图像。

此外,据OpenAI败露,API复返的是base64编码的图像数据,图像数据默许形态为png,但用户也不错申请生成jpeg或webp形态。要是使用jpeg或webp形态,用户还不错指定output compression参数来限度压缩级别(0-100%)。举例,输入“output compression=50”的指示gpt-image-1模子将把图像压缩50%。

还需要防御的包括,迷昏迷昏喷雾药方形图片以表率质地生成的速率最快,默许大小是1024×1024。

▲图为自界说输出的具体细节。

二、守旧高档功能定制,可考究化限度生成恶果

基于gpt-image-1,开拓者不错通过指定质地、大小、形态、压缩以及是否需要透明配景来自界说输出。举例,默许情况下API复返单个图像,但开拓者不错竖立“n”参数在单个申请中一次生成多个图像。

现在,图像生告捷能仅可通过Image API使用,OpenAI官方暗意正积极致力于将守旧扩张到Responses API。

迷水商城

在价钱方面,该模子通过生成挑升的图像token来生成图像,延伸和最终老本齐与渲染图像所需的token数目成正比,较大的图像尺寸和较高的明晰度竖立会耗尽更多的token从而产生较高的老本。

迷水商城

▲图为gpt-image-1模子笔据耗尽的不同的token数目可能产生不同用度。

Image API提供了三个不同功能的端点:第一个端点“Generations”可笔据文本辅导从新开动生成图像,第二个端点“Edits”能使用新的辅导部分或所有这个词修改现存图像,第三个端点“Variations”则用于生成现存图像的变体。

gpt-image-1具有高质地的图像生成和在图像创作中使用寰球常识的才智。据OpenAI先容,用户也不错将挑升的图像生成模子DALL·E 2和DALL·E 3与图像API联结使用。

迷水商城

▲图为gpt-image-1模子、DALL·E 2和DALL·E 3的端点以及用例。

三、复杂需求解决时间长,多轮生成难以保证一致性

尽管gpt-image-1模子功能远大且用途无为,但仍存在一些铁心。

迷水商城

在内容审核方面,通盘的辅导和生成的图像齐将笔据OpenAI官网的内容发布战略进行过滤。在使用gpt-image-1进行图像生成时,开拓者不错使用“moderation”参数限度审核的严格进度,该参数守旧“auto”(默许,表率过滤,铁心创建某些可能不相宜年事的内容类别)和“low”(铁心较少的过滤)两个值。

gpt-image-1在其他方面也有一些铁心。比如,该模子在解决复杂的辅导可能需要长达2分钟的时间,存在音讯延伸表象;同期,在文本渲染上,gpt-image-1比较DALL·E系列有权臣修订,但在精准的文本扬弃和明晰度方面仍可能存在问题;在一致性上,gpt-image-1尽管大略生成一致的图像,但在多轮生成中,关于一样出现的扮装或品牌元素,可能偶尔难以保抓视觉一致性;在构图限度上,尽管gpt-image-1在慑服指示方面有所修订,但在结构化或对布局明锐的构图中,精准扬弃元素可能仍有难堪。

迷水商城结语:OpenAI新模子API,解锁图像创作更多可能

OpenAI推出的gpt-image-1模子为开拓者带来了远大的图像生成用具,其丰富的功能和特质有望在图像创作、谋略等多个范围获得无为应用。

尽管存在一些铁心,但跟着技巧的握住发展和优化,将来其图像生成才智可能会进一步普及和完善,或为用户带来更多的惊喜和可能。

来源:OpenAI