本训练数据是用于训练生成免抠图的文生图模型,通过文本描述直接生成带透明通道的分层图像数据,实现端到端的免抠图内容生产。其优势在于:1.通过文本直接输出透明背景图像,突破传统抠图步骤,快速满足跨场景视觉合成需求,如商品主图适配、广告元素嵌入、课件插图定制、表情包生成等;2.操作更便捷,通过自然语言交互降低专业设计门槛,使非技术人员可快速生成即用型分层素材。因此,最终训练得到的免抠图的文生图模型有助于用户自己生成需要的定制化素材元素,可广泛应用于电商商品展示、广告设计、新媒体内容创作、游戏影视素材生成、教育出版插图及个人社交娱乐等领域,为电商、广告、教育等行业的数字化内容生产提供基础设施级支持。
"1.数据采集:输入想要得到图片的相关文本描述:图片主体词和效果必加词。 2.数据处理:使用CLIP等跨模态模型并通过大设AI的增强XL模型,将输入的文本(图片主体词和效果必加词)生成大量符合文本描述逻辑的图片集A,调用抠图API自动抠取免抠的图片版本,生成免抠图集B。从免抠图集B中由人工筛选出边缘清晰和符合文本描述逻辑的最优图片。以上为完整的一次免抠图生成模式训练,如一次训练过程未能得到符合需求的最优图片,可根据实际需求情况持续优化文本描述词,以优化模型的训练结果模型迭代生成新的一轮数据,直至得到符合实际需求的最优图片。 3.评估反馈:后续训练免抠图生成模型利用新鲜样本及用户反馈持续学习。"
| 字段名 | 类型 | 描述 |
|---|---|---|
图片主体词 |
-- | -- |
效果必加词 |
-- | -- |
图片集A |
-- | -- |
免抠图集B |
-- | -- |
最优图片ID |
-- | -- |
| fieldName | exampleValue |
|---|---|
| 图片主体词 | woman living in the cyberpunk era |
| 效果必加词 | simple background, highres, 8k, transpa |
| 图片集A | 图片.png、图片1.png、图片2.png、图片3.png…… |
curl -H "Authorization: Bearer YOUR_API_KEY" \
http://localhost:3001/api/v1/datasets/183223