通过构建一个包含大量自由类别物体、且均为水密性的3D打印模型及其对应的单张或多张渲染图片的大规模配对数据集,可以为深度学习模型提供训练基础,使其学习从二维物体图像生成完整的三维几何。这一数据集主要适用于桌面游戏棋子和微缩模型的定制、个性化的物体模型快速制作、虚拟化身的实体化打印以及内容创作等领域。利用该数据训练出的模型,能够让用户通过上传一张照片来生成一个可直接用于3D打印的对应模型,解决了从零开始制作三维模型技术难度极高、周期漫长且成本昂贵的问题。
基于单张图片生成自由类别的可3D打印模型,旨在让三维人形创作大众化。具体过程包括:(1)数据收集:用户提供一张包含清晰物体主体的RGB图片(I_rgb)(2)数据处理:将输入的图片送入一个在物体图像上经过优化的预训练图像编码器。特征向量通过公式 F_image = Encoder_image(I_rgb) 提取,其中 F_image 为图像特征向量,Encoder_image 为图像编码器。(3)模型构建:使用提取的图像特征向量作为输入,设计并搭建一个专注于物体三维模型生成的深度解码模型。该模型从特征中推断并生成物体模型的隐式三维表示。根据公式 SDF = Decoder_3D(F_image) 从图像特征中解码出三维物体模型,其中 SDF 为三维模型,Decoder_3D 为三维形状解码器。关键的评估指标包括交并比(Intersection over Union, IoU)和倒角距离(Chamfer Distance, CD)。此方法适用于从单张照片快速生成个性化的物体模型,极大地降低了三维物体模型的3D打印门槛。
| 字段名 | 类型 | 描述 |
|---|---|---|
编号 |
-- | -- |
RGB图片 |
-- | -- |
图像特征向量 |
-- | -- |
三维模型 |
-- | -- |
IoU |
-- | -- |
| fieldName | exampleValue |
|---|---|
| 编号 | V-20250904-SH0000 |
| RGB图片 | data\V-20250904-SH0000\rgb_image.png |
| 图像特征向量 | data\V-20250904-SH0000\feature.npy |
curl -H "Authorization: Bearer YOUR_API_KEY" \
http://localhost:3001/api/v1/datasets/6646325