返回数据集列表
数据集 浙江由由科技有限公司

生鲜商品AI训练识别质量评估数据

价格待定
数据描述

本数据集形成了包括627种蔬菜、水果、禽肉、水产的经分类的图片训练集,该数据集将用于人工智能模型的训练,形成可以根据照片内容识别出照片中包含商品的智能模型。该模型可广泛应用于生鲜商场、超市的收银场景,直接通过摄像头拍照后识别出商品类型,省去原来需要人工识别商品并输入收银系统的繁琐步骤。

算法/方法论

1.数据收集:本数据集收集了2020年1月1日至2022年5月1日期间涉及627种蔬菜、水果、禽肉、水产的大量实物实拍照片,本数据集归属于申请人浙江由由科技有限公司。2.算法说明:第一步,先将627种不同商品的名称录入系统,为每一个商品确定唯一的编码,并为每一个名称商品建立训练集。第二步,以专家经验,依据每个商品的常见程度确定优先级,对于常见的品类给予较高的优先级,以此类推,使得优先级顺序:A+>A>B>C。第三步,根据专家经验和专业知识,为每一个产品添加特征描述,描述商品的特点,以帮助提供人工区分时的准确性。第四步,以专家经验和人工判断,参考特征描述,将收集来的照片分类分入不同商品名称下的训练集,例如,专家根据专业经验判断照片中的商品属于葱苗,然后将照片放入葱苗名称对应下的训练集。第五步,在所有照片归入对应的训练集后,统计形成训练集数目,代表该训练集中商品图片的数量。第六步,根据优先级和训练集数目计算出数据置信度等级。对于优先级为A+的商品,当训练集数目≥20000时,为非常高阈值,当训练集数目≥10000时,为高阈值,当训练集数目≥5000时,为中等阈值,当训练集数目<5000时,为低阈值;对于优先级为A的商品,当训练集数目≥15000时,为非常高阈值,当训练集数目≥8000时,为高阈值,当训练集数目≥4000时,为中等阈值,当训练集数目<4000时,为低阈值;对于优先级为B的商品,当训练集数目≥10000时,为非常高阈值,当训练集数目≥5000时,为高阈值,当训练集数目≥2500时,为中等阈值,当训练集数目<2500时,为低阈值;对于优先级为C的商品,当训练集数目≥5000时,为非常高阈值,当训练集数目≥2500时,为高阈值,当训练集数目≥1000时,为中等阈值,当训练集数目<1000时,为低阈值。非常高阈值对应置信度非常高、高阈值对应置信度高、中等阈值对应置信度中等、低阈值对应置信度低。置信度反映了该训练集的成熟度。

字段定义
字段名 类型 描述
名称 -- --
编码 -- --
优先级 -- --
训练集数目 -- --
示例图文件名 -- --
样本数据
fieldName exampleValue
名称 葱苗
编码 1010101
优先级 A+
调用API获取完整数据
基本信息
数据格式
xlsx
数据类型
企业数据
记录数量
628
所属行业
信息传输、软件和信息技术服务业
登记企业
浙江由由科技有限公司
V6 评分明细
描述质量 0.0 / 20
结构规范 0.0 / 20
规模时效 0.0 / 15
安全合规 0.0 / 20
认证标注 0.0 / 15
商业价值 0.0 / 10
API 调用示例
curl -H "Authorization: Bearer YOUR_API_KEY" \
  http://localhost:3001/api/v1/datasets/173777
认证信息
证书编号
20250833000010751
登记编号
SZ2025120010751.4