通过构建一个包含大量静态手势图像及其对应类别标签(如“点赞”、“胜利”、“OK”、“握拳”等)的数据集,用于训练分类模型。该数据适用于智能家居设备控制、演示文稿的远程切换、社交应用中的表情符号触发以及无人机控制等场景。利用该数据训练的模型能够快速准确地识别用户的静态指令,解决了依赖物理接触或语音指令的交互局限性,提供了一种直观、静默的控制方式。
静态手势识别旨在将单个图像中的手势分类为预定义的指令。具体过程包括:(1)数据收集:采集覆盖多种常见手势的图像,确保每个类别都有充足且多样化的样本。(2)数据处理:利用手掌检测模型提取手部区域图片,然后将该区域输入到一个特征提取网络中。手势语义特征向量是手部区域图片在高维语义特征空间的映射,通过公式 F_gesture=Encodercnn(I_hand) 提取,其中I_hand表示手部区域图片,F_gesture是代表手势语义特征向量。(3)模型构建:在提取的特征向量后连接一个分类器Classifier,根据公式 P_class=Classifier(F_gesture) 预测出手势类别,其中P_class是预测的手势类别;关键评估指标包括平均分类准确率(Accuracy)、平均精确率(Precision)和平均召回率(Recall)。
| 字段名 | 类型 | 描述 |
|---|---|---|
编号 |
-- | -- |
手部图像 |
-- | -- |
手部区域图片 |
-- | -- |
类别 |
-- | -- |
手势语义特征向量 |
-- | -- |
| fieldName | exampleValue |
|---|---|
| 编号 | K451-20251017-SH0000 |
| 手部图像 | K451-20251017-SH0000\input.png |
| 手部区域图片 | K451-20251017-SH0000\hand.png |
curl -H "Authorization: Bearer YOUR_API_KEY" \
http://localhost:3001/api/v1/datasets/8418015