对采集的微信视频号平台带货品类为珍珠类的达人直播视频内容进行转译分析,对达人口播语言内容进行处理、分析,根据达人在直播过程中对预先设置的违规敏感词(比如:光滑细腻,天然眩光,孤品,s级,纯天然,925银防过敏,近珠光等)违反的次数和频率,依据触发条件规则提出警告或处理。为诸暨市市场监督局管理区域内规范企业微信视频号直播行为,提供数据支持。
"将采集完成的直播视频进行进行预处理,第一步:基于原始视频文件,以最大10分钟单位对原始视频进行切片。第二步:对于已完成的切片视频,进行视频内容转语音操作。第三步:对于已完成视频转语音操作的切片,进行语音转文本操作。第四步:使用OCR技术对原始视频中抓取的图片进行文字提取操作。第五步:将所得到的文字内容与违法预警关键词库进行匹配。最终运用多标准决策分析模型,对主播在直播过程中出现的违规语句进行分析计算,得出违法预警值和是否预警判断。 违法预警值=(违法预警单关键词命中次数*0.25)+(违法预警组合关键词命中次数* 0.3)+(图片识别命中预警组合关键词个数*0.35)+(直播间近一个月历史违规记录数*0.1) 通过公式计算出最终违法预警值,违法预警值 ≤1 时,不触发预警提示,违法预警值 >1 时触发违法预警提示。"
| 字段名 | 类型 | 描述 |
|---|---|---|
直播间名称 |
-- | -- |
违法预警单关键词一 |
-- | -- |
违法预警单关键词二 |
-- | -- |
违法预警单关键词三 |
-- | -- |
违法预警单关键词四 |
-- | -- |
| fieldName | exampleValue |
|---|---|
| 直播间名称 | 何姐珍珠 |
| 违法预警单关键词一 | 光滑细腻 |
| 违法预警单关键词二 | 天然眩光 |
curl -H "Authorization: Bearer YOUR_API_KEY" \
http://localhost:3001/api/v1/datasets/39274