对采集的抖音平台带货品类为药品类的达人直播视频内容进行转译分析,对达人口播语言内容进行处理、分析,根据达人在直播过程中对预先设置的违规敏感词(比如:无效退款,保险公司保险,安全,安全无毒副作用,毒副作用小,天然,热销,抢购,试用,家庭必备,免费治疗等)违反的次数和频率,依据触发条件规则提出警告或处理。为诸暨市市场监督局管理区域内规范企业抖音直播行为,提供数据支持。
将采集完成的直播视频进行进行预处理,第一步:基于原始视频文件,以最大10分钟单位对原始视频进行切片。第二步:对于已完成的切片视频,进行视频内容转语音操作。第三步:对于已完成视频转语音操作的切片,进行语音转文本操作。第四步:使用OCR技术对原始视频中抓取的图片进行文字提取操作。第五步:将所得到的文字内容与违法预警关键词库进行匹配。最终运用多标准决策分析模型,对主播在直播过程中出现的违规语句进行分析计算,得出违法预警值和是否预警判断。 违法预警值=(违法预警单关键词命中次数*0.25)+(违法预警组合关键词命中次数* 0.3)+(图片识别命中预警组合关键词个数*0.35)+(直播间近一个月历史违规记录数*0.1) 通过公式计算出最终违法预警值,违法预警值 ≤1 时,不触发预警提示,违法预警值 >1 时触发违法预警提示。
| 字段名 | 类型 | 描述 |
|---|---|---|
直播间名称 |
-- | -- |
违法预警单关键词 |
-- | -- |
违法预警组合关键词 |
-- | -- |
违法预警值 |
-- | -- |
是否触发预警 |
-- | -- |
| fieldName | exampleValue |
|---|---|
| 直播间名称 | 瓜程爱养生 |
| 违法预警单关键词 | 无效退款,保险公司保险,安全,安全无毒副作用,毒副作用小,天然,热销,抢购,试用 |
| 违法预警组合关键词 | 天然&安全,试用&家庭必备,安全无毒副作用&保险公司保险,无效退款&家庭必备,热 |
curl -H "Authorization: Bearer YOUR_API_KEY" \
http://localhost:3001/api/v1/datasets/44183