通过对样本的数据处理和数据加工,提供给辅助诊断人工智能模型进行训练,帮助人工智能模型更好地理解吉林省样本场景下的预后情况分析,提取特征,发现规律,最终提高诊断人工智能模型的准确性、鲁棒性和泛化能力。
1数据采集:通过正式合作协议,从医疗机构取得匿名化的样本临床数据,包括是否有术后病理结果、术后ER(雌性激素受体)、术后PR(孕激素受体)、术后Fish,同时还要获取系统内术后Her2阴性阳性标记;2数据处理:对数据进行检查核对,确保所有数据去标志化,处于完全匿名化状态且不可还原的状态,将没有病理结果的数据去除,对异常数据进行清洗去除,对部分缺失数据进行生成式补充;3数据加工:基于数据加工规则判断规则,生成预后情况分析,具体规则为:如果ER为阳性(即ER>0),同时满足PR>20,同时满足HER2为阴性,则预后情况判断为预后最好,反之为其他,需要更多数据分析。
| 字段名 | 类型 | 描述 |
|---|---|---|
受试者 |
-- | -- |
省份 |
-- | -- |
是否有术后病理结果 |
-- | -- |
术后ER(雌性激素受体) |
-- | -- |
术后PR(孕激素受体) |
-- | -- |
| fieldName | exampleValue |
|---|---|
| 受试者 | 2551 |
| 省份 | 吉林 |
| 是否有术后病理结果 | 是 |
curl -H "Authorization: Bearer YOUR_API_KEY" \
http://localhost:3001/api/v1/datasets/26969