通过对样本的数据处理和数据加工,提供给辅助诊断人工智能模型进行训练,帮助人工智能模型更好地理解上海市样本场景下的Luminal类型情况,提取特征,发现规律,最终提高诊断人工智能模型的准确性、鲁棒性和泛化能力。
1数据采集:通过正式合作协议,从医疗机构取得匿名化的样本临床数据,包括术后Ki67增殖指数,同时还要获取系统内乳腺癌类型数据;2数据处理:对数据进行检查核对,确保所有数据去标志化,处于完全匿名化状态且不可还原的状态,将没有病理结果的数据去除,对异常数据进行清洗去除,对部分缺失数据进行生成式补充;3数据加工:基于原始数据以及算法规则,生成乳腺癌的Luminal类型标记,具体判断规则为:如果乳腺癌类型为Luminal型, 同时Ki67增殖指数小于14,则肿瘤类型标记为Luminal A型,反之为Luminal B型。
| 字段名 | 类型 | 描述 |
|---|---|---|
受试者 |
-- | -- |
省份 |
-- | -- |
是否有术后病理结果 |
-- | -- |
乳腺癌类型 |
-- | -- |
术后Ki67增殖指数 |
-- | -- |
| fieldName | exampleValue |
|---|---|
| 受试者 | 307 |
| 省份 | 上海 |
| 是否有术后病理结果 | 是 |
curl -H "Authorization: Bearer YOUR_API_KEY" \
http://localhost:3001/api/v1/datasets/26985