本数据对医疗场景中的决策具有重要指导意义,使得决策更加科学、更加符合医疗行业的规范,可作为医疗场景中人机交互的逻辑依据。本数据经过专家医生团队校验认证,具有权威性,数据范围包括疾病、药品、检查检验、手术、诊疗决策路径、健康宣教等。本数据可用于医疗人工智能产品的模型训练,例如临床辅助决策系统、医疗相关的大语言模型等产品的模型训练,经过本数据训练的模型能提供更加专业的建议结果。
从医学权威机构官方渠道获取原始数据后,使用自然语言处理(NLP)从大量的医学文本数据中自动识别、抽取和整合有用的信息。首先,对原始文本进行预处理,包括分词(将句子分割成单词)、去除停用词(如“的”、“是”等无实际含义的词语)以及词干化(将单词还原为其词干形式),以减少数据噪音,使得文本更易于处理。然后,通过命名实体识别(Named Entity Recognition,NER)技术识别文本中的特定实体,如疾病、症状、药物、治疗方法等。其次,通过关系抽取技术从文本中提取实体之间的关系,如“疾病A可以通过药物B治疗”。通过以上算法规则初步得到了结构化的医学知识数据,然后通过医生专家团队的审核、校验及认证,形成高质量可用的医学知识数据。
| 字段名 | 类型 | 描述 |
|---|---|---|
疾病中文名称 |
-- | -- |
疾病分类 |
-- | -- |
主要病因 |
-- | -- |
常见症状 |
-- | -- |
治疗原则 |
-- | -- |
| fieldName | exampleValue |
|---|---|
| 疾病中文名称 | 急性高原病 |
| 疾病分类 | 理化因素引起的疾病 |
| 主要病因 | 从平原进入高原或从高原进入更高海拔地区 |
curl -H "Authorization: Bearer YOUR_API_KEY" \
http://localhost:3001/api/v1/datasets/32526