返回数据集列表
数据集 浙江网新健康科技有限公司,浙江大学

“启真”医学知识数据

价格待定
数据描述

本数据对医疗场景中的决策具有重要指导意义,使得决策更加科学、更加符合医疗行业的规范,可作为医疗场景中人机交互的逻辑依据。本数据经过专家医生团队校验认证,具有权威性,数据范围包括疾病、药品、检查检验、手术、诊疗决策路径、健康宣教等。本数据可用于医疗人工智能产品的模型训练,例如临床辅助决策系统、医疗相关的大语言模型等产品的模型训练,经过本数据训练的模型能提供更加专业的建议结果。

算法/方法论

从医学权威机构官方渠道获取原始数据后,使用自然语言处理(NLP)从大量的医学文本数据中自动识别、抽取和整合有用的信息。首先,对原始文本进行预处理,包括分词(将句子分割成单词)、去除停用词(如“的”、“是”等无实际含义的词语)以及词干化(将单词还原为其词干形式),以减少数据噪音,使得文本更易于处理。然后,通过命名实体识别(Named Entity Recognition,NER)技术识别文本中的特定实体,如疾病、症状、药物、治疗方法等。其次,通过关系抽取技术从文本中提取实体之间的关系,如“疾病A可以通过药物B治疗”。通过以上算法规则初步得到了结构化的医学知识数据,然后通过医生专家团队的审核、校验及认证,形成高质量可用的医学知识数据。

字段定义
字段名 类型 描述
疾病中文名称 -- --
疾病分类 -- --
主要病因 -- --
常见症状 -- --
治疗原则 -- --
样本数据
fieldName exampleValue
疾病中文名称 急性高原病
疾病分类 理化因素引起的疾病
主要病因 从平原进入高原或从高原进入更高海拔地区
调用API获取完整数据
基本信息
数据格式
--
数据类型
--
记录数量
2001
所属行业
信息传输、软件和信息技术服务业
登记企业
浙江网新健康科技有限公司,浙江大学
V6 评分明细
描述质量 0.0 / 20
结构规范 0.0 / 20
规模时效 0.0 / 15
安全合规 0.0 / 20
认证标注 0.0 / 15
商业价值 0.0 / 10
API 调用示例
curl -H "Authorization: Bearer YOUR_API_KEY" \
  http://localhost:3001/api/v1/datasets/32526
认证信息
证书编号
20240133000001290
登记编号
SZ2024140001290.3