中信数科 DataTrust 数据市场

数据集浙江网新健康科技有限公司,浙江大学

“启真”医学知识数据

价格待定

数据描述

本数据对医疗场景中的决策具有重要指导意义，使得决策更加科学、更加符合医疗行业的规范，可作为医疗场景中人机交互的逻辑依据。本数据经过专家医生团队校验认证，具有权威性，数据范围包括疾病、药品、检查检验、手术、诊疗决策路径、健康宣教等。本数据可用于医疗人工智能产品的模型训练，例如临床辅助决策系统、医疗相关的大语言模型等产品的模型训练，经过本数据训练的模型能提供更加专业的建议结果。

算法/方法论

从医学权威机构官方渠道获取原始数据后，使用自然语言处理（NLP）从大量的医学文本数据中自动识别、抽取和整合有用的信息。首先，对原始文本进行预处理，包括分词（将句子分割成单词）、去除停用词（如“的”、“是”等无实际含义的词语）以及词干化（将单词还原为其词干形式），以减少数据噪音，使得文本更易于处理。然后，通过命名实体识别（Named Entity Recognition，NER）技术识别文本中的特定实体，如疾病、症状、药物、治疗方法等。其次，通过关系抽取技术从文本中提取实体之间的关系，如“疾病A可以通过药物B治疗”。通过以上算法规则初步得到了结构化的医学知识数据，然后通过医生专家团队的审核、校验及认证，形成高质量可用的医学知识数据。

字段定义

字段名	类型	描述
`疾病中文名称`	--	--
`疾病分类`	--	--
`主要病因`	--	--
`常见症状`	--	--
`治疗原则`	--	--

样本数据

fieldName	exampleValue
疾病中文名称	急性高原病
疾病分类	理化因素引起的疾病
主要病因	从平原进入高原或从高原进入更高海拔地区

调用API获取完整数据

基本信息

数据格式: --
数据类型: --
记录数量: 2001
所属行业: 信息传输、软件和信息技术服务业
登记企业: 浙江网新健康科技有限公司,浙江大学

V6 评分明细

描述质量 0.0 / 20

结构规范 0.0 / 20

规模时效 0.0 / 15

安全合规 0.0 / 20

认证标注 0.0 / 15

商业价值 0.0 / 10

API 调用示例

curl -H "Authorization: Bearer YOUR_API_KEY" \
  http://localhost:3001/api/v1/datasets/32526

获取API密钥已有账户？登录

认证信息

证书编号: 20240133000001290
登记编号: SZ2024140001290.3