返回数据集列表
数据集 杭州银美科技有限公司

《丝路文化》文化知识数据

价格待定
数据描述

1.本数据可用于《丝路文化》相关教育创新课程制作参考,例如作为教师教研、教案编写、学生自主欣赏与拓展阅读、PBL课程组织、学生自主创新的素材资料。 2.本数据还可用于文化领域人工智能产品的模型训练,例如文化课程开发辅助决策系统、文化相关的大语言模型等产品的模型训练,经过本数据训练的模型能提供更加专业的建议结果。

算法/方法论

依据国家文化相关信息公开政策,以及浙江省教育厅与浙江省文旅厅文化数据教育方向应用公约,从公开出版物、论文文献、有发展教育意向的博物馆和研究机构等合法渠道获取《丝路文化》相关古籍、数据库、研究资料等原始数据后,使用自然语言处理(NLP)从大量文本数据中自动识别、抽取和整合有用信息。 1.选择带标点符号的《丝路文化》相关文化信息文本在预训练模型上进行预训练以及微调,获得预测文化信息标点符号模型。 2.将文本输入预测文化信息标点符号模型中,得到含有标点符号的文本。 3.对含有标点符号的文本进行词向量化预处理,得到词向量文本。 4.通过实体识别模型对词向量文本进行实体抽取和分类,并标注需要关系抽取的实体为主体,得到标记文本。 5.对标记文本进行词向量+位置向量的预处理,得到词向量+位置向量文本。 6.通过关系抽取模型对词向量+位置向量文本进行关系抽取,获得实体-关系-实体结构的三元组关系数据集。 7.根据三元组关系数据集,生成《丝路文化》文化信息知识。 以上算法规则初步得到了结构化的《丝路文化》文化知识数据,经文化领域专家团队审核、校验及认证,形成高质量可用的《丝路文化》文化知识数据。

字段定义
字段名 类型 描述
通用单一标识符 -- --
类型 -- --
内容格式 -- --
内容 -- --
用途 -- --
样本数据
fieldName exampleValue
通用单一标识符 45ddd9bc-2542-48ff-b922-ef41660b522c
类型 文本
内容格式 txt
调用API获取完整数据
基本信息
数据格式
--
数据类型
--
记录数量
637
所属行业
文化、体育和娱乐业
登记企业
杭州银美科技有限公司
V6 评分明细
描述质量 0.0 / 20
结构规范 0.0 / 20
规模时效 0.0 / 15
安全合规 0.0 / 20
认证标注 0.0 / 15
商业价值 0.0 / 10
API 调用示例
curl -H "Authorization: Bearer YOUR_API_KEY" \
  http://localhost:3001/api/v1/datasets/36644
认证信息
证书编号
20240533000002074
登记编号
SZ2024120002074.2