1.本数据可用于《丝路文化》相关教育创新课程制作参考,例如作为教师教研、教案编写、学生自主欣赏与拓展阅读、PBL课程组织、学生自主创新的素材资料。 2.本数据还可用于文化领域人工智能产品的模型训练,例如文化课程开发辅助决策系统、文化相关的大语言模型等产品的模型训练,经过本数据训练的模型能提供更加专业的建议结果。
依据国家文化相关信息公开政策,以及浙江省教育厅与浙江省文旅厅文化数据教育方向应用公约,从公开出版物、论文文献、有发展教育意向的博物馆和研究机构等合法渠道获取《丝路文化》相关古籍、数据库、研究资料等原始数据后,使用自然语言处理(NLP)从大量文本数据中自动识别、抽取和整合有用信息。 1.选择带标点符号的《丝路文化》相关文化信息文本在预训练模型上进行预训练以及微调,获得预测文化信息标点符号模型。 2.将文本输入预测文化信息标点符号模型中,得到含有标点符号的文本。 3.对含有标点符号的文本进行词向量化预处理,得到词向量文本。 4.通过实体识别模型对词向量文本进行实体抽取和分类,并标注需要关系抽取的实体为主体,得到标记文本。 5.对标记文本进行词向量+位置向量的预处理,得到词向量+位置向量文本。 6.通过关系抽取模型对词向量+位置向量文本进行关系抽取,获得实体-关系-实体结构的三元组关系数据集。 7.根据三元组关系数据集,生成《丝路文化》文化信息知识。 以上算法规则初步得到了结构化的《丝路文化》文化知识数据,经文化领域专家团队审核、校验及认证,形成高质量可用的《丝路文化》文化知识数据。
| 字段名 | 类型 | 描述 |
|---|---|---|
通用单一标识符 |
-- | -- |
类型 |
-- | -- |
内容格式 |
-- | -- |
内容 |
-- | -- |
用途 |
-- | -- |
| fieldName | exampleValue |
|---|---|
| 通用单一标识符 | 45ddd9bc-2542-48ff-b922-ef41660b522c |
| 类型 | 文本 |
| 内容格式 | txt |
curl -H "Authorization: Bearer YOUR_API_KEY" \
http://localhost:3001/api/v1/datasets/36644