该数据用于训练垂直领域专业大语言模型,使其深入掌握轨道交通运营、票务、站点服务等场景的专业术语、政策法规及服务流程,从而显著提升智能客服在交通出行领域的专业问答与复杂事务处理能力。 具体应用场景包括: 1.赋能客服系统智能化升级:为各类公共交通服务商(如地铁、公交、铁路)提供高质量的预训练与微调语料,直接用于构建或优化其专属智能客服,实现高准确率、高规范性的全天候自动问答,显著降低人工客服成本。 2.支持行业技术研发与标准化:为科研机构及AI开发商提供稀缺的、高质量的轨道交通垂直领域标注数据集,支撑其进行意图识别、对话管理、知识图谱构建等NLP核心技术的研发与评测,推动行业服务标准的建立与技术发展。 3.打造个性化出行助手:基于对海量用户真实问询的学习,模型能够精准理解乘客在通勤、换乘、票务等方面的个性化需求,为开发面向公众的下一代智能出行助手提供核心能力支撑,实现精准、贴心的出行规划与信息服务。
本关键词生成环节的算法规则核心为“结构化提取与专家核验”流程。处理的原始数据来源于“温州轨道”APP中的实际乘客咨询问题。首先,采用递归字符文本分块技术对乘客咨询问题进行智能切分,将整句如“从动车南站到机场站怎么换乘?”精准拆分为语义单元[‘从’, ‘动车南站’, ‘到’, ‘机场站’, ‘怎么’, ‘换乘’],为后续分析奠定基础。然后,系统基于常见的自然语言处理技术(如词性标注、命名实体识别等)初步提取候选关键词。最后,由业务专家对系统提取的关键词进行核验、标准化,映射至具体的业务意图分类。在此基础上,业务专家将结合这些标准关键词,从专业资料库中进行比对,筛选出最合适的应答内容,为智能客服的准确回复提供重要依据。
| 字段名 | 类型 | 描述 |
|---|---|---|
问题内容 |
-- | -- |
时间戳 |
-- | -- |
语义单元拆分 |
-- | -- |
关键词 |
-- | -- |
问题答复 |
-- | -- |
| fieldName | exampleValue |
|---|---|
| 问题内容 | 支付宝的订单能不能在App里支付,新桥站一整天的时间表,支付失败怎么补款,怎么办 |
| 时间戳 | 2024-11-01 08:45:46,2024-10-31 19:56:24, |
| 语义单元拆分 | ‘支付宝’‘的’‘订单’‘能不能’‘在’‘App’‘里’‘支付’,‘新桥站’‘一 |
curl -H "Authorization: Bearer YOUR_API_KEY" \
http://localhost:3001/api/v1/datasets/8414106