一、适用对象: 航运公司的运营管理部门及数据分析团队,主要用于日常船票销售数据的统计与分析工作。 二、适用范围: 覆盖所有开通航线的每日购票记录处理,能够系统性地汇总各航线不同年龄段旅客的购票数量及占比情况。 三、解决的问题: 改善人工统计效率低、易出错的问题,通过自动化公式实现各年龄段购票人数的快速计算与比例分析,确保数据准确性与实时性。同时,依据算法规则对原始数据进行清洗与分组,排除无效年龄记录,提升数据质量与可信度。 四、核心价值点: 在于为航线运营决策提供数据支撑。通过分析各年龄段旅客的购票偏好,公司可优化航线安排、调整票务策略,并针对性开展市场营销活动。此外,该表还可用于长期旅客结构趋势监测,为运力调配和服务升级提供依据,最终提升旅客满意度和公司运营效益。 五、外部复用价值: 该数据体系还可为政府部门、旅游规划机构或学术研究提供高质量的客流年龄结构分析基础,支持区域交通规划、旅游经济研究或人口流动特征分析,具备跨部门、跨领域的数据复用潜力。
算法规则: 一、数据采集 数据来源:公司内部的环岛客运船舶智能动态监控系统 采集字段:统计日期、航线名称、本航线当日总购票人数、18岁以下购票旅客数、19-35岁购票旅客数、36-59岁购票旅客数、60岁以上购票旅客数。 二、数据处理 根据购票人的年龄进行所属年龄段分组,按预设规则动态分桶:年龄≤18,分组= "18岁以下";19≤年龄≤35,分组= "19-35岁";36≤年龄≤59,分组= "36-59岁";年龄≥60,分组= "60岁以上"; 异常值处理:剔除年龄≤0或≥120岁的极端值。 三、算法加工 根据年龄对购票旅客进行年龄段的分类,统计各年龄段的购票旅客人数,并计算各年龄段购票旅客人数占比。 计算公式:各年龄段购票旅客占比=各年龄段购票旅客数/当时购票旅客总数*100%,结果保留2位小数。 数据一致性校验:Σ各年龄段购票旅客数=当日购票旅客总数
| 字段名 | 类型 | 描述 |
|---|---|---|
序号 |
-- | -- |
统计日期 |
-- | -- |
航线名称 |
-- | -- |
本航线当日总购票人数(人) |
-- | -- |
18岁以下购票旅客数(人) |
-- | -- |
| fieldName | exampleValue |
|---|---|
| 序号 | 1 |
| 统计日期 | 2025年6月1日 |
| 航线名称 | 金外滩-东白莲 |
curl -H "Authorization: Bearer YOUR_API_KEY" \
http://localhost:3001/api/v1/datasets/5091015