返回数据集列表
数据集 浙江中易慧能科技有限公司

中央空调盘管调控系数生成大语言模型训练数据

价格待定
数据描述

本中央空调盘管调控系数生成大语言模型训练数据可应用于相关领域技术探索场景。数据通过整合空调原理、故障、传热学等非结构化资料与运行参数、管盘调控系数等结构化数据,构建监督学习样本及“指令-输出”格式数据对,形成统一数据集并按比例划分。其有助于大语言模型学习调控规则与参数关联规律,有利于模型在训练过程中更全面捕捉调控条件与数值区间的分布特征,为提升模型生成调控系数的准确性提供数据支撑;同时,有助于促进行业技术经验的沉淀与共享,为相关领域技术发展提供参考性支持。

算法/方法论

1.数据来源与样本构建:(1)原始数据包括公司经研发形成的自有的空调原理资料、空调故障资料、传热学资料、制冷学资料、流体力学资料、暖通空调在内的空调学资料等非结构化数据,以及通过测试试验获得的空调运行参数以及相应的管盘调控系数的结构化数据。(2)将空调运行参数与对应的管盘调控系数进行组合,构建成用于回归预测的监督学习样本对。(3)对非结构化数据进行信息抽取与知识标注,构建“指令-输出”格式的数据对,用于语言模型理解调控规则。(4)合并以上两类样本,构建统一的数据集D,用于支持大语言模型的训练或微调;对数据集D赋予编号。 2.数据集划分:(1)对数据集D按8:1:1比例划分为训练集、验证集和测试集。(2)确保调控条件、数值区间等在各集合中分布均衡,避免样本偏态。 3.模型训练与微调:(1)选择梯度提升树GBM作为回归模型,作为参考基准。(2)使用准备好的训练集,结合开源大语言模型(ChatGLM-6B)进行微调。(3)记录模型初始参数、训练轮次、学习率、优化器等设置。 4.模型验证与参数调整:(1)在验证集上评估模型输出的准确性与表达合理性,指标包括MSE、BLEU、ROUGE、BERTScore等。(2)结合自动评估与人工抽样审阅结果,调整模型参数。(3)记录每轮优化后的模型性能变化。 5.最终评估与效果分析:(1)在测试集上进行最终评估,使用多维指标综合判断模型能力,包括MAE、MSE、R²、BLEU、ROUGE、BERTScore等。(2)开展误差分析,识别常见错误模式,为后续优化提供依据。 6.模型优化建议:根据测试结果,给出模型优化建议,如调整学习率、增加正则化、改变网络结构等。 注:本算法规则涉及专利保护。

字段定义
字段名 类型 描述
数据来源类型 -- --
样本构建后的数据集D编号 -- --
数据集D划分 -- --
模型名称 -- --
初始参数设置 -- --
样本数据
fieldName exampleValue
数据来源类型 非结构化数据(空调原理资料、空调故障资料、传热学资料等)、结构化数据(空调运行参
样本构建后的数据集D编号 D2025****003
数据集D划分 训练集40、验证集5、测试集5
调用API获取完整数据
基本信息
数据格式
xlsx
数据类型
企业数据
记录数量
535
所属行业
信息传输、软件和信息技术服务业
登记企业
浙江中易慧能科技有限公司
V6 评分明细
描述质量 0.0 / 20
结构规范 0.0 / 20
规模时效 0.0 / 15
安全合规 0.0 / 20
认证标注 0.0 / 15
商业价值 0.0 / 10
API 调用示例
curl -H "Authorization: Bearer YOUR_API_KEY" \
  http://localhost:3001/api/v1/datasets/6578519
认证信息
证书编号
20250733000016045
登记编号
SZ2025120016045.6