返回数据集列表
数据集 上海壹灵贰肆数字科技有限公司

基于司法裁判案件的法律分析大模型训练数据

价格待定
数据描述

通过整合我公司开发的司法裁判案件的法律分析大模型训练数据即智能法律问答分析模型训练数据,可构建数据语料库,实现自动生成结构化、标准化的法律建议报告,用于分析案件的胜诉率与败诉率,以及案件败诉原因,切实提高法律从业者工作效率。同时,分析司法裁判案件的法律分析大模型训练数据可为生成式法律建议(如案件分析、案例筛选、相关案例推送、诉讼策略与证据清单生成等)提供了基础支撑,从而可推动生成式法律分析的发展。此外,借助分析司法裁判案件的法律分析大模型训练数据可推动法律从业者提升对复杂案件事实与争议焦点,为合同起草、合同审查及模拟法庭等场景的应用提供基础。实现上述应用场景的核心在于,通过海量数据的深度学习,AI模型能够掌握语言规律、理解领域知识,从而显著提升其识别、分类、生成和推理能力。这些数据堪称AI模型的“燃料”,其质量直接决定了模型的性能表现和泛化能力。最终,可输出经过充分训练和优化的AI模型即智能法律问答分析模型产品,推动法律服务的优化升级,并为司法裁判的精准裁判提供关键助力。

算法/方法论

1、数据来源:通过已公开的裁判文书,收集司法裁判相关判决书中的案号、案由、裁判时间、案件类型、诉讼程序等信息; 2、数据处理:对收集到的数据进行去重、合并、累加,便于分析使用; 3、算法规则:采用NLP模型并基于DeepSeek向量模型进行法律领域专门优化,将法律问题、案件文本转化为1024维的高维向量,利用余弦相似度和欧氏距离混合度量进行相似度计算,通过分词、向量检索和倒排索引实现关键词精确匹配。同时,基于Neo4j的路径查询和图神经网络(GNN)预测案例相似度构建知识图谱推理层,分析并结构化存储历史案件向量及关键标签,如裁判要旨、原告是否胜诉、胜诉/败诉的主要证据因素、胜诉/败诉的主要程序因素。

字段定义
字段名 类型 描述
序号 -- --
案号 -- --
案由 -- --
案件类型 -- --
法院 -- --
样本数据
fieldName exampleValue
序号 1
案号 (2020)湘0602民初5490号
案由 民间借贷纠纷
调用API获取完整数据
基本信息
数据格式
excel
数据类型
企业数据
记录数量
550
所属行业
信息传输、软件和信息技术服务业
登记企业
上海壹灵贰肆数字科技有限公司
V6 评分明细
描述质量 0.0 / 20
结构规范 0.0 / 20
规模时效 0.0 / 15
安全合规 0.0 / 20
认证标注 0.0 / 15
商业价值 0.0 / 10
API 调用示例
curl -H "Authorization: Bearer YOUR_API_KEY" \
  http://localhost:3001/api/v1/datasets/185341
认证信息
证书编号
20250733000012962
登记编号
SZ2025320012962.1