中信数科 DataTrust 数据市场

数据集每日互动股份有限公司

数字广告向量数据

价格待定

数据描述

依托开发者服务积累海量APP数据，利用深度学习模型，将个推大数据脱敏压缩生产脱敏后的稠密向量，助力互联网客户提升算法模型效果推荐系统：通过比较用户向量之间的相似度，可以实现个性化推荐。根据用户的历史行为、兴趣爱好等特征，为用户推送更符合其喜好的内容、商品或服务。广告投放：基于用户行为向量，广告商可以精准定位目标受众，针对性地投放广告，从而提高广告效果和转化率。

算法/方法论

1.数据采集：开发者服务经过用户授权，对用户最小必要的行为数据进行收集 2.数据处理：为保证内部员工的最小化授权使用，基于公司自研的每日治数平台上对数据进行数据接入，ETL清洗和脱敏去标识化。 3.算法加工：数据清洗：对采集到的用户数据进行预处理，包括去除无效数据、填补缺失值、消除异常值等，使数据更加规范和准确。数据转换：将清洗后的用户数据转换为向量形式，主要使用的方法包括独热编码、嵌入向量、主题模型等，将离散数据转换为连续的向量空间中的表示。向量空间建立：将转换后的用户向量数据构建成一个高维的向量空间，其中每个维度代表一个特征，向量的值代表该特征的值。向量空间优化：为了提高向量空间的表示能力和计算效率，需要对向量空间进行优化。常用的优化方法包括矩阵分解、降维、聚类等，将高维的向量空间进行降维或聚类，以便更好地表示用户特征和相似度计算。相似度计算：在优化后的向量空间中，可以计算用户之间的相似度，主要使用余弦相似度、欧氏距离、Jaccard相似度等算法。算法加工：利用相似度计算的结果，结合业务需求和目标函数，进行相应的算法加工(推荐算法、聚类算法、分类算法)。 4.数据应用：使用向量化能

字段定义

字段名	类型	描述
`oaid`	--	--
`MD5的ID`	--	--
`向量值`	--	--

样本数据

fieldName	exampleValue
oaid	000014f1-df8c-44a4-9955-43328d5593dc
MD5的ID	2275f8f0fad0c973220f461ad6b4a314
向量值	-0.1359938456423529,-0.13438018175816988

调用API获取完整数据

基本信息

数据格式: --
数据类型: --
记录数量: 989
所属行业: 信息传输、软件和信息技术服务业
登记企业: 每日互动股份有限公司

V6 评分明细

描述质量 0.0 / 20

结构规范 0.0 / 20

规模时效 0.0 / 15

安全合规 0.0 / 20

认证标注 0.0 / 15

商业价值 0.0 / 10

API 调用示例

curl -H "Authorization: Bearer YOUR_API_KEY" \
  http://localhost:3001/api/v1/datasets/3527

获取API密钥已有账户？登录

认证信息

证书编号: 20230933000001074
登记编号: SZ2023120001074.0