双塔召回模型,分为user塔和item塔。 注:使用时需指定user id和item id。
model_config:{
model_class: "DSSM"
feature_groups: {
group_name: 'user'
feature_names: 'user_id'
feature_names: 'cms_segid'
...
feature_names: 'tag_brand_list'
wide_deep:DEEP
}
feature_groups: {
group_name: "item"
feature_names: 'adgroup_id'
feature_names: 'cate_id'
...
feature_names: 'pid'
wide_deep:DEEP
}
dssm {
user_tower {
id: "user_id"
dnn {
hidden_units: [256, 128, 64, 32]
# dropout_ratio : [0.1, 0.1, 0.1, 0.1]
}
}
item_tower {
id: "adgroup_id"
dnn {
hidden_units: [256, 128, 64, 32]
}
}
simi_func: INNER_PRODUCT
l2_regularization: 1e-6
}
embedding_regularization: 5e-5
}
- model_class: 'DSSM', 不需要修改
- feature_groups: 需要两个feature_group: user和item, group name不能变
- dssm: dssm相关的参数,必须配置user_tower和item_tower
- user_tower/item_tower:
- dnn: deep part的参数配置
- hidden_units: dnn每一层的channel数目,即神经元的数目
- id: 指定user_id/item_id列
- dnn: deep part的参数配置
- simi_func: 向量相似度函数,包括[COSINE, INNER_PRODUCT, EUCLID],默认COSINE,建议使用INNER_PRODUCT
- embedding_regularization: 对embedding部分加regularization,防止overfit
支持的metric_set包括:
- auc
- mean_absolute_error
- accuracy