1
Xs0ul 2018-05-18 07:47:27 +08:00
日志应该指的是用户点过某些广告或者商品?最简单的做法就是把每个用户的日志转换成一堆 0、1,1 代表点过某个广告 /商品,0 代表没有
|
2
SlipStupig OP @Xs0ul 感谢回复,问题是,我们日志里面只有 ip,并没有账号信息,然后就是广告和 skuid,这个咋办呢
|
3
SlipStupig OP @Xs0ul 比如:“ 1.2.3.4 get /product?skuid=123 2018-1-02 16:04 ” 这种就是我们的日志格式
|
4
binux 2018-05-18 08:07:29 +08:00 1
1.2.3.4 get /product?skuid=123
1.2.3.4 就是 user 123 就是 sku 你当然不可能就拿这个 1.2.3.4 123 当数据啊,你去把这个 1.2.3.4 对应的用户数据,123 对应的商品数据拿出来,提取特征,这个才是你的数据集。 |
5
Nick2VIPUser 2018-05-18 08:49:13 +08:00 via iPhone 2
可以看看 kaggle 上的泰坦尼克号存活预测的入门教程,特征转数字讲的很详细
|