1
ayase252 2021-05-20 20:29:00 +08:00
> 程序将该商品分类为“差”。原因是其综合分数低于差这一分类的上界得分。
可以 > 更进一步,可以分别给出以上 9 项指标的得分,使我可以知道该商品为什么被分类为差。 不行,神经网络可解释性非常弱 |
2
ipwx 2021-05-20 20:45:40 +08:00
> 更进一步,可以分别给出以上 9 项指标的得分,使我可以知道该商品为什么被分类为差。
说不定行,需要 representation learning,但这肯定是研究话题了。 |
3
2473 2021-05-20 21:14:08 +08:00
可以看看决策树
|
4
czfy 2021-05-20 21:47:51 +08:00 via Android
这不就是典型的逻辑回归吗…
|
5
GeruzoniAnsasu 2021-05-20 22:20:09 +08:00
不如说机器学习就是用来干这个的,神经网络可以拟合更复杂的非线性的未知(一定程度上未知)变量方程组,这个场景下不需要复杂神经网络,普通方法就行
|
6
Donahue 2021-05-20 22:55:35 +08:00
神经网络的深度学习好像只能给出评分为差的结果吧,这个评分过程是黑盒子~ 如果想要知道为什么被分类为差,需要机器学习类的方法,,比如决策树,决策树可以给出决策过程
|
7
jmc891205 2021-05-20 23:40:58 +08:00
「通过大量数据拟合出一个线性方程组」
no,科普的时候用线性函数,因为它是大家都很容易理解的东西。 实际上应用中训练出来的模型基本都是非线性关系。这也是为什么神经网络的激活函数要用非线性函数。 |
8
huzhikuizainali OP @GeruzoniAnsasu 谢谢回复。比如什么方法?
|
9
huzhikuizainali OP @jmc891205 谢谢指教。纠正了我一个思维误区。
|
10
huzhikuizainali OP @Donahue 不知道决策树对输入数据维度有什么限制么?比如不止上面的九维数据。100 维呢?每一维度又有 10000 个数据呢?决策树可以“消化么”
|
11
Donahue 2021-05-21 00:16:10 +08:00
@huzhikuizainali 可以吧~不过好像多了之后效果没那么好
|
12
lonccc 2021-05-21 09:09:45 +08:00 via Android
看看 lightgbm 或者 xgboost,然后配合 shap 分析可以有一些可解释性
|
13
aeron 2021-05-21 09:48:00 +08:00
@huzhikuizainali 决策树不限制数据维度,100 维也可以,每一维的 10000 个数据我理解你指的是数据样本数量吧?如果是这个的话没问题。
|
14
GrayXu 2021-05-24 14:58:38 +08:00
fix 1L 的说法,在单决策树这种场景下,可以知道某特征的贡献程度,进而可以一定程度知道为什么被分类为差。
|