V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  cqcn1991  ›  全部回复第 28 页 / 共 85 页
回复总数  1690
1 ... 24  25  26  27  28  29  30  31  32  33 ... 85  
@zingl ....比如代写和当枪手....
一年 2K....好心酸....
@leemail 啊...确实都不知道...感觉犯了大错...非常感谢你的指出!(我是当作离散值来理解的)

不知道这方面有什么可以学习的?

https://stats.stackexchange.com/questions/67551/calculate-mean-of-ordinal-variable

我查到的貌似是有争议?
@Icemic
@Yinz

聚类怎么做的:我就是把 5 个各占的比例输进去,作为输入条件

你们可能想问的是:为什么只有这几种组合?

理论上,会有多得多的组合。比如凹形,五星和一星各占 40%? 但问题在于,这种分布的形状,在数据里并不存在,或者极少。所以并没有。完全可能的形状, 值域都是可以模拟出来的(用 dirclet 做就可以了)。

换句话说,能够得到的聚类结果,是实际数据中存在的情况。本身数据就大概只有这些类型。

不知道这个是否是你想问的

当然,也可能把 STD 作为一个额外的 feature 放进去做聚类,但是我感觉效果不是特别好。
@Icemic 按照正态特性画直线是啥意思? 怎么做?

用 Kmeans 因为是基本的聚类啊...我就传数据进去看看结果,结果感觉还不错就用了.
@leemail 可以具体说说,问题在哪里?
@Yinz 代码里面有
直接把电影的 5 个百分比输进去,然后看聚类的结果
实际就是可以分很细,也可以分很粗,取决于你想分成多少种。还可以分得更细,比如均值为 6 的,可以分成 4 星占多还是 2 星占多的,其他类似。

当然,从 Cross validation 的曲线来看, 6-7 的样子基本上就收窄了.
@lxy 但从产品的使用角度来说,太麻烦了,而且大多数时候,电影的表现是相对比较平均的
所以我觉得可以这样思考这个问题,但是产品这样设计有太多不便。毕竟我们也就是 2C,个人评价一下而已

@yiciyuansky 评分分布有,但是“评分分布”的分歧程度的“大小”,没有。所以很多人不会注意到这点。而且这个和人群一致性无关,是豆瓣电影打分的受众并不小众(摔跤吧爸爸有 30W 了)。我们并不是要追求一个“一致性”的评分,而是知道什么时候这个评分是无效的。
@Abirdcfly 对,只是很多人很少关注这个东西。提醒大家一下评分的分歧程度,有助于减少撕逼…
@zrj766 应该就涉及到了方差,这个应该就中学数学水平....?
@staticor 作为豆瓣用户....非常不喜欢豆瓣主流的文艺 /清新的声音,其实也有不少用户如此。是豆瓣目前的定位有问题,或者说被知乎刚怕了,只敢站这个风格.
@tony1016 对,或者说大家看分数很疑惑的时候,可以从这个角度去理解一下。
@qiayue 明白了~
@viator42 那个很少(如果只考虑评分较多的电影的话),你从对开始我给的图里面就能看到,只有一例

最近的“深夜食堂”,是 L 型,如果放在这里比较,也是 STD 最小的。。。也就是一众觉得非常烂的.....
@kiwi95
那很好,你并不受本文这个问题的困扰,但对于其他人来说,我们觉得很多时候,这个看法是可以参考的,那么,我们就有文中的这个问题了。我个人觉得,评分的看法,可以这样理解:

绝对标准(平均分 /我的看法) -> 真实情况 -> 绝对主观 (评分没有意义)

有些人觉得评价是唯一的,这个分数和我的看法不一样,那一定是有水军 /别人在装逼 /别人口味差
有的人觉得是绝对主观的,别人的看法和我的看法完全没关系

我的看法是,有时候,平均分是非常有效的(大家看法一致的时候),有的时候,平均分无效,因为大家看法非常不一样,本文就是这个内容。
@qiayue 对对。。。你是觉得有歧义?那怎么改比较好?
@qiayue 啥意思?我表述没清楚?
@cnwtex 我觉得其实豆瓣官方加个 label + 具体展示页面就好了,这样被人民日报怼的概率就小很多了
@xdz0611 基本图表用的是 Matplotlib, 文章里面的辅助线是用 Axure (对你没看错),我自己加的
1 ... 24  25  26  27  28  29  30  31  32  33 ... 85  
关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   1491 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 21ms · UTC 00:00 · PVG 08:00 · LAX 16:00 · JFK 19:00
♥ Do have faith in what you're doing.