V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  alexapollo  ›  全部回复第 55 页 / 共 86 页
回复总数  1705
1 ... 51  52  53  54  55  56  57  58  59  60 ... 86  
2015-04-07 20:42:53 +08:00
回复了 mrhero 创建的主题 Django 请教学习 Django 的好方法、书目
写了几年DJANGO,深以为DJANGO的各类文档都是大坑啊。。。
2015-04-02 17:35:53 +08:00
回复了 tuoxie007 创建的主题 程序员 刚花了一分钟面试完一个 iOS 工程师
结果面到了phuslu
2015-04-01 00:12:04 +08:00
回复了 Lamian 创建的主题 数据库 讨论一下 cache 的用法
@ryd994 金融的是不能这么搞,但一般的互联网场景都可以。金融应该算少数啦。。
2015-03-31 23:12:40 +08:00
回复了 Lamian 创建的主题 数据库 讨论一下 cache 的用法
@ryd994 一般都这么搞呀。如果不用这个那干嘛不上个redis或memcache就好了,这个策略多线程顶多加个锁不就结了。。。
2015-03-31 20:46:11 +08:00
回复了 Lamian 创建的主题 数据库 讨论一下 cache 的用法
读:不命中则读db,并设置cache
写:先写入cache,然后异步更新db

over,不明白有什么可以争论的点
@sleeperqp 恩,现在就是做短期时间的,我指的是内容没法外延
过滤的想法就是用户先聚类了,比如先把体育用户拿出来,专门推体育,是可以比较好降维,或者更细粒度的聚类
有研究过这种聚类吗?
@SmiteChow 矩阵特别大= = 而且user-url的评分都是0/1啊
@bluewinger 看过了,不顶用,因为我们这个数据量比较大,它里面的手段没法直接用(可能做一些过滤、初始化也可以)
2015-03-31 15:32:35 +08:00
回复了 efi 创建的主题 程序员 StackOverflow 上所有问题
明显错误的观点啊,大部分人SO都是因为manual实在写的太烂了。。。
@sleeperqp 嗯。。。。我也是这样想的,不过这样应该是content-based推荐吧,容易一直推用户以前喜欢看的
并且问个小白问题:用户有特征向量,而文章也有特征向量(很多tag),那么这个相似度要全部都算过去吗?用户*文章?
@kimmykuang 嗯,想法就是数据清洗+聚类+usercf?
看起来靠谱。。。有实践过吗?不知道效果好不好?
@sleeperqp 我打算先去掉点击量小的url,或者一些其他方法filter掉数据来降维,或者从tag的角度出发
你是做搜索引擎相关吗?指点一下?我觉得这个想法挺靠谱的
@sleeperqp 恩,我现在是根据PV来算的,每个PV都加对应tag的权重,item是url
@ligyxy 有什么好的降维方法吗?我之前咨询过几个同学,有一些learning to rank的想法,不过我对这块也不大熟
@dalaomj 投资者?不过数据我看还是有亏有盈的。。
2014财年全年净亏损为2.41亿美元,而2013财年则为净利润2.74亿美元。
@xuwenmang 这是社会性观点,但不知道有没有数据佐证
@9hills 我一直以为收入-支出就是利润,不是这么算的吗?
@sleeperqp 权值指的是?
@qiayue 还有一点,用户量和url量都很大,CF能跑得动吗
@qiayue 基于user的CF?
@babyname 有关注,但还没有用上,有啥相似的case吗?
1 ... 51  52  53  54  55  56  57  58  59  60 ... 86  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2604 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 30ms · UTC 04:52 · PVG 12:52 · LAX 20:52 · JFK 23:52
Developed with CodeLauncher
♥ Do have faith in what you're doing.