xyyandxyy 最近的时间轴更新
xyyandxyy

xyyandxyy

V2EX 第 665494 号会员,加入于 2023-12-03 13:56:12 +08:00
根据 xyyandxyy 的设置,主题列表被隐藏
二手交易 相关的信息,包括已关闭的交易,不会被隐藏
xyyandxyy 最近回复了
@gaobh 谢谢佬, 从你这才知道 cf 有这个, 看了一下好像我的数据这么大还是要比较高的费用的, 但是 mark 了!
@xianghaolin 嗯嗯我看了一下确实是

@NewHere 没有公网 IP 呜呜

@NSAgold
@IvanLi127
@XiLingHost
谢谢佬的建议! mark 了!
是这样的...

主要是组内一般只维护一个静态的官网, 对外开放的存储还没有人来做, 要做也得抓其他同学(会维护且愿意做的同学不多)或自己来做, 整个流程更麻烦(因为还要去和管理的老师对接), 不如我在自己的服务器上写一个.

我们领域有一些数据集是如佬所说的附属 edu/ac 机构页面, 也是比较大的数据集, 但是时间久了(5 年往上), 很多也断了维护, 或者是下载速度龟速. 也基本是靠社区分享才能获取. 确实审核也就维持个前一段时间的几年, 之后就不在了...

所以综合时间和精力成本还是自己来研究下... 寄希望能少折腾点. 数据集还是有价值的, 我希望能送到需要的研究者手上, 减少他们去翻找的痛苦. 但是大组可能确实不 care, 每年三大会一堆, 不差我一个小小数据集.
@northbrunv 但是带宽成本感觉有点吓人
@1423 archive 是?
@chesha1 嗯嗯, 大佬说的有道理. 因为数据集涉及到一些隐私, 按照目前类似数据集的做法, 一般都是我做一个 request form, 然后审核 request 后发一个下载链接过去. 感觉 HF 可以研究一下怎么放上去, 刚刚查了一下好像没有上传大小限制.
@kebamt 可以完全不管国内访问, 因为国内访问我直接提供个百度云. 佬除了 PikPak 还有什么推荐吗? 自建也可以, 我是校园网, 校内有自己的服务器, 但是校外访问, 并下这个大个数据集, 没有想到怎么解决办法.
@UncleCAT4 淘宝上写的是扩容, 原理应该是拼车
害怕。小弟 985 本,华 5 硕,计算机视觉方向。最近导师能硕转换博,但是由于感觉可能做的方向不喜欢,在考虑去大厂捞几年。看了贴之后担心在 30 岁之后会不会和 op 遇到一样的情况和纠结。有没有老哥能指点一下
109 天前
回复了 szxht 创建的主题 问与答 有没有大佬讲讲光电专业
如果是 985 ,如果本来成绩或应试还可以,可以利用考研或保研适合深造,因为本科直接上班不太好利用本专业优势。看你是什么本科
170 天前
回复了 robking 创建的主题 程序员 本科深度学习毕设
@robking 那你可以先假设这篇论文也是纯水的,不要太依赖去通过这篇文章解决你现在的问题。如果你还想稍微跑一下结果的话(假设你已经有数据了!), 建议你需要做的就是面向 google ,b 站学习,配好 conda 环境。剩下的事情面向 gpt 编程,你可以让他帮你写好 pytorch 下 dataloader ,dataset 对应的类,写好 model 的定义,然后写好 train 和 test 的过程。你有了 dl 基础知识,面向 gpt 编程的可行性还是有的(或者你去 copy github 上对应这个领域的开源工作改改)。如果你感觉为时已晚,已经要完蛋了,建议还是先请客吃饭找身边前辈请教一下,然后也边做上面的事情,这样你答辩糊弄的时候也有话可说。
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5658 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 12ms · UTC 01:49 · PVG 09:49 · LAX 18:49 · JFK 21:49
Developed with CodeLauncher
♥ Do have faith in what you're doing.