工作职责: 负责大规模网站的抓取、抽取,去重、分类,垃圾过滤,质量识别等工作。
任职资格: 1 、有扎实的数据结构和算法功底; 2 、工作认真细致踏实,有较强的学习能力; 3 、熟悉 linux 开发环境,熟悉 C++和 python 语言的优先; 4 、有爬虫,信息抽取,文本分类相关经验者优先; 5 、理解 http ,熟悉 html, DOM, xpath 优先。
简历投递: [email protected] 咨询推荐: 1018543943 (禾雨 QQ )