特别说明
- 我们为你提供从竞争白热化的移动互联网红海赛道,向 AI-native 应用全新蓝海领域转型的稀缺战略机遇。
- 我们秉持结果导向,核心团队均由各领域资深专家领衔,从根源上杜绝 “外行指导内行” 的情况;管理上坚决摒弃微观管理( micro-manage ),充分赋予团队自主决策与执行空间。
- 团队成员中既有退役军人,也有🌈伙伴;既有大专生,也有博士后。人员背景多元包容,招聘不设学历门槛,始终坚持唯才是举。
- 此岗位为初中级数据采集工程师;我们也有中高级采集工程师的需求,见此帖
官网
https://www.pureblueai.com/
职位描述
- 参与 Web 端与 Android 端数据采集任务的执行与优化,为后续数据应用及 AI 模型训练提供基础数据支撑。
- 基于 Python 生态爬虫框架(如 Scrapy 、Requests 、Playwright )开发 Web 端基础爬虫逻辑,负责常规页面及简单动态渲染页面的抓取与数据解析,实现结构化数据的提取。
- 负责 Android 端主流 APP 的数据采集相关工作,包括 APP 界面元素识别、数据交互逻辑分析,使用 UiAutomator 等工具编写自动化采集脚本。
- 初步分析 Web 端 HTTP/HTTPS 协议及 Android 端网络请求,协助完成简单的数据加密逻辑破解、参数验证分析等工作。
- 协助研究 Web 及 Android 端基础反爬/反作弊策略,参与 IP 代理、浏览器指纹伪装、APP 端简单风控对抗等方案的落地执行,提升采集成功率。
- 协同团队完成数据采集流程的规范化梳理,保障采集数据的完整性与准确性,配合完成数据格式标准化处理。
- 跟进采集过程中的问题,及时反馈并协助排查解决,积累双端数据采集的实战经验。
岗位要求
- 1-3 年数据采集相关经验,具备 Web 爬虫或 Android 自动化/逆向相关实操案例(应届优秀毕业生或有相关项目经验者可放宽)。
- 熟悉 Python 编程语言,能够熟练使用至少 1 种 Python 爬虫框架( Scrapy/Requests 等)及数据解析工具( BeautifulSoup 、lxml );了解基本的 Python 编程规范。
- 具备 Android 开发或逆向基础:了解 Android Framework ,对 AccessibilityService 原理及 UI 渲染机制有初步认知;熟悉 Smali 指令、Arm64 指令集者优先。
- 能够使用 UiAutomator 编写 Android 端自动化脚本,有 Xposed 插件开发经验者优先;了解 Android 端 APP 的安装、调试及日志分析基础方法。
- 具备基础的网络协议分析能力:了解 HTTP/HTTPS 协议基本原理,能够使用 Charles/Fiddler 等工具进行简单抓包分析;了解 Android 端网络请求流程者优先。
- 具备一定的逆向思维,有 Web 端简单反爬(如请求频率限制、基础参数加密)或 Android 端 APP 基础逆向、风控对抗经验。
- 了解 Redis 、MongoDB 等基础中间件的基本使用,对分布式数据采集有初步概念者优先。
- 具备良好的学习能力、沟通协作意识,有较强的责任心和执行力,能够配合团队完成攻坚任务,抗压能力强。
工作地址
北京市海淀区清华同方科技广场 D 座 20 层 或 北京市朝阳区锐创国际中心 A 座 12 层
薪资
15 ~ 25k * 13 薪
联系方式
[email protected] 或 本站私信