V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 外包信息请发到 /go/outsourcing 节点。
• 不要把相同的信息发到不同的节点
snakeninny
V2EX  ›  酷工作

PureblueAI:知道 V2EX 藏龙卧虎,我司诚招 [初中级数据采集工程师(Web+Android)]

  •  
  •   snakeninny · 10 小时 17 分钟前 · 265 次点击

    特别说明

    • 我们为你提供从竞争白热化的移动互联网红海赛道,向 AI-native 应用全新蓝海领域转型的稀缺战略机遇。
    • 我们秉持结果导向,核心团队均由各领域资深专家领衔,从根源上杜绝 “外行指导内行” 的情况;管理上坚决摒弃微观管理( micro-manage ),充分赋予团队自主决策与执行空间。
    • 团队成员中既有退役军人,也有🌈伙伴;既有大专生,也有博士后。人员背景多元包容,招聘不设学历门槛,始终坚持唯才是举。
    • 此岗位为初中级数据采集工程师;我们也有中高级采集工程师的需求,见此帖

    官网

    https://www.pureblueai.com/

    职位描述

    • 参与 Web 端与 Android 端数据采集任务的执行与优化,为后续数据应用及 AI 模型训练提供基础数据支撑。
    • 基于 Python 生态爬虫框架(如 Scrapy 、Requests 、Playwright )开发 Web 端基础爬虫逻辑,负责常规页面及简单动态渲染页面的抓取与数据解析,实现结构化数据的提取。
    • 负责 Android 端主流 APP 的数据采集相关工作,包括 APP 界面元素识别、数据交互逻辑分析,使用 UiAutomator 等工具编写自动化采集脚本。
    • 初步分析 Web 端 HTTP/HTTPS 协议及 Android 端网络请求,协助完成简单的数据加密逻辑破解、参数验证分析等工作。
    • 协助研究 Web 及 Android 端基础反爬/反作弊策略,参与 IP 代理、浏览器指纹伪装、APP 端简单风控对抗等方案的落地执行,提升采集成功率。
    • 协同团队完成数据采集流程的规范化梳理,保障采集数据的完整性与准确性,配合完成数据格式标准化处理。
    • 跟进采集过程中的问题,及时反馈并协助排查解决,积累双端数据采集的实战经验。

    岗位要求

    • 1-3 年数据采集相关经验,具备 Web 爬虫或 Android 自动化/逆向相关实操案例(应届优秀毕业生或有相关项目经验者可放宽)。
    • 熟悉 Python 编程语言,能够熟练使用至少 1 种 Python 爬虫框架( Scrapy/Requests 等)及数据解析工具( BeautifulSoup 、lxml );了解基本的 Python 编程规范。
    • 具备 Android 开发或逆向基础:了解 Android Framework ,对 AccessibilityService 原理及 UI 渲染机制有初步认知;熟悉 Smali 指令、Arm64 指令集者优先。
    • 能够使用 UiAutomator 编写 Android 端自动化脚本,有 Xposed 插件开发经验者优先;了解 Android 端 APP 的安装、调试及日志分析基础方法。
    • 具备基础的网络协议分析能力:了解 HTTP/HTTPS 协议基本原理,能够使用 Charles/Fiddler 等工具进行简单抓包分析;了解 Android 端网络请求流程者优先。
    • 具备一定的逆向思维,有 Web 端简单反爬(如请求频率限制、基础参数加密)或 Android 端 APP 基础逆向、风控对抗经验。
    • 了解 Redis 、MongoDB 等基础中间件的基本使用,对分布式数据采集有初步概念者优先。
    • 具备良好的学习能力、沟通协作意识,有较强的责任心和执行力,能够配合团队完成攻坚任务,抗压能力强。

    工作地址

    北京市海淀区清华同方科技广场 D 座 20 层 或 北京市朝阳区锐创国际中心 A 座 12 层

    薪资

    15 ~ 25k * 13 薪

    联系方式

    [email protected] 或 本站私信

    2 条回复    2026-01-14 17:47:26 +08:00
    zhybb2010
        1
    zhybb2010  
       10 小时 11 分钟前
    做这种业务跟百度的莆田医院一个性质,污染训练数据,阻碍社会发展。
    你们公司就不怕生儿子没屁眼么?
    snakeninny
        2
    snakeninny  
    OP
       10 小时 0 分钟前
    @zhybb2010 脏的看啥都是脏的
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   961 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 25ms · UTC 19:47 · PVG 03:47 · LAX 11:47 · JFK 14:47
    ♥ Do have faith in what you're doing.