Blog

Python 运维工程师(网络爬虫方向)

【公司简介】

上海量恒信息技术股份有限公司,是金融交易行业人工智能解决方案的领先者。在瞬息万变的资本市场,最大的挑战是如何准确预测市场走势,传统模型往往无法捕捉金融市场的复杂性,导致错失交易机会和风险增加。我们致力于通过为中国金融行业打造高性能人工智能驱动的基础设施来克服这些挑战。我们的人工智能解决方案,可以使严格的交易人员在监管框架内部有效地管理各种模型和数据集,使他们能够专注于更深入的研究并做出更明智的交易决策,从而产生卓越的回报。我们的核心价值观是:守正出奇,守拙利他。

【岗位概述】

我们正在招聘一位经验丰富的 Python 运维工程师,专注于网络爬虫的开发与维护。该职位要求候选人具备扎实的 Python 编程基础以及丰富的网络爬虫开发经验。

【岗位职责】

  • 设计、开发并维护分布式网络爬虫系统。
  • 进行多平台信息采集、清洗和分析。
  • 优化爬虫策略,提高数据提取效率。
  • 实时监控爬虫进程并进行预警和反馈。
  • 解决反爬虫技术难题,保证数据采集的稳定性。
  • 参与爬虫相关的架构设计与开发工作。

【任职要求】

  • 本科及以上学历,计算机相关专业优先。
  • 精通 Python 编程,具有 3 年以上相关工作经验。

【核心技能要求】

  • 熟悉 Linux 操作系统,具备较强的系统运维能力。
  • 深刻理解 HTTP 协议及网络爬虫原理与技术。
  • 熟悉常见的爬虫框架,如 Scrapy、pyspider。
  • 精通 HTML、DOM 结构,并能够熟练使用 XPath、正则表达式、CSS 选择器进行数据提取。
  • 理解常见的反爬虫技术并具备有效应对措施。
  • 具备分布式爬虫架构和大规模数据处理经验。

【加分技能】

  • 熟悉 Web 前端技术,对 JavaScript 动态渲染有所了解。
  • 具备数据挖掘与机器学习经验。
  • 熟悉 MySQL、MongoDB 等数据库操作。
  • 具备链接分析经验(如 PageRank、TrustRank)。
  • 拥有特征提取能力(例如页面质量评估、主题分析、LDA)。
  • 能有效处理账户封禁、IP 屏蔽、验证码识别等复杂问题。

【技术栈】

  • 编程语言:Python(必需),Shell(加分)。
  • 操作系统:Linux。
  • 数据库:MySQL、MongoDB。
  • 爬虫框架:Scrapy、pyspider。
  • 版本控制:Git。
  • 其他工具:正则表达式、XPath、BeautifulSoup。

【软技能】

  • 拥有强烈的学习热情和出色的问题解决能力。
  • 具备优秀的团队协作和沟通技巧。
  • 能够在高压环境下工作,富有责任心和主动性。
  • 拥有创新精神,能持续优化工作流程与技术方案。

【福利待遇】

  • 可选择在国内远程办公,可达100%;
  • 每年可在海外远程办公长达 25 天;
  • 具竞争力的基本薪资及奖金;
  • 扁平化的组织结构,融洽积极的团队氛围。
  • 每年多次海外集体出游。
  • 各种休闲活动(如体育运动、桌游等)。

 

【工作地点】

  • 上海