Blog

DQN模型工程师(M003)

【关于我们】

我们是一家领先的全球量化交易企业和流动性提供商,致力于提供卓越的风险调整后回报。通过结合全面的数学分析、丰富的金融市场知识以及尖端的人工智能技术解决方案,我们的交易模型经受住了时间的考验。我们是系统化决策、算法执行和主动风险管理领域的先驱。我们的团队由来自顶级投资银行的资深专业人士和拥有知名学府背景的毕业生组成。

在瞬息万变的资本市场中,端到端智能模型闭环是交易盈利的基石。我们构建了一个从多源实时数据采集与清洗、Vector/Graph RAG 混合检索,到结构化模型推理、自动化训练流水线、CI/CD 驱动的模型自动化部署与滚动升级的全流程平台,通过 NLP、深度学习、强化学习、时间序列和风险管理等前沿技术,不断提升对复杂市场的洞察力和执行力,确保交易分析与决策始终保持领先。

【职责范围】

1.分层强化学习策略开发

  • 设计并实现高阶(1 分钟级)与低阶(秒级)双 Agent 架构,构建高层 Agent与低层 Agent输入特征向量和决策流程;
  • 高层 Agent:基于分钟级预测数据、市场状态 ID、Copula 风险因子等构建向量输入,进行宏观策略路由与权重融合、记忆增强与决策输出;
  • 低层 Agent:基于秒级数据与Level-2盘口特征构建向量输入,输出离散化交易动作建议、理论最佳挂单价格/数量及置信度分数;

2.强化学习算法研究与训练

  • 构建并训练基于 DQN、Double DQN、A2C 等算法的高频交易策略;
  • 设计并优化奖励函数,支持高频交易套利;
  • 应对非平稳市场与高维特征融合挑战,引入动态策略更新与稳健训练机制;

3.低延迟推理服务部署

  • 将训练好的 RL 策略封装为 Python/Go 微服务,提供 gRPC/自研轻量 RPC 接口;
  • 部署至K8s集群、FPGA/ASIC 硬件加速节点,确保算法推理延迟单次 ≤100 ms,总延迟 ≤1s;

4.硬件加速集成

  • 与硬件团队协作,使用 HLS、Verilog/VHDL 将关键网络前向运算映射到 FPGA/ASIC,优化数据通路与流水线;
  • 管理 Bitstream 和固件版本,集成至 CI/CD 流水线。

5.执行引擎协作与效果验证

  • 与 Execution Engine 团队对接,确保高阶/低阶 Agent 输出信号无缝下发至FIXClient/CTPClient;
  • 实时监控成交率、滑点及对冲效果,基于反馈持续优化模型。

6.监控与性能优化

  • 在 Prometheus/Grafana 中配置训练 & 推理性能指标(Latency、Throughput、Resource Utilization),建立监控和告警;
  • 分析并优化 CPU、内存、PCIe、网络与 FPGA/ASIC 资源瓶颈。

7.文档与知识传承

  • 撰写分层 RL 模型设计文档、高层/低层 Agent 接口规范与 FPGA/ASIC芯片集成指南;
  • 对交易前台团队开展培训与分享,提升整体协作效率。

【职位要求】

  • 博士及以上学历,计算机科学、电子工程、人工智能或相关专业;
  • 5 年以上强化学习算法研究与高频交易策略开发经验;
  • 精通 DQN、Double DQN、A2C 等 RL 算法,熟练使用 PyTorch/TensorFlow;
  • 拥有分层 RL(hierarchical RL)实现经验,理解高层/低层 Agent 设计;
  • 熟悉 FPGA/ASIC 硬件加速集成,掌握 HLS、Verilog/VHDL 及相关工具链;
  • 精通 Python/Go 微服务开发与 gRPC,高性能 RPC 原理;
  • 熟悉 K8s、Docker 容器化及 Helm 部署,具备 CI/CD 实践经验;
  • 优秀的故障排查与 on-call 响应能力,良好的跨团队沟通与文档撰写能力;
  • 具备高度的责任心,愿意签署严格的保密协议并履行保密义务;
  • 英语听说读写能力强者优先,可快速定位国际化组件文档与技术社区资源者优先,可适应海外公司轮派常驻者优先。

【福利待遇】

  • 具有竞争力的基本薪资与绩效奖金;
  • 扁平化管理体系与充满活力的创新团队文化;
  • 每年多次海外差旅及专项培训机会;
  • 五险一金、带薪年假、年度健康体检、团建活动等完善福利。

【工作地点】

上海、深圳、新加坡、旧金山

如有意向可将简历发至Careers@liangheng.top,请在邮件标题处注明: 姓名+申请职位