【关于我们】
我们是一家领先的金融交易行业人工智能解决方案提供商。在瞬息万变的资本市场,最大的挑战是如何准确预测市场走势,传统模型往往无法捕捉金融市场的复杂性,导致错失交易机会并增加风险,我们致力于通过为中国金融行业创建高性能AI驱动的基础设施来克服这些挑战。我们的人工智能解决方案,可以使顶级交易员在监管框架内有效地管理各种模型和数据集,使他们能够专注于更深入的研究并做出更明智的交易决策,从而产生卓越的回报。
【职责】
- 设计和开发大规模语言模型,包括模型预训练、高效微调和性能优化
- 开发和优化模型训练框架,实现分布式训练、参数高效微调(PEFT)等关键技术
- 构建LLM评估体系,设计专业领域的评测基准
- 优化模型推理性能,实现模型量化、剪枝和部署优化
【要求】
- 计算机科学或相关领域的硕士及以上学位
- 2年以上深度学习项目开发经验,其中包含大规模模型训练实践
- 扎实的机器学习算法基础
- 优秀的实验设计和结果分析能力
- 良好的代码规范和文档编写能力
- 大模型开发:
- 精通LLM训练技术(如LoRA, QLoRA, Adapter等PEFT方法)
- 深入理解Transformer架构和主流预训练模型(如LLaMA, Mistral等)的原理和实现
- 熟悉Flash Attention、随机梯度压缩等底层优化技术
- 具备模型量化和压缩经验(如INT4/INT8量化、模型剪枝、知识蒸馏)
- 具备推理性能优化经验,理解vLLM、TensorRT-LLM等推理加速框架的原理和使用
- 分布式训练:
- 精通PyTorch,深入理解DistributedDataParallel、FSDP等分布式训练机制
- 熟悉DeepSpeed、Megatron-LM等大规模训练框架的原理和使用
- 掌握3D并行(数据并行、张量并行、流水线并行)训练技术
- 具备多GPU/多机训练系统的设计和性能调优经验
- 熟悉gradient checkpointing、混合精度训练等显存优化方法
- 系统优化:
- 精通Linux系统和CUDA编程
- 深入理解GPU架构和内存管理
- 具备训练和推理性能分析与优化能力
- 熟悉分布式存储系统(如S3, HDFS)
- 模型评估:
- 精通模型性能和效果评估方法
- 熟悉A/B测试和统计分析技术
- 具备模型可解释性分析经验
- 基础技术:
- 精通Python数据处理(numpy, pandas, scikit-learn等)
- 熟练使用PySpark处理大规模数据
- 具备设计和实现自定义loss function的能力
- 熟悉数据可视化和实验分析工具
【加分项】
- 有大模型相关论文发表或开源项目贡献
- 熟悉Transformer等核心架构的底层实现
- 具有金融机构或量化投资相关从业经验
- 理解金融市场机制和交易策略
【福利待遇】
- 可选择在国内远程办公,可达100%;
- 每年可在海外远程办公长达 25 天;
- 具竞争力的基本薪资及奖金;
- 扁平化的组织结构,融洽积极的团队氛围。
- 每年多次海外集体出游。
- 各种休闲活动(如体育运动、桌游等)。
【工作地点】
- 上海