UP简历 小U

+86 138-0000-0000|xiaoyu@upjianli.com|北京

个人总结

作为一名资深模型部署工程师,我专注于将复杂的AI模型高效、稳定地部署到云端及本地环境中。我精通主流部署框架与优化技术,具备丰富的CI/CD实践经验,并擅长利用Docker、Kubernetes等容器化技术实现模型的弹性伸缩与高可用。在过去的项目中,我成功提升了模型推理性能达<strong>30%</strong>,并降低了部署成本<strong>20%</strong>。我致力于通过自动化与工程化手段,加速AI模型的商业化落地,为业务带来显著价值。

工作经历

高级模型部署工程师

字节跳动

2021-07 - 2024-06
  • 负责核心推荐算法模型的端到端部署与上线,支撑日活用户超过1亿的业务场景。
  • 主导开发自动化模型部署平台,将模型上线周期从天缩短至小时,提升效率90%
  • 优化模型推理服务,通过TensorRTONNX Runtime等技术,使模型平均推理延迟降低25%,吞吐量提升30%
  • 设计并实现模型灰度发布与AB测试系统,确保模型迭代的平稳性与效果监控,降低线上故障率15%
  • 利用KubernetesDocker构建高可用、弹性伸缩的模型服务集群,有效支撑业务高峰期流量,资源利用率提升20%
  • 与算法团队紧密协作,提供模型优化建议,成功将多个大型模型的显存占用降低10-15%

AI工程化实习生

百度

2020-07 - 2021-01
  • 参与自动驾驶感知模型的部署与优化工作。
  • 协助搭建模型性能评测平台,对不同推理引擎(如TensorFlow ServingTorchServe)进行对比分析。
  • 学习并实践Docker容器化技术,将模型服务封装并部署到测试环境。
  • 协助完成模型部署文档的编写与维护,提升团队协作效率。
  • 对模型的CPU/GPU资源占用进行分析与优化,初步掌握性能调优方法。

项目经历

智能客服问答系统部署项目

字节跳动 (内部项目)

2023-01 - 2023-08
  • 作为核心部署工程师,负责大语言模型(LLM)在智能客服系统中的集成与部署。
  • 设计并实现了基于FastAPITriton Inference Server的高性能模型推理服务,支持每秒查询500+次。
  • 构建CI/CD流水线,自动化模型的打包、测试与部署,确保系统快速迭代。
  • 引入模型量化与剪枝技术,将LLM模型大小减少40%,同时保持问答准确率在95%以上。
  • 负责线上服务的监控与告警体系搭建,保障系统99.9%的可用性。
  • 项目上线后,有效提升客服响应效率30%,用户满意度提高10%

教育背景

清华大学

硕士 · 计算机科学与技术

2018-09 - 2021-06

北京航空航天大学

学士 · 软件工程

2014-09 - 2018-06

技能专长

模型部署与推理

TensorRT · ONNX Runtime · Triton Inference Server · TensorFlow Serving · TorchServe · OpenVINO

云平台与容器化

AWS · Kubernetes · Docker · Istio · Serverless

编程语言与框架

Python · Go · FastAPI · Flask · PyTorch · TensorFlow

CI/CD与自动化

Jenkins · GitLab CI/CD · Ansible · Terraform

性能优化与监控

模型量化 · 模型剪枝 · Prometheus · Grafana · ELK Stack

热门进阶2025/12/4

模型部署工程师简历范文

模型部署工程师 AI人工智能 3-5年经验

本模型部署工程师简历范文专注于展示如何将AI模型高效部署至云端或本地环境,突出自动化部署、性能优化与持续集成能力,助力AI产品快速上线与稳定运行。

核心亮点

突出模型上线与云端/本地部署经验
强调自动化部署与运维能力
展示性能优化与问题解决能力
适用于有一定经验的模型部署工程师

适用人群

本范文特别适合模型部署工程师岗位的求职者参考学习, 通过具体的工作经历和项目经验展示,帮助您了解如何突出AI人工智能 行业的核心竞争力。

同样优秀的热门范文

热门进阶
4分钟

智慧实验室系统集成简历范文(展示如何通过LIMS系统实现从样本采样到报告生成的全流程自动化)

本范文专为智慧实验室系统集成工程师设计,重点展示如何通过LIMS系统实现从样本采样到报告生成的全流程自动化。内容涵盖系统规划、集成实施、数据管理与流程优化等核心能力,突出您在提升实验室效率和数据准确性方面的专业经验。

热门进阶
4分钟

垂直电商私域增长简历范文(展示利用企微自动化工具实现母婴社群月度转化率提升8%的方案)

本简历范文专为垂直电商私域增长岗位设计,重点展示如何利用企微自动化工具,成功实现母婴社群月度转化率提升8%的实战经验。范文详细阐述了从策略制定、工具应用到效果评估的全链路私域运营能力,是私域增长专业人士的理想参考。

热门进阶
4分钟

生物传感器开发简历范文(记录开发一种高灵敏度汗液血糖监测贴片并完成50例样本对比)

本简历范文专为生物传感器开发工程师设计,重点突出在开发高灵敏度汗液血糖监测贴片项目中的实践经验,详细记录了从概念设计到50例样本对比验证的全过程,展现了候选人在生物传感技术、数据分析及项目执行方面的卓越能力。

热门进阶
4分钟

植物肉研发助理简历范文(详述通过调整挤压机剪切力改善大豆蛋白纤维感以模拟真实牛肉)

本植物肉研发助理简历范文,详述了通过调整挤压机剪切力改善大豆蛋白纤维感以模拟真实牛肉的研发经验。范文突出候选人在植物肉产品研发、工艺优化和实验数据分析方面的能力,尤其适合对植物基食品创新有深入理解的求职者。

热门专家
4分钟

元宇宙虚拟空间架构简历范文(记录为某虚拟演唱会搭建容纳万人的动态交互场景优化细节)

本简历范文专为元宇宙虚拟空间架构师设计,详细记录了在虚拟演唱会项目中,如何成功搭建并优化容纳万人的动态交互场景。范文强调了虚拟空间设计、高并发场景优化、用户交互体验提升等核心能力,是您展示专业技能和项目经验的绝佳范本。

热门进阶
4分钟

跨境支付风控实习简历范文(描述通过规则引擎优化识别出东南亚市场某类新型信用卡诈骗)

本简历范文专为跨境支付风控实习生设计,重点突出通过规则引擎优化,成功识别并防范东南亚市场新型信用卡诈骗的实战经验。适合对支付风控、数据分析及反欺诈技术有浓厚兴趣的应届生。

热门专家
4分钟

预训练大模型语料精调简历范文(展示如何构建高质量数学题语料库并提升模型逻辑推理能力)

本简历范文专为预训练大模型语料精调工程师设计,重点展示如何构建高质量数学题语料库,并通过精细化标注与优化,显著提升大模型的逻辑推理能力。范文强调了数据清洗、标注规范制定、模型评估与迭代等关键技能,是AI领域专业人士的理想参考。

热门专家
4分钟

数据标注团队组长简历范文(描述如何通过建立三级质检体系提升自动驾驶标注准确率至99%)

本简历范文详细展示了数据标注团队组长如何通过建立创新的三级质检体系,将自动驾驶数据标注准确率提升至99%的实战经验。范文强调了团队管理、质量控制和流程优化的核心能力,为求职者提供了高质量的参考。

简历写作

专业指导,提升简历质量

参考范文,制作您的专业简历

借鉴优秀范文的写作技巧,选择合适模板,使用AI智能填写功能,快速完成简历制作