小柚

13800138000|xiaoyou_dev@163.com|北京市

个人总结

计算机科学与技术专业应届生,深耕 GPU 高性能计算领域。熟练掌握 CUDA 编程与计算机体系结构,具备扎实的 C/C++ 功底。在算子优化与并行计算方面有深入实践,曾通过内存访问优化将核心算子性能提升 40%。渴望在芯片或 AI 基础设施领域贡献代码,解决算力瓶颈问题。

工作经历

GPU 计算加速实习生

寒武纪科技

2025-07 - 2025-10
  • 参与自研 AI 芯片软件栈中卷积算子的开发与调优,针对特定硬件架构重写 Kernel 代码,利用共享内存减少全局内存访问次数。
  • 使用 Nsight Compute 进行性能分析,定位寄存器溢出导致的占用率下降问题,通过调整线程块配置将 SM 利用率从 65% 提升至 82%。
  • 协助团队完成 Transformer 模型中 Attention 模块的算子融合,减少内核启动开销,整体推理延迟降低约 15%。

高性能计算实验室助理

电子科技大学计算机学院

2023-09 - 2024-06
  • 维护实验室集群环境,协助研究生进行 MPI+CUDA 混合编程调试,解决多卡通信中的死锁与同步问题。
  • 参与开源项目社区贡献,修复某深度学习框架在特定 CUDA 版本下的编译错误,合并代码至主分支。
  • 组织校内 CUDA 编程分享会,讲解内存层次结构与 Occupancy 优化技巧,覆盖听众 50 余人次。

项目经历

基于 CUDA 的大规模矩阵乘法优化

个人独立项目

2024-09 - 2025-01
  • 设计并实现多级分块(Tiling)策略,结合共享内存缓存机制,解决带宽受限问题,在 RTX 3090 上实现 85% 的理论峰值性能。
  • 引入 Warp-level Matrix Fragment 指令(WMMA)替代传统循环展开,进一步降低指令延迟,相比 naive 实现加速比达到 120 倍。
  • 编写自动化测试脚本对比 cuBLAS 库性能,在矩阵维度为 4096x4096 时,自定义实现性能达到库函数的 92%。

轻量级神经网络推理引擎开发

校级科研项目

2024-03 - 2024-08
  • 负责推理引擎后端 GPU 适配层开发,使用 C++17 封装 CUDA API,实现显存管理的自动化与零拷贝优化。
  • 针对移动端部署需求,对 FP16 精度下的激活函数进行指令级优化,利用 Tensor Core 加速矩阵运算,吞吐量提升 2.3 倍。
  • 重构数据预处理流水线,将 CPU 到 GPU 的数据传输与计算重叠(Overlap),掩盖 PCIe 传输延迟,端到端耗时缩短 30ms。

教育背景

电子科技大学

本科 · 计算机科学与技术

2022-09 - 2026-06

技能专长

编程语言

C/C++ · CUDA C · Python · Assembly (PTX)

核心技术

GPU 架构 · 算子优化 · 并行计算 · 内存管理 · 性能分析

工具链

Nsight Systems · Nsight Compute · GDB · CMake · Git

基础知识

计算机体系结构 · 操作系统 · 数据结构与算法 · 线性代数

程序员简历进阶2026/6/24

GPU高性能计算工程师简历范文(芯片/人工智能基础设施校招)

GPU高性能计算工程师 科技行业 应届生

专为芯片/人工智能基础设施校招打造的GPU高性能计算工程师简历范文。涵盖CUDA编程、计算机体系结构、C/C++及算子优化等核心技能,助力应届生斩获25k-50k高薪Offer。

#GPU高性能计算工程师简历 #芯片/人工智能基础设施校招简历 #CUDA编程简历范文 #算子优化简历 #应届生求职简历

核心亮点

精准匹配芯片/人工智能基础设施校招需求
突出CUDA编程与算子优化项目经验
展示计算机体系结构与C/C++底层功底

适用人群

本范文特别适合GPU高性能计算工程师岗位的求职者参考学习, 通过具体的工作经历和项目经验展示,帮助您了解如何突出科技行业 行业的核心竞争力。

同样优秀的程序员简历范文

程序员简历入门
8分钟

后端开发工程师简历范文(互联网/IT/智能制造校招)

专为互联网、IT及智能制造行业校招打造的后端开发工程师简历范文。涵盖C++、Java、Go、Linux及数据结构与算法等核心技能,助力应届生斩获15k-30k月薪Offer,目标城市包括北京、上海、成都。

程序员简历专家
8分钟

Linux内核研发工程师简历范文(基础软件/操作系统校招)

专为2026届应届生打造的Linux内核研发工程师简历范文(基础软件/操作系统校招)。涵盖Linux内核、C/C++、虚拟化技术及Rust语言核心技能,助力求职者斩获北京、长沙、武汉等地顶尖技术实习Offer。

程序员简历入门
8分钟

全栈开发工程师简历范文(电子/半导体/互联网校招)

专为电子/半导体/互联网行业校招打造的全栈开发工程师简历范文。涵盖Python、FastAPI、React、Vue、TypeScript及RESTful API核心技能,助力应届生斩获15k-25k月薪Offer。

程序员简历入门
8分钟

全栈开发工程师简历范文(互联网/电子半导体校招)

专为互联网及电子半导体行业校招打造的全栈开发工程师简历范文。涵盖Python、React/Vue、TypeScript等核心技能,展示RESTful API设计与微信小程序开发项目经验,助力应届生斩获15k-25k月薪Offer。

程序员简历入门
8分钟

后端开发工程师简历范文(互联网/IT校招)

专为互联网/IT行业校招打造的后端开发工程师简历范文。涵盖Java、Golang、Python等核心技能,展示分布式系统与微服务架构项目经验,助力应届生斩获24-56万年薪Offer。

程序员简历入门
8分钟

Java 后端开发工程师简历范文(互联网/IT/银行科技校招)

专为互联网、IT 及银行科技行业校招打造的 Java 后端开发工程师简历范文。涵盖 Spring Boot、Spring Cloud、MySQL 及分布式框架等核心技能,助力应届生斩获 12k-25k 薪资 Offer。

程序员简历入门
8 分钟

Java 后端开发工程师简历范文(互联网/金融科技/企业服务校招)

专为互联网、金融科技及企业服务行业校招打造的 Java 后端开发工程师简历范文。涵盖 SpringBoot、MySQL、Redis 及分布式系统核心技能,助力应届生斩获 15k-30k 薪资 Offer。

程序员简历入门
5分钟

Java后端开发工程师简历范文(医疗/健康科技校招)

专为医疗/健康科技行业校招打造的Java后端开发工程师简历范文。涵盖系统设计、高并发处理及医疗数据安全等核心技能,帮助应届生精准展示技术实力与行业匹配度。

简历写作

专业指导,提升简历质量

参考范文,制作您的专业简历

借鉴优秀范文的写作技巧,选择合适模板,使用AI智能填写功能,快速完成简历制作