基本情况
研究方向
- 并行与分布式计算、集合通信
- 高性能网络,包括路由器微体系结构、RDMA网卡
教育经历
2021.09 ~ 至今: 国防科技大学 计算机科学与技术 学术硕士(非军籍)
- 一篇CCF-B类会议论文(第一作者),专利一项
2017.08 ~ 2021.07: 西安交通大学 计算机科学与技术 工学学士
- 西安交通大学校级奖学金、西安交通大学优秀学生、国家级大学生创新项目
- 2019年中国飞行器设计挑战赛全国二等奖
论文发表
Ruiqi Wang, Dezun Dong, Fei Lei, Ke Wu, Junchao Ma, and Kai Lu. 2023.
Roar: A Router Microarchitecture for In-network Allreduce. In International
Conference on Supercomputing (ICS’23, CCF-B类会议), 免费下载链接Aoxiang Feng, Dezun Dong, Fei Lei, Junchao Ma, Enda Yu and Ruiqi Wang. 2022. In-network aggregation for data center networks: A survey. In Computer Communications. (CCF-C类期刊)
项目和科研经历
1、面向分布式AI Training和并行计算的定制加速器
- 主要内容:在标准路由器中设计一个加速器,加速分布式AI训练和MPI应用的通信瓶颈:Allreduce算子(收集所有主机的数据,再将聚合的结果广播给每个主机),将Allreduce卸载到路由器中完成。该架构专为RDMA网络定制。Allreduce算子:
- 实现效果:对比手动实现的Allreduce算子性能提升2倍。网络流量大大压缩。
- 发表情况:发表于ICS’23会议(CCF-B类会议)上,并于ChinaSys’23上报告。
2、固定翼对地侦察与打击无人机
所获奖项:中国国际飞行器设计挑战赛全国二等奖。2019年末社团被央视CCTV13新闻频道报导。
个人职责:担任队长并负责飞控功能的开发,内容包括:
- 基于Nuttx OS和PX4开源框架开发飞控程序,飞机根据GPS坐标使相机瞄准目标,自动投弹;
- 基于Qt-5框架修改QGroundControl地面站软件源码,开发自动投弹的图形化控制界面;
- 结合飞机气动结构和硬件,实现定制化的控制算法和程序,使其高速飞行时压准航线,参考巡航导弹改装飞机PID制导程序;
学到了很多Posix编程、RTOS Kernel的知识,如何编写系统软件控制飞机的各类硬件,锻炼了组织协调和管理能力。
技能和个人特点
编程语言:尤其熟悉C/C++、x86-64汇编,较熟悉ARM汇编、Python,同时掌握Verilog、VHDL、Java、MySQL。
硬件基础:
- 熟悉高性能网络架构,包括路由器微架构和RDMA网卡。
- 熟悉x86-64、ARM微处理器架构及其汇编,有使用Verilog设计多级流水线微处理器的经验,擅长利用体系结构的特点优化程序性能。
软件基础:
- 熟悉并行程序设计,精通MPI和OpenMP编程;
- 熟悉操作系统原理,能够调试和分析Linux内核,熟悉Linux/Unix环境下编程,以及并发编程和程序链接等概念;
- 能通过gdb调试和逆向工程分析源程序及其漏洞。
开发工具:能适应任何操作系统和编辑器,主要使用Windows和Ubuntu。经常使用的IDE有VS、VSCode、Anaconda、OMNet++等,有使用GitHub进行团队协作的经验。学习能力强,使用过多种框架(例如openCV、SLAM、PyTorch、Adroid Studio)进行开发。
特点:喜欢研究计算机底层软硬件。热爱运动,敢想敢做,抗压能力强,善于沟通和团结他人。
外语能力:英语六级593分。