专任教师

您目前的位置: 首页» 团队队伍» 专任教师» 副教授

徐远超

徐远超.jpg  

徐远超 博士                                  

个人简介

        徐远超,博士,副教授,硕士研究生导师,中国计算机学会体系结构专业委员会委员和中国计算机学会信息存储技术专业委员会委员,CCF、ACM、IEEE会员,1998年在北京理工大学计算机系获得学士学位,2002年在北京航空航天大学计算机系获得硕士学位,2012年在中国科学院计算技术研究所获得计算机体系结构专业博士学位,2012-2013年在计算机体系结构国家重点实验室从事众核处理器研究,2013-2014年在美国佛罗里达大学电子与计算机工程系做访问学者,2017-2018年在美国杜克大学电子与计算机工程系做访问学者,2019年开始参与寒武纪科技全系列人工智能芯片核心调度算法研发。

       先后主持北京市自然科学基金项目2项、北京市教委科技面上项目1项、北京市教委交叉科研项目1项、计算机体系结构国家重点实验室开放课题3项、参与国家自然科学基金项目2项, 以及横向课题多项。以第一作者(或通信作者或合作者)在《计算机学报》、《计算机研究与发展》等CCF A类中文期刊及DATE、ICCD、CF、ISPA、ICPADS、ICA3PP、NVMSA、JCST、JSA、TCAD等CCF推荐的国际顶级会议期刊发表论文30余篇,申请国际国内发明专利18项(已授权9项),软件著作权7项,编写教材3部。

       指导员工曾获得2023年CCF计算机系统大会APPT优秀论文二等奖、北京市挑战杯竞赛三等奖,北京市优秀本科毕业论文(当年学院唯一),研究生国家奖学金、一等奖学金等,逾百名员工保研、考研、出国深造、读博。


研究兴趣

        本人的研究领域为计算机系统(Machine Learning System)。践行母校中国科学院计算技术研究所“科研为国分忧,创新与民造福”的核心价值观,多年来一直为国产芯片系统软件的发展舔砖加瓦。近年来围绕寒武纪的人工智能芯片开展系统优化研究,包括调度优化、编译优化、访存优化等。所谓系统优化(推荐阅读“深入理解计算机系统”教材),是指在人工智能算法的准确度基本保持不变的前提下,通过对人工智能应用运行的软硬件系统进行各种优化(包括算子、编译、计算、访存等),从而大幅提高人工智能系统的性能,让模型跑得更快,功耗更低。目前正在从事面向AI芯片的学习型调度器和编译器研究(ML for Scheduler/Compiler),属国际学术前沿,华为等大厂也极为关注。

       无论你是本科生还是研究生,只要对计算机系统有兴趣,有一定的编程基础,敢于挑战、求真务实、勤奋努力,欢迎联系我(xuyuanchao at cnu.edu.cn)。相对而言,计算机系统研究门槛略高,但含金量也高,华为等大厂特别需要这样的人才。挑战越大,收获也越大,俗话说,“不经历风雨怎能见彩虹”、“人生能有几回搏,此时不搏何时搏”。实际上,计算机系统研究是十分有趣的,能够探寻到程序运行的无穷奥秘,获得一种从未有过的成就感和自信心。


主持科研项目

[1].主持 北京市自然科学基金面上项目,4212017,通用AI芯片资源调度方法及关键技术研究,2021/01-2023/12,20万元,已结题

[2].主持 计算机体系结构国家重点实验室开放课题(CARCH201918),“面向AI处理器的调度算法研究”,2019.11-2021.10,5万元,已结题

[3].主持 北京市教委交叉科研项目,基于新型存储和网络器件的分布式单级存储系统研究,2019/01-2019/12、6万元、已结题

[4].主持 计算机体系结构国家重点实验室开放课题:面向新型非易失存储的崩溃一致性研究(CARCH201503,2015.11-2017.10),5万元,已结题

[5].主持 北京市自然科学基金预探索项目,4143060、面向大数据应用的众核片上资源利用优化研究、2014/01-2015/06、6万元、已结题

[6].主持 计算机体系结构国家重点实验室开放课题,CARCH201203、高通量众核处理器运行时管理系统研究、2012/11-2014/10、2万元、已结题

[7].主持 北京市教委科技发展面上项目,KM201210028004、基于程序行为分析的异构多核操作系统研究、2012/01-2014/12、15万元、已结题


学术论文

[1]. Ruyi Qian, Bojun Cao, Menjuan Gao, Qinwen Shi,Yida Wang, Yuanchao Xu, Qirun Huo, and Keni Qiu. EagerReuse: An Efficient Memory Reuse Approach for Complex Computational Graph[C]//2023 IEEE International Conference on Parallel and Distributed Systems (ICPADS). IEEE, 2023. (通信作者CCF C)

[2]. Yuanchao Xu, Ruyi Qian, Yida Wang, and Qirun Huo. iNUMAlloc: Towards Intelligent Memory Allocation for AI Accelerators with NUMA[C]//2023 IEEE Intl Conf on Parallel & Distributed Processing with Applications, Big Data & Cloud Computing (ISPA/BDCloud). IEEE, 2023:929-936.

[3]. Ruyi Qian, Menjuan Gao, Qinwen Shi, and Yuanchao Xu. An Empirical Study of Memory Pool-based Allocation and Reuse in CUDA Graph[C]//2023 International Conference on Algorithms and Architectures for Parallel Processing (ICA3PP), LNCS 14491, pp. 394–406, 2024. (通信作者)

[4]. Ruyi Qian, Menjuan Gao, Qinwen Shi, and Yuanchao Xu. An Empirical Study of Memory Pool-based Allocation and Reuse in CUDA Graph[C]//2023 International Conference on Algorithms and Architectures for Parallel Processing (ICA3PP), LNCS 14491, pp. 394–406, 2024. (通信作者)

[5]. Jinyu Cheng, Ruyi Qian, Qinwen Shi, Gaomei Hu, Mengjuan Gao, Qirun Huo, and Yuanchao Xu. Towards Efficient Elastic Parallelism for Deep Learning Processor[C]//2022 IEEE Intl Conf on Parallel & Distributed Processing with Applications (ISPA). IEEE, 2022: 363-370. (通信作者CCF C)

[6]. Jinyu Cheng, Kai Zhao, Yuanchao Xu. Global-view based Task Migration for Deep Learning Processor, 2021 IEEE International Symposium on Parallel and Distributed Processing with Applications (ISPA), IEEE, 2021: 908-915. (通信作者CCF C)

[7]. 徐远超. 面向新型非易失存储的文件系统研究综述[J]. 计算机应用研究, 2021, 38(6): 1601-1610.

[8]. Yuanchao Xu, Yuanyuan Xu, Min Tang, Liangliang Zhang, Yazhu Lan. Asymmetry & Locality-aware Cache Bypass and Flush for NVM-based Unified Persistent memory,2019 IEEE International Symposium on Parallel and Distributed Processing with Applications (ISPA), IEEE, 2019: 168-175. (CCF C)

[9]. Yazhu Lan, Kent W. Nixon, Qingli Guo, Guohe Zhang, Yuanchao Xu, Hai (Helen) Li, and Yiran Chen. FCDM: A Methodology Based on Sensor Pattern Noise Fingerprinting for Fast Confidence Detection to Adversarial Attacks. IEEE Transactions on Computer-Aided Design of Integrated Circuits and Systems (TCAD). 2020. (CCF A)

[10]. KENI QIU, Yujie Zhu, Yuanchao Xu, QirunHuo, Chun Jason Xue, BRLoop: Constructing Balanced Retimed Loop to Architect STT-RAM-based Hybrid Cache for VLIW Processors,Microelectronics Journal (Elsevier MEJ), Volume 83, January 2019,Pages 137-146.

[11]. KENI QIU, Weiwen Chen, Yuanchao Xu, Lixue Xia, Yu Wang and Zili Shao, A Peripheral Circuit Reuse Structure Integrated with a Retimed Data Flow for Low Power RRAM Crossbar-based CNN, International Conference on Design, Automation and Test in Europe (DATE’18), Dresden, Germany, 2018, pp. 1057-1062. (CCF-B)

[12]. KENI QIU, Zhiyao Gong,Dongqin Zhou,Weiwen Chen,Yuanchao Xu, Xin Shi, Yongpan Liu, Efficient Energy Management by Exploiting Retention State for Self-powered Nonvolatile Processors, Journal of Systems Architecture (Elsevier JSA),vol. 87,2018,pp. 23-35.(CCF-B)

[13]. Xu Tan, Xiao-Chun Ye, Xiao-Wei Shen, Yuan-Chao Xu, Da Wang, Dong-Rui Fan, Zhi-Min Tang. A Pipelining Loop Optimization Method for Dataflow Architecture. Journal of Computer Science and Technology (JCST), 2018:33(1), 116-130. (CCF B)

[14]. 侯泽毅,万虎,徐远超. NMST:一种基于线段树的持久性内存管理优化方法[J]. 计算机科学,2018,45(07):78-83+115.

[15]. 刘橴默,邱宗迪,贾甜远,徐远超. 非易失处理器安全备份机制研究[J]. 计算机工程与科学,2019,41(01):41-46.

[16]. 徐远超. eMMC可靠性分析与增强对策研究[J]. 计算机应用研究, 2017, 34(11): 3367-3372.

[17]. XU Yuanchao, YANG Lu. Task scheduling on a many-core processor for high-volume throughput applications. Journal of Tsinghua University (Science and Technology), 2017, 57(3): 244-249.

[18]. Chun Xue, Keni Qiu , Weigong Zhang, Jing Wang, Yuanchao Xu, Mengying Zhao, Data Re-allocation Enabled Cache Locking for Embedded Systems, Journal of Systems Architecture (JSA), 77: 3-13, 2017. (CCF B)

[19]. Yuan-Chao Xu, Hu Wan, Ke-Ni Qiu, Tao Li, Wei-Gong Zhang. Reducing Synchronization Cost for Single-Level Store in Mobile Systems [J] Journal of Computer Science and Technology (JCST), 2016,V31(4): 836-848.  (CCF B)

[20]. Yuanchao Xu, Lu Yang, Zeyi Hou, Qirun Huo, Keni Qiu. Energy-efficient Cache Management for NVM-based IoT Systems[C]. 14th IEEE International Symposium on Parallel and Distributed Processing with Applications (ISPA).IEEE, 2017. (CCF C)

[21]. Gong, Z., Qiu, K., Zhou, D., Chen, W., Xu, Y., Shi, X., & Liu, Y. (2017, August). Retention state-enabled and progress-driven energy management for self-powered nonvolatile processors. In Embedded and Real-Time Computing Systems and Applications (RTCSA), 2017 IEEE 23rd International Conference on (pp. 1-8). IEEE.

[22]. Chen Weiwen and Qiu Keni and Zhou Jiqin and Ni Yuanhui and Xu Yuanchao. Queuing Theory-Guided Performance Evaluation for a Reconfigurable High-Speed Device Interconnected Bus. In Trustcom/BigDataSE/ICESS. IEEE, 2017: 839-843.

[23]. Zhiyao Gong, Keni Qiu, Weiwen Chen, Yuanhui Ni, Yuanchao Xu, Jianlei Yang. Pipeline Optimizations of Architecting STT-RAM as Registers in Rad-Hard Environment. In Trustcom/BigDataSE/ICESS. IEEE, 2017: 844-852.

[24]. Yuanchao Xu, Zeyi Hou, Junfeng Yan, Lu Yang and Hu Wan. i-BEP: A Non-Redundant and High-Concurrency Memory Persistency Model. Design, Automation & Test in Europe Conference & Exhibition (DATE). IEEE, 2017: 618-621.(CCF B)

[25]. Keni Qiu, Junpeng Luo, Zhiyao Gong, Weigong Zhang, Jing Wang, Yuanchao Xu, Tao Li and Chun Jason Xue. Refresh-Aware Loop Scheduling for High Performance Low Power Volatile STT-RAM.The 34th IEEE International Conference on Computer Design (ICCD). IEEE, 2016: 209-216.(CCF B)

[26]. Yuanchao Xu and Zeyi Hou. NVM-assisted Non-Redundant Logging for Android Systems[C]//14th IEEE International Symposium on Parallel and Distributed Processing with Applications (ISPA). IEEE, 2016: 1427-1433.(CCF C)

[27]. Xu Yuanchao, Wan Hu, Hou Zeyi, Qiu Keni. Mitigating sync overhead in single-level store systems[C]. Proceedings of the ACM International Conference on Computing Frontiers (CF). ACM, 2016: 188-196. (CCF C)

[28]. Wan Hu, Lu Youyou, Xu Yuanchao, Shu jiwu. Empirical study of redo and undo logging in persistent memory[C]. 2016 5th Non-Volatile Memory Systems and Applications Symposium (NVMSA). IEEE, 2016: 1-6.

[29]. Qiu Keni, Zhang Weigong, Wu Xiaoqiang, Zhu Xiaoyan, Wang Jing, Xu Yuanchao, Xue Chun Jason. Balanced loop retiming to effectively architect STT-RAM-based hybrid cache for VLIW processors[C]. Proceedings of the 31st Annual ACM Symposium on Applied Computing (SAC). ACM, 2016: 1710-1716.

[30]. 徐远超,闫俊峰,万虎,孙凤芸,张伟功,李涛. 新型非易失存储的安全与隐私问题研究综述[J]. 计算机研究与发展, 2016, 53(9): 1930-1942.

[31]. 万虎,徐远超#,闫俊峰,孙凤芸,张伟功. 通过非易失存储和检查点优化缓解日志开销.计算机研究与发展, 2015, 52(6): 1351-1361.

[32]. 郑亚松,王达,叶笑春,崔慧敏,徐远超,范东睿. MALK:一种高效处理大规模键值的MapReduce框架.计算机研究与发展, 2014,51(12):2711-2723.

[33]. 范灵俊,徐远超,施巍松,范东睿,娄杰. 针对组相联缓存的无效缓存路访问混合过滤机制研究.计算机学报,2013,36(4):799-808.

[34]. 徐远超,张志敏,孙卫真. 面向单指令集异构多核处理器的负载均衡策略. 通信学报,2011,32(9A):204-210.

[35]. 徐远超,沈岩,谭旭,万虎,张志敏. 面向多核处理器系统的Cache感知调度算法.小型微型计算机系统,2013,34(2):365-369.

[36]. 徐远超,张志敏,蒋毅飞. 基于多目标遗传算法的单指令集异构多核系统静态任务调度.小型微型计算机系统,2012,33(10):2237-2242.


发明专利

[1]. 一种降低同步开销的数据写入方法和装置,徐远超、万虎、闫俊峰、张伟功,专利受权号:201511019947.8 (已授权)

[2]. Xu Yuanchao, Dongrui Fan, Hao Zhang, and Xiaochun Ye. "Method and Apparatus for Determining To-Be-Migrated Task Based on Cache Awareness." U.S. Patent,专利授权号:US9483321,Nov 1, 2016.(已授权)

[3]. 一种访问数据缓存的方法和处理器,徐远超、范东睿、张浩、叶笑春,专利授权号:2013102696183 (已授权)

[4]. 一种基于缓存感知的确定待迁移任务的方法和装置,徐远超、范东睿、张浩、叶笑春、张志敏,专利授权号:201210392519X (已授权)

[5]. 异构多核环境下基于程序行为在线分析的负载均衡方法,徐远超、杜霖、张志敏、潘巍、孙卫真、张聪霞,专利授权号:201110147099.4 (已授权)

[6]. 任务调度方法、任务处理方法及相关产品(编译调度协同),徐远超,专利申请号:202010105786.9,申请日期:2020年2月19日(已授权)

[7]. 一种基于急切内存重用算法的内存优化方法,徐远超,曹博钧,钱入意,史钦文,专利申请号:ZL202310883730.X,授权日期:2023-09-26(已授权)

[8]. 任务处理方法、装置、计算机设备和存储介质(原子任务调度),徐远超,专利申请号:202010102569.4,申请日期:2020年2月19日(已授权)

[9]. 任务迁移的方法、装置、计算机设备及可读存储介质(task级放松亲和性),徐远超,专利申请号:202010012242.8,申请日期:2020年1月7日(已授权)

[10].任务调度方法、装置、计算机设备和存储介质(公平调度)徐远超等,专利申请号:202010101962.1,申请日期:2020年2月19日(已受理)

[11]. 任务分配方法、装置、计算机设备及可读存储介质(存算协同分配),徐远超等,专利申请号:201911357498.6 ,申请日期:2019年12月25日(已受理)

[12]. 作业处理的方法、装置、计算机设备及可读存储介质(job级放松亲和性),徐远超等,专利申请号:202010012302.6,申请日期:2020年1月7日(已受理)


讲授课程

[1]. (本科生)系统软件基础 [教材:深入理解计算机系统第3版] (2021年--至今)

[2]. (本科生)SOPC设计与实践  (2014年--至今)

[3]. (研究生)高级计算机系统/基础软件与开源系统(2022年--至今)

[4]. (本科生)嵌入式操作系统与驱动程序设计 (2003年--2020年)

[5]. (本科生)网络工程 (2002年--2014年)

[6]. (本科生)网络与信息安全  (2002年--2014年)


获奖

2023年CCF计算机系统大会APPT优秀论文二等奖;

2019年永利官网本科毕业设计优秀指导教师;

2019年北京市优秀本科毕业论文指导教师;