阳王东

发布时间:2024-10-09 责任编辑:admin 

 

 

 

 

 

阳王东,博士,二级教授,博士生导师,教育部长江学者。主要研究领域为高性能计算、并行数值算法和程序性能优化,长期在天河系列国产超算平台以及飞腾、鲲鹏、海光、腾、景嘉微GPU等国产处理器上进行并行算法的设计和应用,主持研制了一系列的基础数值算法函数库、性能优化工具和数值模拟仿真系统。获国家科技进步二等奖,湖南省自然科学一等奖、二等奖、科技进步三等奖、中国产学研合作创新成果一等奖、中国计算学会科技成果特等奖、国家教学成果二等奖、湖南省教学成果二等奖各1项,获华为火花奖2项。主持国家自然科学基金重点项目、面上项目,国家重点研发计划课题和核心软件攻关项目等国家项目11项,湖南省重点研发计划和揭榜挂帅等省部级项目、华为、曙光等企业委托科研项目20余项。发表SCI/EI收录论文50多篇,其中SCDACICDETCTPDSCCF推荐的A类会议和期刊13篇,授权发明专利15项,软件著作权6项。 

一、主要研究领域

1、基础数学库的研究

1建立了大规模稀疏矩阵非零元素分布的概率模型,提供了一个针对稀疏矩阵运算的局部性定量描述方法,克服了稀疏矩阵向量乘(SpMV)并行算法可扩展性低的实质困难。研制的SpMV算法在GPU上并行效率优于TOP 500 排名发起者、美国工程院院士JackDongarra 团队发表在Parallel Computing 的算法和NVIDIA 公司的CUDA 函数库cuSparse。并且完成了在申威26010和飞腾处理器上的适配和优化。

2研制了基于国产处理器平台的基础代数运算函数库BLAS和矩阵扩展运算库(LAPACK),可实现对国外开源或商业软件库的替代,性能整体达到部分超越国外开源或商业软件库。基于飞腾、鲲鹏、申威26010等国产处理器研制了基础数学函数库BLASLAPACK。在鲲鹏920处理器上的性能强于开源库OpenBLASAtlasBLASSuiteSparse,与目前最好的商业库Intel公司的MKL库齐平。

3研制了面向国产高性能计算系统的的张量运算库。在国产新一代高性能计算机部署了研制的并行张量运算库,性能较开源的张量库splatt有显著的性能提升,已经在国产新一代高性能计算机系统上完成张量库的大规模测试。

4基于国产超级计算系统研制了大规模线性方程组的异构并行求解算法。提供大规模线性方程组的异构并行求解算法,能够支撑百万核的国产自主高性能计算平台上的数值模拟仿真的并行计算。

2、异构并行计算框架和并行程序优化

1基于鲲鹏、FTMT等国产处理器研制了并行计算框架。该计算框架能够充分适配鲲鹏、FTMT处理器的体系结构,在飞腾和鲲鹏处理器上的并行任务调度性能显著好于目前使用最广泛的OpenMP,同时相对于Intel公司的商业并行框架TBB也具有一定的性能优势。已经将研制的并行计算框架移植到国产E级新一代高性能计算机上,实现了大规模分布式异构计算资源的高效调度与负载平衡。

2面向NUMA结构的内存优化技术。针对具有NUMA结构的计算机系统,研制了能线程亲和及数据亲和的自适应机制,减少数据在NUMA节点之间的移动和远端数据访问,性能较C语言提供的标准内存分配函数有明显的性能提升。

3编译辅助的循环结构的并行优化。通过前端编译技术实现源代码中循环语句结构的自动识别,并且在IR中实现对循环结构转换为标准矩阵计算格式,然后针对不同处理器结构和指令系统进行并行代码转换和优化,以实现从源代码到不同处理器和指令系统的自动并行优化。

3、智慧城市数值模拟计算与应用系统

研制的共性算法库应用到城市大规模、高分辨率的数值模拟计算和交通视频、流量统计分析以及城市多源信息融合处理上,大幅提高系统的处理性能,并提高了交通违法行为自动识别率和路口流量预测精准性,达到国内领先水平。基于共性算法库和物联网+云计算技术开发了一系列智慧城市应用软件系统,应用于长沙、常德、益阳、南宁等多个城市,产生了显著的社会和经济效益。

 

二、主持的主要项目

1、横向项目

1华为公司委托项目《线性方程组迭代方法与预条件的自动选择》,2023.1-2023.12,主持。

2岳麓山大科城核心技术攻关揭榜挂帅项目《面向国产自主GPU的高性能基础软件栈》,2022.8-2024,7,主持。

3曙光公司委托项目,ghfund202107013482CPU+GPU异构计算平台上张量运算库的移植和优化,2021.8-2022.7,主持。

4华为海思委托项目,YBN2019115120LAPACK性能优化项目,2019.12-2020.12,主持。

52018-2019,华为2012实验室委托项目,大规模城市混合交通视频处理,主持。

62017-2018,华为2012实验室委托项目,基于华为AI处理器的多通道&高通量视频AI处理,主持。

72013-2014,益阳市税务局委托项目,税务征管一体化数据分析平台,主持。

2、纵向项目

1国家自然科学基金委员会,重点项目,U21A20461,离子注入碳化硅半导体掺杂过程的高精度模拟仿真并行计算方法研究,2022.12025.12,主持。

2科技部,国家重点研发计划课题,2019YFB2103004,城市群环保一体化物联网在线平台,2020.1-2022.12,主持。

3中国工程物理研究院,国防基础科研核科学挑战专题,TZZT2019-B2.1,模式驱动的自主CPU-加速器数值内核浮点优化方法,2019.112020.12,主持

4国家自然科学基金委员会,面上项目,61872127,面向高维数据空间的张量异构并行计算方法研究与探索,2019.12022.12,主持。

5科技部,重点研发计划项目子课题,2018YFB1003401,面向大数据集的数据流编程模型及示范应用,2018.52020.4,主持。

6国家自然科学基金委员会,面上项目,61572175,高阶广义k-对角线性系统的异构协同并行求解算法研究与探索,2016.12019.12,主持。

72015-2017,湖南省重点研发计划项目,城市汽车尾气扩散高分辨率数值模拟技术及对雾霾的影响度分析,主持。

82018-2020,湖南省自然科学基金项目,大规模稀疏张量运算的异构并行算法研究与探索,主持。

92013-2015,湖南省高校科研重点项目,城市交通流量预测的并行计算技术研究,主持。

三、主要研究成果

1、主要论文列表:

(1) 2023A Heterogeneous Parallel Computing Approach Optimizing SpTTM on CPU-GPU via GCNACM Trans. Parallel Comput.

(2) 2023A Novel Parallel Algorithm for Sparse Tensor Matrix Chain Multiplication via TCU-accelerationIEEE Transactions on Parallel and Distributed Systems. (中国计算机学会推荐的A期刊

(3) 2022,基于GASpy的材料模拟计算框架,湖南大学学报(自然科学版).

(4) 2022A Parallel Partial Enhancement Method for License Plate Localization on Low-quality ImagesJournal of Circuits, Systems, and ComputersSCI.

(5) 2022Distributed Set Label-Constrained ReachabilityQueries over Billion-Scale GraphsIEEE International Conference on Data Engineering.(中国计算机学会推荐的A类会议)

(6) 2022, An Efficient Parallel Reinforcement Learning Approach to Cross-Layer Defense Mechanism in Industrial Control Systems, IEEE Transactions on Parallel and Distributed Systems, ISSN: 1045-9219)(中国计算机学会推荐的A类期刊)。

(7) 2021STM-Multifrontal QR: Streaming Task Mapping Multifrontal QR Factorization Empowered by GCNInternational Conference for High Performance Computing, Networking, Storage, and Analysis,(中国计算机学会推荐的A类会议)

(8) 2021Performance analysis and optimization for SpMV based on aligned storage formats on an ARM processorJournal of Parallel and Distributed Computing(中国计算机学会推荐的B类期刊)

(9) 2021Distributed matrix factorization based on fast optimization for implicit feedback recommendationJOURNAL OF INTELLIGENT INFORMATION SYSTEMS(中国计算机学会推荐的C类期刊)

(10) 2021A Left-looking Sparse Cholesky Parallel Algorithm for Shared Memory Multiprocessors, The 2021 17th International Conference on Natural Computation, Fuzzy Systems and Knowledge Discovery (ICNC-FSKD 2021).

(11) 2021Parallel Sparse LU Factorization with Machine-learning Method on Multi-core ProcessorsICSAI 2021.

(12) 2021Performance Optimization for Parallel SpMV on a NUMA Architecture, the 2021 17th International Conference on Natural Computation, Fuzzy Systems and Knowledge Discovery (ICNC-FSKD 2021).

(13) 2021,基于GPU加速的并行WMD算法,计算机科学.

(14) 2020Performance Analysis and Optimization for MTTKRP of Sparse Tensor on CPU and GPUIEEE HPCC 2020(中国计算机学会推荐的C类会议).

(15) 2020Optimizing partitioned CSR-based SpGEMM on the Sunway TaihuLightNEURAL COMPUTING & APPLICATIONS(中国计算机学会推荐的C类期刊).

 

2、发明专利:

1)基于局部敏感哈希的并行矩阵分解计算实现方法,专利号:ZL201910428131.2

2)多物理耦合应用处理方法、装置、计算机设备以及存储介质,专利号:ZL201910526239.5

3)一种基于Flink的矩阵分解隐式反馈推荐方法和系统,专利号:ZL201910426635.0

4)基于博弈论的闲置云资源调度方法和装置,专利号:201910461609.1.

5)分布式计算平台下基于QoS约束的视频流处理方法和系统,专利号:ZL202011303293.2

3、软件著作权:

1)基于CORBA的交通信息集成中间件(2011SR009269);

2)基于GIS的城市交通业务综合管理客户端软件(2011SR050323);

3)基于Web的城市交通信息实时发布软件(2011SR050328);

4)城市道路交通流量监测和分析软件(2015SR144249);

5)面向大数据集的数据流编程工具(2021SR0498048)。

4、获奖:

12023,华为火花奖,面向ARM64平台应用源码矩阵化检测及优化工具;

22022,华为火花奖,线性方程组迭代方法与预条件的自动选择;

32022,中国计算机学会科技成果特等奖,《面向多AI并发的高效异步并行处理技术及其超声影像实时智能判读应用》,排名第三;

42022,湖南省教学成果二等奖,《面向自主计算生态的多学科复合型人才培养体系构建和实践》,排名第二;

52021,湖南省自然科学二等奖,《异构并行与分布式系统的任务调度理论和并行算法设计方法》,排名第一;

62020,湖南省自然科学一等奖,《面向人工智能的异构并行算法设计理论与方法》,排名第四;

72019, 产学研合作创新成果一等奖,《面向人工智能的大数据并行处理平台与应用》,排名第二;

82017,湖南省科技进步三等奖,《城市智慧交通智能信息处理和数据融合关键技术》,排名第一。

 

 

 

 

上一条:张虎 下一条:张志宏
管理员信箱:gloriouslife_zn@live.vom

地址:湖南省长沙市开福区长沙学院 版权所有 © 长沙学院_计算机科学与工程学院