任锐* **,王阳*,关洪涛*,谢高岗** ***.基于Graphormer的时空间多源数据微服务故障定位算法[J].高技术通讯(中文),2025,35(6):604~612 |
基于Graphormer的时空间多源数据微服务故障定位算法 |
A Graphormer-based spatial-temporal and multi-source data algorithm for microservices’ fault localization |
|
DOI:10. 3772 / j. issn. 1002-0470. 2025. 06. 004 |
中文关键词: 云计算; 微服务; 时空预测; Graphormer; 服务质量 |
英文关键词: cloud computing, microservice, spatial-temporal prediction, Graphormer, quality of service(QoS) |
基金项目: |
作者 | 单位 | 任锐* ** | (*中国科学院计算技术研究所北京 100190)
(**中国科学院大学北京 100190)
(***中国科学院计算机网络信息中心北京 100190) | 王阳* | (*中国科学院计算技术研究所北京 100190)
(**中国科学院大学北京 100190)
(***中国科学院计算机网络信息中心北京 100190) | 关洪涛* | (*中国科学院计算技术研究所北京 100190)
(**中国科学院大学北京 100190)
(***中国科学院计算机网络信息中心北京 100190) | 谢高岗** *** | (*中国科学院计算技术研究所北京 100190)
(**中国科学院大学北京 100190)
(***中国科学院计算机网络信息中心北京 100190) |
|
摘要点击次数: 24 |
全文下载次数: 27 |
中文摘要: |
微服务场景下的故障定位对提高数据中心和云计算的效率、保障用户服务质量起着至关重要的作用。但现有的故障定位方法只针对单一类型数据进行分析,难以找到合适的方法对多类型数据进行兼顾。并且基于图数据的算法往往只分析具有直接或间接调用的服务之间的关系,这使得非依赖关系的微服务之间的物理资源竞争问题无法得到很好的解决。为此,本文充分考虑多类型数据分析和资源竞争问题,提出了一种基于Graphormer的多类型时空间数据联合故障诊断的方法GTA(Graphormer-based temporal analysis)。与现有算法相比,本文成功地利用Graphormer对微服务的所有可观测数据进行分析,包括日志、指标和调用链。通过基于调用链依赖信息构建空间矩阵,以及基于微服务的性能指标和日志信息构建时间特征向量,能够同时从空间和时间维度捕捉关键信息。本文通过真实的大型银行系统的微服务系统数据和2个开源仿真平台下的实验结果证明了GTA的高精度性、高效性,GTA在这些数据集上的预测误差相比其他方法至少降低了15%。 |
英文摘要: |
Fault localization in microservices scenarios plays a crucial role in improving the efficiency of data centers and cloud computing, as well as safeguarding user service quality. However, existing fault localization methods only analyze a single type of data, making it challenging to find suitable methods that consider multiple types of data. Moreover, algorithms based on graph data often analyze relationships between services with direct or indirect invocation, neglecting the issue of physical resource competition between microservices that are not dependent on each other. To address this issue, we propose a Graphormer-based temporal analysis (GTA) for joint fault diagnosis using multi-type spatial and temporal data. Compared with existing algorithms, we successfully utilize Graphormer to analyze all observable data from microservices, including logs, metrics, and traces. By constructing spatial matrices based on invocation chain dependency information and building temporal feature vectors from microservices’ performance metrics and log information, we simultaneously capture critical information from spatial and temporal dimensions. Experimental results on a real bank’s microservices system and two open-source platforms show GTA’s superiority, with a predictive error reduction of at least 15% compared to the latest methods. |
查看全文
查看/发表评论 下载PDF阅读器 |
关闭 |
|
|
|