技术-技术方案优化策略--监控

    xiaoxiao2021-03-25  187

    设计流程: 确定指标采集数据计算数据,存储结果展现和分析 监控什么? 接口性能相关,包括单个接口和全部的QPS、响应时间、调用量(统计时间维度越细越好;最好是,既能以节点为维度,也可以以服务集群为维度,来查看相关数据)。其中还涉及到服务依赖关系的管理,这个时候需要用到服务依赖管理系统;单个机器节点相关,包括CPU使用率、Load值、内存占用率、网卡流量等。如果节点是一些特殊类型的服务(比如MySQL、Redis、Tair),还可以监控这些服务特有的一些关键指标; 数据采集方式: 通常采用异步上报的方式,具体做法有两种:第一种,发到本地的Flume端口,由Flume进程收集到远程的Hadoop集群或者Storm集群来进行运算;第二种,直接在本地运算好以后,使用异步和本地队列的方式,发送到监控服务器。 数据计算: 采用离线运算(MapReduce/Hive)或者实时/准实时运算(Storm/Spark)的方式,运算后的结果存入MySQL或者HBase;某些情况,也可以不计算,直接采集发往监控服务器。 展现和分析: 提供统一的展现分析平台,需要带报表(列表/图表)监控和报警的功能。
    转载请注明原文地址: https://ju.6miu.com/read-892.html

    最新回复(0)