pinpoint 告警配置

配置页面

1.点击配置按钮

图片1

2。添加user 到userGroup

图片2

图片5

注意:user Group Add的时候界面有个小bug,Add按钮disable,需要在搜索框搜索某个userGroup比如中间件,然后点击Add按钮,方可添加

3.添加告警配置

Pinpoint-web周期性的检查应用的状态,如果特定前置条件(规则)满足时则触发告警。

这些条件(默认)每3分钟被web模块中的后台批处理程序检查一次,使用最后5分钟的数据。一旦条件满足,批处理程序发送短信/邮件给注册到用户组的用户。

图片3

图片4

  • SLOW COUNT / 慢请求数当应用发出的慢请求数量超过配置阈值时触发。
  • SLOW RATE / 慢请求比例当应用发出的慢请求百分比超过配置阈值时触发。
  • ERROR COUNT / 请求失败数当应用发出的失败请求数量超过配置阈值时触发。
  • ERROR RATE / 请求失败率当应用发出的失败请求百分比超过配置阈值时触发。
  • TOTAL COUNT / 总数量当应用发出的所有请求数量超过配置阈值时触发。

    以上规则中,请求是当前应用发送出去的,当前应用是请求的发起者。 以下规则中,请求是发送给当前应用的,当前应用是请求的接收者。

  • SLOW COUNT TO CALLEE / 被调用的慢请求数量当发送给应用的慢请求数量超过配置阈值时触发。
  • SLOW RATE TO CALLEE / 被调用的慢请求比例当发送给应用的慢请求百分比超过配置阈值时触发。
  • ERROR COUNT TO CALLEE / 被调用的请求错误数当发送给应用的请求失败数量超过配置阈值时触发。
  • ERROR RATE TO CALLEE / 被调用的请求错误率当发送给应用的请求失败百分比超过配置阈值时触发。
  • TOTAL COUNT TO CALLEE / 被调用的总数量当发送给应用的所有请求数量超过配置阈值时触发。

    下面两条规则和请求无关,只涉及到应用的状态

  • HEAP USAGE RATE / 堆内存使用率当应用的堆内存使用率超过配置阈值时触发。
  • JVM CPU USAGE RATE / JVM CPU使用率当应用的CPU使用率超过配置阈值时触发。

关于收集爱学习工作台意见

目前爱学习内部工具越来越多,每次想访问的时候却找不到地址,或者有的根本就不知道,因此弄了一个爱学习工作站,上面会把爱学习所有有用的内部网站加进去,方便大家访问,目前还是孵化阶段,所以用静态方式供大家使用,如果大家有什么好的建议和想法,可以在这里留言给我,然后我们再根据大家的需求去做功能的调整。

“2018-03-01 机构表部分数据地区id置0”事故报告

事故现象

2018-03-01,367个机构的地址(institution表area_id_real字段)被置为0。

 

影响

1)双师班级无法上课;

2)续费账号时,无法获取账号价格;

3)培训业务报错;

4)其他用到机构地址的地方;

 

产生原因

1)在account-service中,有此前遗漏的quartz定时任务,会在1、2、3、7、9月份的1号00:01重新计算(顺延)机构续费日,此时会update机构表。

2)年前CRM销售管理重构1期上线,将对机构表的写操作统一到CRM服务Turing项目,使用新的机构model。在老项目中修改时,将老的机构model转为新的机构model,然后再调用接口修改,修改时,字段为null不会修改。而老的机构model,areaIdReal的类型为int,默认值为0,使用新接口修改时,把0当成有效值更新了。