http://2cpu.co.kr/QnA/773692 의 원인을 찾다가 Telegraf 로그에서 SNMP로 수집에 문제가 있음을 알았습니다.
2020-08-31T05:36:00Z W! [inputs.snmp] Collection took longer than expected; not complete after interval of 2m0s
2020-08-31T05:38:00Z W! [inputs.snmp] Collection took longer than expected; not complete after interval of 2m0s
2020-08-31T05:40:09Z E! [inputs.snmp] Error in plugin: agent 192.168.0.250:161: performing get on field power-state: Request timeout (after 1 retries)
그리고 influxDB에서 확인해본 결과 모든 데이터가 4분40초 단위로 기록되어 있었습니다.
여기서 의문점이 드는게 snmpwalk 로 log-dates를 수집해본 결과 데이터가 바로 출력이 되었습니다.
단순히 처리속도때문인지, iDRAC의 SNMP 서비스 설정이 그렇게 된건지 전혀 모르겠습니다.
iDRAC SNMP 서비스 고급 설정은 찾아봐도 안나오더라구요 ㅠㅠ
고수님들의 의견 부탁드립니다...
+ telegraf.conf 에서 설정한 inputs.snmp
[[processors.regex]]
[[processors.regex.fields]]
key = "log-dates"
pattern = "^(?P\\d{4})(?P\\d{2})(?P
\\d{2})(?P\\d{2})(?P\\d{2})(?P\\d{2})\\.(?P\\d{6})(?P[-+]\\d{3,4})$"replacement = "${YYYY}-${MM}-${DD} ${HH}:${mm}:${ss}"
[[inputs.snmp]]
agents = [ "192.168.0.250:161" ]
version = 1
community = "public"
name = "idrac-hosts"
interval = "120s"
timeout = "2s"
retries = 1
[[inputs.snmp.table]]
name = "idrac-hosts"
inherit_tags = [ "system-name" , "disks-name" ]
[[inputs.snmp.table.field]]
name = "log-dates"
oid = ".1.3.6.1.4.1.674.10892.5.4.300.40.1.8"
[[inputs.snmp.table.field]]
name = "log-entry"
oid = ".1.3.6.1.4.1.674.10892.5.4.300.40.1.5"
[[inputs.snmp.table.field]]
name = "log-severity"
oid = ".1.3.6.1.4.1.674.10892.5.4.300.40.1.7"
[[inputs.snmp.table.field]]
name = "log-number"
oid = ".1.3.6.1.4.1.674.10892.5.4.300.40.1.2"
is_tag = true
[[inputs.snmp.table.field]]
name = "nic-name"
oid = ".1.3.6.1.4.1.674.10892.5.4.1100.90.1.30"
is_tag = true