우분투 20.04 Xeon(R) Gold 6146 core id 문의

   조회 3667   추천 0    

 처음으로 Intel XEON 을 사용하게 되었습니다.

Intel(R) Xeon(R) Gold 6146 CPU @ 3.20GHz  12-core 짜리

두개 사용합니다.


$sensors 수행하면 아래 처럼 cpu id 가 좀 이상하게 나오는 데 왜 그런 걸 까요?

$watch sensors 나 

$sensors 수행하면 core id 에 이빨이 빠지거나 중복되는 것이 보입니다.

coretemp-isa-0000 => Core  0,3,4,8,9,10,11,16,17,18,24,26   (12개)

coretemp-isa-0001=>  Core 0,1,2,3,4,8,10,11,18,24,25,27      (12개)

중복 Core 0,3,8,10,11,18,24

누락 Core 5,6,7,12,13,14,15


coretemp-isa-0000

Adapter: ISA adapter

Package id 0:  +46.0°C  (high = +88.0°C, crit = +98.0°C)

Core 0:        +46.0°C  (high = +88.0°C, crit = +98.0°C)

Core 3:        +43.0°C  (high = +88.0°C, crit = +98.0°C)

Core 4:        +43.0°C  (high = +88.0°C, crit = +98.0°C)

Core 8:        +44.0°C  (high = +88.0°C, crit = +98.0°C)

Core 9:        +42.0°C  (high = +88.0°C, crit = +98.0°C)

Core 10:       +42.0°C  (high = +88.0°C, crit = +98.0°C)

Core 11:       +45.0°C  (high = +88.0°C, crit = +98.0°C)

Core 16:       +44.0°C  (high = +88.0°C, crit = +98.0°C)

Core 17:       +43.0°C  (high = +88.0°C, crit = +98.0°C)

Core 18:       +43.0°C  (high = +88.0°C, crit = +98.0°C)

Core 24:       +44.0°C  (high = +88.0°C, crit = +98.0°C)

Core 26:       +44.0°C  (high = +88.0°C, crit = +98.0°C)


pch_lewisburg-virtual-0

Adapter: Virtual device

temp1:        +41.0°C


nvme-pci-0200

Adapter: PCI adapter

Composite:    +30.9°C  (low  = -20.1°C, high = +77.8°C)

                       (crit = +81.8°C)

Sensor 1:     +30.9°C  (low  = -273.1°C, high = +65261.8°C)


coretemp-isa-0001

Adapter: ISA adapter

Package id 1:  +47.0°C  (high = +88.0°C, crit = +98.0°C)

Core 0:        +46.0°C  (high = +88.0°C, crit = +98.0°C)

Core 1:        +45.0°C  (high = +88.0°C, crit = +98.0°C)

Core 2:        +45.0°C  (high = +88.0°C, crit = +98.0°C)

Core 3:        +45.0°C  (high = +88.0°C, crit = +98.0°C)

Core 4:        +46.0°C  (high = +88.0°C, crit = +98.0°C)

Core 8:        +45.0°C  (high = +88.0°C, crit = +98.0°C)

Core 10:       +45.0°C  (high = +88.0°C, crit = +98.0°C)

Core 11:       +45.0°C  (high = +88.0°C, crit = +98.0°C)

Core 18:       +45.0°C  (high = +88.0°C, crit = +98.0°C)

Core 24:       +45.0°C  (high = +88.0°C, crit = +98.0°C)

Core 25:       +45.0°C  (high = +88.0°C, crit = +98.0°C)

Core 27:       +46.0°C  (high = +88.0°C, crit = +98.0°C)


짧은글 일수록 신중하게.
바람곰돌 2022-10
갯수는 12개가 맞는데...넘버링이 왜 이렇게 나오나요??? 응??? 이상하네요...제건 저렇지 않았던 것 같은데...
응무소주 2022-10
/proc/cpuinfo 를 보면 아래와 같습니다,.

$ cat /proc/cpuinfo | grep core | grep id
core id : 0
core id : 3
core id : 4
core id : 8
core id : 9
core id : 10
core id : 11
core id : 16
core id : 17
core id : 18
core id : 24
core id : 26
core id : 0
core id : 1
core id : 2
core id : 3
core id : 4
core id : 8
core id : 10
core id : 11
core id : 18
core id : 24
core id : 25
core id : 27
core id : 0
core id : 3
core id : 4
core id : 8
core id : 9
core id : 10
core id : 11
core id : 16
core id : 17
core id : 18
core id : 24
core id : 26
core id : 0
core id : 1
core id : 2
core id : 3
core id : 4
core id : 8
core id : 10
core id : 11
core id : 18
core id : 24
core id : 25
core id : 27
응무소주 2022-10
NUMA node0 CPU(s):              0-11,24-35
NUMA node1 CPU(s):              12-23,36-47

아래 내용 중 상기 정보의 규칙이 궁급합니다.

~$ lscpu
Architecture:                    x86_64
CPU op-mode(s):                  32-bit, 64-bit
Byte Order:                      Little Endian
Address sizes:                  46 bits physical, 48 bits virtual
CPU(s):                          48
On-line CPU(s) list:            0-47
Thread(s) per core:              2
Core(s) per socket:              12
Socket(s):                      2
NUMA node(s):                    2
Vendor ID:                      GenuineIntel
CPU family:                      6
Model:                          85
Model name:                      Intel(R) Xeon(R) Gold 6146 CPU @ 3.20GHz
Stepping:                        4
CPU MHz:                        3200.000
CPU max MHz:                    4200.0000
CPU min MHz:                    1200.0000
BogoMIPS:                        6400.00
Virtualization:                  VT-x
L1d cache:                      768 KiB
L1i cache:                      768 KiB
L2 cache:                        24 MiB
L3 cache:                        49.5 MiB
NUMA node0 CPU(s):              0-11,24-35
NUMA node1 CPU(s):              12-23,36-47
Vulnerability Itlb multihit:    KVM: Mitigation: VMX disabled
Vulnerability L1tf:              Mitigation; PTE Inversion; VMX conditional cache flushes, SMT vulnerable
Vulnerability Mds:              Mitigation; Clear CPU buffers; SMT vulnerable
Vulnerability Meltdown:          Mitigation; PTI
Vulnerability Mmio stale data:  Mitigation; Clear CPU buffers; SMT vulnerable
Vulnerability Spec store bypass: Mitigation; Speculative Store Bypass disabled via prctl and seccomp
Vulnerability Spectre v1:        Mitigation; usercopy/swapgs barriers and __user pointer sanitization
Vulnerability Spectre v2:        Mitigation; Retpolines, IBPB conditional, IBRS_FW, STIBP conditional, RSB filling
Vulnerability Srbds:            Not affected
Vulnerability Tsx async abort:  Mitigation; Clear CPU buffers; SMT vulnerable
Flags:                          fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov pat pse36 clflush dts acpi mmx fxsr ss
                                e sse2 ss ht tm pbe syscall nx pdpe1gb rdtscp lm constant_tsc art arch_perfmon pebs bts rep_good nop
                                l xtopology nonstop_tsc cpuid aperfmperf pni pclmulqdq dtes64 monitor ds_cpl vmx smx est tm2 ssse3 s
                                dbg fma cx16 xtpr pdcm pcid dca sse4_1 sse4_2 x2apic movbe popcnt tsc_deadline_timer aes xsave avx f
                                16c rdrand lahf_lm abm 3dnowprefetch cpuid_fault epb cat_l3 cdp_l3 invpcid_single pti intel_ppin ssb
                                d mba ibrs ibpb stibp tpr_shadow vnmi flexpriority ept vpid ept_ad fsgsbase tsc_adjust bmi1 hle avx2
                                  smep bmi2 erms invpcid rtm cqm mpx rdt_a avx512f avx512dq rdseed adx smap clflushopt clwb intel_pt
                                avx512cd avx512bw avx512vl xsaveopt xsavec xgetbv1 xsaves cqm_llc cqm_occup_llc cqm_mbm_total cqm_mb
                                m_local dtherm ida arat pln pts hwp hwp_act_window hwp_epp hwp_pkg_req pku ospke md_clear flush_l1d
                                arch_capabilities
박문형 2022-10
사용하시는 보드 모델명이 무엇인지요??

바이오스는 최신인가요??
     
응무소주 2022-10
레노버 P920 이고 아래처럼 나오네요.
$ sudo dmidecode -s baseboard-manufacturer
LENOVO
$ sudo dmidecode -s baseboard-product-name
1038

바이오스도  올 7월 버젼입니다.
# dmidecode 3.2
Getting SMBIOS data from sysfs.
SMBIOS 3.2.1 present.
# SMBIOS implementations newer than version 3.2.0 are not
# fully supported by this version of dmidecode.
Table at 0x6B99D000.

Handle 0x0000, DMI type 0, 26 bytes
BIOS Information
        Vendor: LENOVO
        Version: S05KT62A
        Release Date: 07/27/2022
        Address: 0xF0000
        Runtime Size: 64 kB
        ROM Size: 16 MB
        Characteristics:
                PCI is supported
                BIOS is upgradeable
                BIOS shadowing is allowed
                Boot from CD is supported
                Selectable boot is supported
                BIOS ROM is socketed
                EDD is supported
                5.25"/1.2 MB floppy services are supported (int 13h)
                3.5"/720 kB floppy services are supported (int 13h)
                3.5"/2.88 MB floppy services are supported (int 13h)
                Print screen service is supported (int 5h)
                8042 keyboard services are supported (int 9h)
                Serial services are supported (int 14h)
                Printer services are supported (int 17h)
                ACPI is supported
                USB legacy is supported
                BIOS boot specification is supported
                Targeted content distribution is supported
                UEFI is supported
        BIOS Revision: 1.62
        Firmware Revision: 18.29
vergence 2022-10
스택오버플로우의 여러 글들이 그냥 그런 거라고 하네요. 오류 아니라고.

* https://stackoverflow.com/questions/54784091/linux-core-ids-are-missing-in-cpu-info
* https://unix.stackexchange.com/questions/400605/understanding-core-ids

누군가는 이런 설명을 해놨네요.
* CPU가 코어를 더 많이 갖고 있지만 펌웨어가 비활성화 한 경우
* 핫스왑을 지원하는 시스템이고, 더 많은 코어의 CPU로 교체될 때를 위해 비워둠

* https://serverfault.com/questions/866573/cpu-core-id-values-not-contiguous
     
응무소주 2022-10
2cpu 에서는 많은정보를 얻는 것 같습니다.
고수분들도 많으신 것 같고요.
vergence 님 좋은자료 감사합니다.
레인보우7 2022-10
혹시 하이퍼쓰레딩 끄시고, 물리적인 개수로 올렸을때 정상적인지 온도랑 CORE ID가 제대로 정렬되는지 체크해보십시오.
Super I/O 센서칩이 물리적인것만? 처리하는건지.. 알수가 없네요.
lm-sensors가 다양하게 hw를 다 지원하는게 아니다보니, 대부분 보드 제조사 전용모니터링툴을 쓰는 경우가 많습니다.
lm-sensor는 그러려니 해야 합니다.
Super I/O Sensor칩 모델이 뭔지 확인해서 해당 센서칩 드라이버가 따로 있는지도 체크해보셔야 합니다.
하이퍼쓰레딩에서 그냥 코어 개수만 맞으면 크게 문제 없을듯 합니다.

CPU Core ID 매핑 정보도 한번 확인해보세요
# cat /sys/devices/system/cpu/cpu*/topology/thread_siblings_list | sort -n | uniq
     
응무소주 2022-10
예 해보겠습니다. 감사힙니다.
아래 정보는 규칙적이네요.
$sudo cat /sys/devices/system/cpu/cpu*/topology/thread_siblings_list | sort -n | uniq
0,24
1,25
2,26
3,27
4,28
5,29
6,30
7,31
8,32
9,33
10,34
11,35
12,36
13,37
14,38
15,39
16,40
17,41
18,42
19,43
20,44
21,45
22,46
23,47
엠브리오 2022-10
CMOS 셋업 에서 CPU 코어가 전부 Enable 로 되어 있는지 확인하세요.
     
응무소주 2022-10
모두 enable 되어 있습니다.


QnA
제목Page 1165/5708
2014-05   5139141   정은준1
2015-12   1673629   백메가
2020-08   3443   LINKINPARK
2022-12   3443   무법자
2015-07   3443   테돌아이
2019-09   3443   PCMaster
2017-08   3443   전산실짬찌
2015-03   3444   곽순현
2015-07   3444   윈도우10
2021-03   3444   원상현
2020-07   3444   pibang
2016-02   3444   아르코
2015-07   3444   왕용필
2023-01   3444   딥마인드
2019-11   3444   나나나나나
2018-09   3444   늘파란
2023-11   3444   makeyz
2019-05   3444   전설속의미…
2020-03   3444   green1052
2015-03   3444   AKA지니
2023-07   3445   땅쟁이
2020-08   3445   디지유