首页 > 其他 > 详细

NUMA体系结构介绍

时间:2015-09-13 13:06:39      阅读:258      评论:0      收藏:0      [点我收藏+]

 1. NUMA的几个概念(Node,socket,core,thread)

   对于socket,core和thread会有不少文章介绍,这里简单说一下,具体参见下图:

技术分享

    一句话总结:socket就是主板上的CPU插槽; Core就是socket里独立的一组程序执行的硬件单元,比如寄存器,计算单元等; Thread:就是超线程hyperthread的概念,逻辑的执行单元,独立的执行上下文,但是共享core内的寄存器和计算单元。

   NUMA体系结构中多了Node的概念,这个概念其实是用来解决core的分组的问题,具体参见下图来理解(图中的OS CPU可以理解thread,那么core就没有在图中画出),从图中可以看出每个Socket里有两个node,共有4个socket,每个socket 2个node,每个node中有8个thread,总共4(Socket)× 2(Node)× 8 (4core × 2 Thread) = 64个thread。

   另外每个node有自己的内部CPU,总线和内存,同时还可以访问其他node内的内存,NUMA的最大的优势就是可以方便的增加CPU的数量,因为Node内有自己内部总线,所以增加CPU数量可以通过增加Node的数目来实现,如果单纯的增加CPU的数量,会对总线造成很大的压力,所以UMA结构不可能支持很多的核。

                                  《此图出自:NUMA Best Practices for Dell PowerEdge 12th Generation Servers》

技术分享

    根据上面提到的,由于每个node内部有自己的CPU总线和内存,所以如果一个虚拟机的vCPU跨不同的Node的话,就会导致一个node中的CPU去访问另外一个node中的内存的情况,这就导致内存访问延迟的增加。在有些特殊场景下,比如NFV环境中,对性能有比较高的要求,就非常需要同一个虚拟机的vCPU尽量被分配到同一个Node中的pCPU上,所以在OpenStack的Kilo版本中增加了基于NUMA感知的虚拟机调度的特性。(OpenStack Kilo中NFV相关的功能具体参见:《OpenStack Kilo新特性解读和分析(1)》)

 

2. 如何查看机器的NUMA拓扑结构

   比较常用的命令就是lscpu,具体输出如下: 

  1. dylan@hp3000:~$ lscpu   
  1. Architecture:          x86_64  
  2. CPU op-mode(s):        32-bit, 64-bit  
  3. Byte Order:            Little Endian  
  4. CPU(s):                48                                       //共有48个逻辑CPU(threads)  
  5. On-line CPU(s) list:   0-47  
  6. Thread(s) per core:    2                               //每个core有2个threads  
  7. Core(s) per socket:    6                                //每个socket有6个cores  
  8. Socket(s):             4                                      //共有4个sockets  
  9. NUMA node(s):          4                               //共有4个NUMA nodes  
  10. Vendor ID:             GenuineIntel  
  11. CPU family:            6  
  12. Model:                 45  
  13. Stepping:              7  
  14. CPU MHz:               1200.000  
  15. BogoMIPS:              4790.83  
  16. Virtualization:        VT-x  
  17. L1d cache:             32K                           //L1 data cache 32k  
  18. L1i cache:             32K                            //L1 instruction cache 32k  (牛x机器表现,冯诺依曼+哈弗体系结构)  
  19. L2 cache:              256K  
  20. L3 cache:              15360K  
  21. NUMA node0 CPU(s):     0-5,24-29        
  22. NUMA node1 CPU(s):     6-11,30-35  
  23. NUMA node2 CPU(s):     12-17,36-41  
  24. NUMA node3 CPU(s):     18-23,42-47 
    1.  

从上图输出,可以看出当前机器有4个sockets,每个sockets包含1个numa node,每个numa node中有6个cores,每个cores包含2个thread,所以总的threads数量=4(sockets)×1(node)×6(cores)×2(threads)=48.

 

另外,也可以通过下面的脚本来打印出当前机器的socket,core和thread的数量。

  1 #!/bin/bash
  2 
  3 # Simple print cpu topology
  4 # Author: wjoyxt
  5 
  6 function get_nr_processor()
  7 {
  8     grep ^processor /proc/cpuinfo | wc -l
  9 }
 10 
 11 function get_nr_socket()
 12 {
 13     grep physical id /proc/cpuinfo | awk -F: {
 14             print $2 | "sort -un"} | wc -l
 15 }
 16 
 17 function get_nr_siblings()
 18 {
 19     grep siblings /proc/cpuinfo | awk -F: {
 20             print $2 | "sort -un"} 21 }
 22 
 23 function get_nr_cores_of_socket()
 24 {
 25     grep cpu cores /proc/cpuinfo | awk -F: {
 26             print $2 | "sort -un"} 27 }
 28 
 29 echo ===== CPU Topology Table =====
 30 echo
 31 
 32 echo +--------------+---------+-----------+
 33 echo | Processor ID | Core ID | Socket ID |
 34 echo +--------------+---------+-----------+
 35 
 36 while read line; do
 37     if [ -z "$line" ]; then
 38         printf | %-12s | %-7s | %-9s |\n $p_id $c_id $s_id
 39         echo +--------------+---------+-----------+
 40         continue
 41     fi
 42 
 43     if echo "$line" | grep -q "^processor"; then
 44         p_id=`echo "$line" | awk -F: {print $2} | tr -d  ` 
 45     fi
 46 
 47     if echo "$line" | grep -q "^core id"; then
 48         c_id=`echo "$line" | awk -F: {print $2} | tr -d  ` 
 49     fi
 50 
 51     if echo "$line" | grep -q "^physical id"; then
 52         s_id=`echo "$line" | awk -F: {print $2} | tr -d  ` 
 53     fi
 54 done < /proc/cpuinfo
 55 
 56 echo
 57 
 58 awk -F: { 
 59     if ($1 ~ /processor/) {
 60         gsub(/ /,"",$2);
 61         p_id=$2;
 62     } else if ($1 ~ /physical id/){
 63         gsub(/ /,"",$2);
 64         s_id=$2;
 65         arr[s_id]=arr[s_id] " " p_id
 66     }
 67 } 
 68 
 69 END{
 70     for (i in arr) 
 71         printf "Socket %s:%s\n", i, arr[i];
 72 } /proc/cpuinfo
 73 
 74 echo
 75 echo ===== CPU Info Summary =====
 76 echo
 77 
 78 nr_processor=`get_nr_processor`
 79 echo "Logical processors: $nr_processor"
 80 
 81 nr_socket=`get_nr_socket`
 82 echo "Physical socket: $nr_socket"
 83 
 84 nr_siblings=`get_nr_siblings`
 85 echo "Siblings in one socket: $nr_siblings"
 86 
 87 nr_cores=`get_nr_cores_of_socket`
 88 echo "Cores in one socket: $nr_cores"
 89 
 90 let nr_cores*=nr_socket
 91 echo "Cores in total: $nr_cores"
 92 
 93 if [ "$nr_cores" = "$nr_processor" ]; then
 94     echo "Hyper-Threading: off"
 95 else
 96     echo "Hyper-Threading: on"
 97 fi
 98 
 99 echo
100 echo ===== END =====

 

 

NUMA体系结构介绍

原文:http://www.cnblogs.com/wjoyxt/p/4804529.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!