由于C++的項目做的少,又比較小,所以一直沒有注意字節(jié)對齊的問題,但是,字節(jié)對齊在大規(guī)模應用中對內存管理和CPU執(zhí)行效率的影響應是挺大的。本文根據一些資料學習,做一個小總結。
首先拋出第一個結論,字節(jié)對齊可以提高CPU的執(zhí)行效率。
根據(1)中分析,CPU執(zhí)行指令時從內存中獲取數據是按塊操作的,塊的大小可能為2-bytes, 4-bytes, 8-bytes, 16-bytes……
上圖所示4-bytes塊,此時,如果CPU讀取4-bytes或以上大小的數據的起始地址為1,則需要至少讀取2個數據塊,然后把2個塊中不需要的數據拋棄,再將有用數據拼接成4-bytes的數據,這明顯增加了CPU的操作,影響了CPU指令的執(zhí)行效率。如果CPU讀取數據的起始地址在0,4……,則一次只需要讀一個數據塊,CPU的讀取指令就是一次原子操作。
字節(jié)對齊就是對CPU讀取的每一個數據,都保證其起始地址在數據塊的始端,對數據字節(jié)數小于CPU數據塊(粒度)的值進行擴充,使得其占用完整的一個粒度的內存空間。字節(jié)對齊,節(jié)省了CPU進行數據截取和拼接的操作。
另一個結論,字節(jié)對齊有利于優(yōu)化內存。
在結構體中,根據字節(jié)自動對齊原則,結構體
typedef?struct?_test?{ char?a; int?b; char?c; }?test;
編譯器將采用結構體中字節(jié)數最大的基本類型int的字節(jié)數作為對齊標準,char類型將擴充為4-bytes,因此,sizeof(test)=12,但是這樣的內存利用效率比較低。
如果通過指定編譯器1字節(jié)對齊,則CPU的執(zhí)行效率就會降低。
#praama?pack(1) typedef?struct?_test?{ char?a; int?b; char?c; }?test; #pragma?pack()
為了保證CPU執(zhí)行效率的條件下優(yōu)化程序的內存,需要調整結構體中數據成員的順序
typedef?struct?_test?{ int?b; char?a; char?c; }?test;
此時,結構體成員b占用4個字節(jié),a和c分享后面的4個字節(jié),其中兩個成員占用前兩個字節(jié),后兩個字節(jié)為字節(jié)對齊時填充的無效數據,此結構體占用8個字節(jié)的內存空間。