Java中的TLAB(Thread Local Allocation Buffer)和Cache(緩存)是Java內(nèi)存管理中的兩個重要模塊,可以極大地提升Java程序的性能。下面我們來分別介紹一下這兩個模塊。
TLAB用于Java對象的分配。由于Java的GC機制,對象的創(chuàng)建和銷毀需要占用大量的CPU時間,在大量對象頻繁創(chuàng)建的情況下,程序性能會顯著下降。TLAB可以解決這個問題,它為每個線程分配一塊私有的堆內(nèi)存區(qū)域,線程在該區(qū)域內(nèi)自行分配內(nèi)存,不必和其他線程競爭。這樣就可以避免線程在全局內(nèi)存區(qū)域上的頻繁分配,從而提高程序的性能。
public class TLABTest { public static void main(String[] args) { for(int i = 0; i< 100000; i++) { byte[] bytes = new byte[1024 * 1024]; } } }
上面的代碼是一個簡單的TLAB測試程序。在該程序中,我們循環(huán)創(chuàng)建了100000個1M大小的字節(jié)數(shù)組。如果關(guān)閉TLAB,創(chuàng)建這么多數(shù)組將不可避免地引起大量的內(nèi)存競爭,程序性能將大打折扣。而開啟TLAB之后,程序可以顯著提高性能。
Cache則是用于提高Java程序的局部性的模塊。在Java程序中,數(shù)據(jù)在內(nèi)存中存儲是以緩存行(cache line)為單位的,緩存行的大小通常為64字節(jié)。當(dāng)程序訪問某個字節(jié)時,CPU將把它所在的緩存行都加載進來,這就是緩存行對齊(cache line alignment)。因為在緩存中連續(xù)訪問一組相鄰數(shù)據(jù)的速度比跳躍式地訪問多個不相鄰的數(shù)據(jù)要快得多,所以緩存行對齊能夠顯著提高程序性能。
public class CacheTest { static long[][] array = new long[1024*1024][8]; public static void main(String[] args) { long sum = 0L; long marked = System.currentTimeMillis(); for (int i = 0; i< 15_000; i++) { for (int j = 0; j< 1024*1024; j++) { sum += array[j][0]; } } System.out.println("time: " + (System.currentTimeMillis() - marked) + "ms"); } }
上面的代碼是一個簡單的Cache測試程序。在該程序中,我們創(chuàng)建了一個1024 * 1024大小的二維數(shù)組,每個數(shù)組元素包含8字節(jié)大小的數(shù)據(jù)。程序循環(huán)15,000次,每次遍歷整個數(shù)組。在每次遍歷時,它會連續(xù)地訪問每個數(shù)組元素第一個8字節(jié)大小的數(shù)據(jù)。如果沒有進行緩存行對齊,程序的性能將會極差。而進行了緩存行對齊之后,程序性能將得到顯著提升。