您现在的位置： Linux教程網 >> UnixLinux > >> Linux編程 >> Linux編程

數據結構--堆的實現(上)

1，堆是什麼？

堆的邏輯結構是一顆完全二叉樹，但物理結構是順序表(一維數組)。同時，此處的堆不要與JAVA內存分配中的堆內存混淆。這裡討論的是數據結構中的堆。

參考：計算機中的堆是什麼？ http://www.linuxidc.com/Linux/2016-05/131799.htm

2，數組實現堆的優勢及特點

由於堆從邏輯上看是一顆完全二叉樹，因此可以按照層序遍歷的順序將元素放入一維數組中。注意為了方便，數組的元素存放從索引 1 處開始（不是0）。采用數組來存放就很容易地找到某個結點 i 的雙親結點(i/2)，孩子結點(左孩子：2i，右孩子：2i+1)

3，基於數組的堆的實現需要哪些結構？

private T[] heap;//用來存儲堆元素的數組
private int lastIndex;//最後一個元素的索引

private static final int DEFAULT_INITIAL_CAPACITY = 25;

首先需要一個一維數組heap來保存堆中的元素；其次，需要lastIndex標記堆中最後一個元素的索引，這樣也知道了堆中存放了多少個元素；最後，需要一個final靜態變量定義默認構造堆的大小。

4，JAVA中基於一維數組的堆的實現具體代碼分析

①創建堆，假設有N個元素，需要將這N個元素構建大頂堆，有兩種方法來創建堆。一種是通過add()方法，另一種是通過reheap()方法。現在分別討論如下：

對於add方法：當要向堆中添加新元素時，調用該方法完成添加元素的操作。那麼對這N個元素逐一調用add方法，就可以將這N個元素構造成大頂堆，此時的時間復雜度為O(nlogn)。add方法的代碼如下：

public void add(T newEntry) {
lastIndex++;
if(lastIndex >= heap.length)
doubleArray();//若堆空間不足，則堆大小加倍
int newIndex = lastIndex;//從最後一個元素開始逐漸向上與父結點比較
int parentIndex = newIndex / 2;
heap[0] = newEntry;//哨兵
while(newEntry.compareTo(heap[parentIndex]) > 0){
heap[newIndex]= heap[parentIndex];
newIndex= parentIndex;
parentIndex= newIndex / 2;
}
heap[newIndex]= newEntry;
}

假設樹中有n個元素，則完全二叉樹高為logn，調用add方法的時間復雜度為O(logn)。向堆中插入新元素的具體操作如下：首先將元素數組的最後一個位置，然後從該位置起向上調整，直至到根結點為止。

如圖，當插入新的紅色結點時，首先將它放在堆的末尾，然後進行再次堆調整(紅色箭頭所指)。

對於使用reheap方法來創建堆：N個元素邏輯上組成一顆完全二叉樹，從它的最後一個非葉子結點開始，逐漸向前調整，直至調整到根結點。對於每個被調整的結點，將以該結點為根的子樹調整成一個(子)堆。假設有8個元素的數組，將將會從第4個元素起，開始進行堆調整(調用reheap方法)，直至調整到第 1 個元素為止。該方法建堆的時間復雜度為O(n)

reheap方法的代碼如下：

/*
* @Task:將樹根為rootIndex的半堆調整為新的堆，半堆：樹的左右子樹都是堆
* @param rootIndex 以rootIndex為根的子樹
*/
private void reheap(int rootIndex){
boolean done = false;//標記堆調整是否完成
T orphan = heap[rootIndex];
int largeChildIndex = 2 * rootIndex;//默認左孩子的值較大
//堆調整基於以largeChildIndex為根的子樹進行
while(!done && (largeChildIndex <= lastIndex)){
//largeChildIndex 標記rootIndex的左右孩子中較大的孩子
int leftChildIndex = largeChildIndex;//默認左孩子的值較大
int rightChildIndex = leftChildIndex + 1;
//右孩子也存在,比較左右孩子
if(rightChildIndex <= lastIndex && (heap[largeChildIndex].compareTo(heap[rightChildIndex] )< 0))
largeChildIndex= rightChildIndex;
// System.out.println(heap[largeChildIndex]);//這裡有問題。。使用構造函數創建時reheap。。。。。
if(orphan.compareTo(heap[largeChildIndex]) < 0){
heap[rootIndex]= heap[largeChildIndex];
rootIndex= largeChildIndex;
largeChildIndex= 2 * rootIndex ;//總是默認左孩子的值較大
}
else//以rootIndex為根的子樹已經構成堆了
done = true;
}
heap[rootIndex]= orphan;
}

第4個元素就是最後一個非葉子結點。（紅色箭頭表示需要進行堆調整的結點）

兩種建堆方法的比較：

add方法合適於動態建堆，也就是說，來一個元素，調用add方法一次，再來一個元素，再調用add方法……直至構造了一個N個元素的堆。而對於reheap方法，它是先給定了N個元素，這N個元素表示成一顆完全二叉樹的形式，然後從樹的最後一個非葉子結點開始，依次往前調整，進而構造堆。

add方法的調整與reheap方法的調整是不相同的。add方法的整個調整過程如下：該元素被添加到了數組最後一個位置lastIndex，然後，lastIndex與 (lastIndex / 2) 比較……即它總是與它的雙親結點比較。這一個元素調整完後，再來下一個元素，同樣先將它放到數組最後，再與它的雙親比較……調整的方向是自下而上的。

reheap方法的調整過程如下：如上圖，第4號結點與它的孩子（第8號結點）比較，進行調整，使之滿��堆的定義。再接著是第3號結點與它的兩個孩子比較，進行調整。再接著是第2號結點與它的孩子比較（第4，5號結點），若有必要還得與第8號結點比較，……調整的方向是自上而下的。（上面已經提到，即以從第4號結點開始，對該結點為根的子樹進行調整，將該子樹調整成一個堆）。

5，堆排序算法的實現

對於一個排序算法而言，首先得有一組可比較的數據拿來給你排序。故假設排序算法需要一個裝有待排序數據的一維數組 arr。這裡就有兩種方法來實現排序：

❶：根據待排序的數據(一維數組 arr)創建一個堆，由於這裡可以采用第二種建堆方法（reheap方法），故建堆的時間復雜度為O(n)；空間復雜度也為O(n)，因為創建的堆本質上是個一維數組，它就是由 n 個待排序數據組成的。

ArrayMaxHeap<Integer> heap = new ArrayMaxHeap<Integer>(arr);

然後，從 heap 中刪除元素時，將刪除的元素按順序放回到數組arr中，直至將heap中的元素刪除完畢後全部放回到數組arr中後，數組arr就變成了有序的了。（堆的性質保證了每次從堆中刪除元素時總是刪除堆中最大的元素（即最大堆的堆頂元素））。由於每次從堆中刪除元素的時間復雜度為O(logn) ，故整個堆排序的時間復雜度為O(nlogn)、空間復雜度為O(n)。

❷：第二種堆排序的實現方法如下：

還是根據給定的一維數組arr 通過反復調用reheap方法來創建堆。但是，是在arr上創建堆，而不是新開辟一個數組來創建堆。這樣，使得整個排序過程的空間復雜度為O(1)

由於是直接在數組arr 上創建堆，故堆創建的索引是從0開始，而不是從1開始了。

在arr數組上建堆後，arr數組中元素的順序就是符合堆定義的順序了（完全二叉樹中父結點的值比孩子結點的值要大）且第一個元素為最大元素；因為第一個元素為堆頂元素。因此，可以把數組arr 中的第一個元素與最後一個元素交換，這樣 arr 的前 n-1 個元素就構成了一個半堆（樹根的左右子樹都是堆稱為半堆），這樣就可以進行reheap操作將前n-1個元素重新調整成堆。

下圖就是一個半堆，根結點20的左右子樹都是堆，但整個完全二叉樹不是堆。

接著，又將第一個元素與倒數第二個元素交換，剩下的前n-2個元素構成了一個半堆，又進行reheap操作將之調整為堆……反復執行上述步驟即可將arr排序。

由於該方法是直接在arr上建堆並排序的。故空間復雜度為O(1)，而每次執行reheap方法的時間復雜度為O(logn)，共有n個元素，需要執行n次reheap，故整個堆排序的時間復雜度為O(nlogn)，空間復雜度為O(1)。

關於時間復雜度的分析有個小問題：第一次reheap方法需要調整的半堆有n-1個元素，第二次reheap方法調整的半堆有n-2個元素……，也就是說，每次reheap所需要執行的調整次數是越來越少的。但總的時間復雜度還是O(nlogn)了。

整個堆實現的完整代碼下載：堆的實現（可運行）--JAVA代碼下載

到Linux公社資源站下載：

------------------------------------------分割線------------------------------------------

免費下載地址在 http://linux.linuxidc.com/

用戶名與密碼都是www.linuxidc.com

具體下載目錄在 /2016年資料/5月/27日/數據結構--堆的實現(上)/

下載方法見 http://www.linuxidc.com/Linux/2013-07/87684.htm

------------------------------------------分割線------------------------------------------

上一篇文章：數據結構--堆的實現(下)
下一篇文章：數據結構--堆的實現之深入分析

Linux編程

Linux下實現數據復制

Redis數據結構

二叉樹數據結構的實現

數據結構--堆的實現(下)

數據結構--堆的實現之深入分析

堆數據結構的實現以及堆排序

C++類模板實現數據結構——棧

C++實現數據結構的二叉樹及其遍歷二叉樹

相關文章

Linux內核數據結構

MySQL數據目錄結構

第五章 Python數據結構

Linux VFS數據結構

Hyperledger中數據存取的實現

使用鏈式結構實現堆棧

C++數據結構之二叉樹

U-Boot中global_data數據結構

V4L2 soc-camera 數據結構

Linux內核之數據結構

Linux C 數據結構——棧

Linux C 數據結構—

Linux編程

SHELL編程

PERL編程