PostgreSQL之INDEX 索引詳解

之前總結瞭PostgreSQL的序列相關知識,今天總結下索引。

我們都知道,數據庫索引最主要的作用是可以提高檢索數據的速度,但是索引也不是越多越好。因為索引會增加數據庫的存儲空間,查詢數據是要花較多的時間。

1、創建索引

SQL語句如下:

CREATE INDEX idx_commodity
 ON commodity  //表名
 USING btree   //用B樹實現
 (commodity_id); //作用的具體列

2、刪除索引

DROP index idx_commodity;

3、增加索引的優勢:

創建索引可以大大提高系統的性能。

第一,最主要的原因是可以大大加快數據的檢索速度;

第二,通過創建唯一性索引,可以保證數據庫表中每一行數據的唯一性;

第三,可以加速表和表之間的連接,特別是在實現數據的參考完整性方面特別有意義;

第四,在使用分組和排序子句進行數據檢索時,同樣可以顯著減少查詢中分組和排序的時間;

第五,通過使用索引,可以在查詢的過程中,使用優化隱藏器,提高系統的性能。

4、增加索引的劣勢:

第一,創建索引和維護索引要花費時間,且隨著數據量的增加時間也會增加;

第二,索引會占物理空間,除瞭數據表占數據空間之外,每一個索引還要占一定的物理空間;’

第三,當對表中的數據進行增加、刪除和修改的時候,索引也要動態的維護,這樣就降低瞭數據的維護速度。

5、索引的選擇

一般來說,應該在這些列上創建索引:

第一、 在經常需要搜索的列上,可以加快搜索的速度;

第二、 在作為主鍵的列上,強制該列的唯一性和組織表中數據的排列結構;

第三、 在經常用在連接的列上,這些列主要是一些外鍵,可以加快連接的速度;

第四、 在經常需要根據范圍進行搜索的列上創建索引,因為索引已經排序,其指定的范圍是連續的;

第五、 在經常需要排序的列上創建索引,因為索引已經排序,這樣查詢可以利用索引的排序,加快排序查詢時間;

第六、 在WHERE子句的列上面創建索引,加快條件的判斷速度。

一般來說,不應該創建索引的的這些列具有下列特點:

第一,對於那些在查詢中很少使用或者參考的列不應該創建索引。這是因為,既然這些列很少使用到,因此有索引或者無索引,並不能提高查詢速度。相反,由於增加瞭索引,反而降低瞭系統的維護速度和增大瞭空間需求。

第二,對於那些隻有很少數據值的列也不應該增加索引。這是因為,由於這些列的取值很少,在查詢的結果中,結果集的數據行占瞭表中數據行的很大比例,即需要在表中搜索的數據行的比例很大。增加索引,並不能明顯加快檢索速度。

第三,對於那些定義為text, image和bit數據類型的列不應該增加索引。這是因為,這些列的數據量要麼相當大,要麼取值很少。

第四,當修改性能遠遠大於檢索性能時,不應該創建索引。這是因為,修改性能和檢索性能是互相矛盾的。當增加索引時,會提高檢索性能,但是會降低修改性能。當減少索引時,會提高修改性能,降低檢索性能。因此,當修改性能遠遠大於檢索性能時,不應該創建索引。

補充:PostgreSQL索引分類及使用

1.索引方式

PostgreSQL數據庫支持單列index,多列復合 index, 部分index, 唯一index, 表達式index,隱含 index, 和並發index。

2.索引方法

PostgreSQL 支持 B-tree, hash, GiST, and GIN index methods。

3.索引使用范圍

1).B-tree

B-tree可以有效使用當一個查詢包含等號(=)和范圍操作符 (<, <=, >, >=, BETWEEN, and IN)。

2).hash

一個等號操作符(=),不適合范圍操作符。

3).GiST

適用於自定義復雜類型,包括rtree_gist, btree_gist, intarray,tsearch, ltree 和 cube。

4).GIN

GIN比GiST占用多三倍多空間,適合復雜like,例如like ‘%ABC12%’。

4.索引使用註意事項

1).當一個表有很多行時,對一個表列進行索引是很重要的。

2).當檢索數據時,應該選擇一個好的備選列作為索引,外鍵,或者取最大最小值的鍵,列的選擇性對索引有效性很重要。

3).為瞭更好的性能要移除不使用的索引,為瞭清除無法利用的行每隔一月重建所有索引。

4).如果有非常大量的數據,使用表分區索引。

5)當列中包含NULL值時,可以考慮建立一個不包含NULL的條件索引。

以上為個人經驗,希望能給大傢一個參考,也希望大傢多多支持WalkonNet。如有錯誤或未考慮完全的地方,望不吝賜教。

推薦閱讀: