閱讀屋>資料庫作業系統> 資料庫索引的使用方法

資料庫索引的使用方法

　　走向精通MySQL的道路非常的艱難，還好各種關係型資料庫大同小異，足夠讓我從增刪改查上升到高效能資料庫的架構和調優。這期間的各種概念就不絮叨了，我也很難表述的很清楚，昨天寫了個小指令碼往我本機MySQL資料庫的某張表裡面注入了200萬條資料(Windows7旗艦版/1.66GHz/2G記憶體/MySQL5.1.50)，資料表的結構如下圖所示，屬於一個比較基本的定長表，考慮到我可憐的本本的承受能力，id使用從1開始的自增，title欄位為隨機20個標題中的一個，content都是相同的內容，time使用時間戳而非datetime型別，即10位整型資料。

　　就是這麼一個結構極其簡單的表，200萬數量級的複雜查詢將會變的非常緩慢，比如執行下面的SQL語句。

　　SELECT a.id,FROM_UNIXTIME(a.time)

　　FROM article AS a

　　WHERE a.title=‘PHP筆試題和答案——基礎語言方面’

　　查詢時間基本上需要50-100秒，這個是非常恐怖的，如果加上聯合查詢和其他一些約束條件，資料庫會瘋狂的消耗記憶體。

　　如果這時候資料庫裡面針對title欄位建立了索引，查詢效率將會大幅度提升，如下圖所示。可見對於大型資料庫，建立索引是非常非常重要的一個最佳化手段(當然還會有很多其他最佳化這樣的資料庫的方法，但是本文主題所限，暫不討論。)，廢話了這麼多，以下開始總結MySQL中索引的使用方法和效能最佳化以及一些注意事項。

　　索引的概念

　　索引是一種特殊的檔案(InnoDB資料表上的索引是表空間的一個組成部分)，它們包含著對資料表裡所有記錄的引用指標。更通俗的說，資料庫索引好比是一本書前面的目錄，能加快資料庫的查詢速度。上述SQL語句，在沒有索引的情況下，資料庫會遍歷全部200條資料後選擇符合條件的;而有了相應的索引之後，資料庫會直接在索引中查詢符合條件的選項。如果我們把SQL語句換成“SELECT * FROM article WHERE id=2000000”，那麼你是希望資料庫按照順序讀取完200萬行資料以後給你結果還是直接在索引中定位呢?上面的兩個圖片鮮明的用時對比已經給出了答案(注：一般資料庫預設都會為主鍵生成索引)。

　　索引分為聚簇索引和非聚簇索引兩種，聚簇索引是按照資料存放的物理位置為順序的，而非聚簇索引就不一樣了;聚簇索引能提高多行檢索的速度，而非聚簇索引對於單行的檢索很快。

　　索引的型別

　　1. 普通索引

　　這是最基本的索引，它沒有任何限制，比如上文中為title欄位建立的索引就是一個普通索引。

　　–直接建立索引

　　CREATE INDEX indexName ON table(column(length))

　　–修改表結構的方式新增索引

　　ALTER tableADD INDEX indexName ON (column(length))

　　–建立表的時候同時建立索引

　　CREATE TABLE `table` (

　　`id` int(11) NOT NULL AUTO_INCREMENT ,

　　`title` 255) CHARACTER SET utf8 COLLATE utf8_general_ci NOT NULL ,

　　`content` text CHARACTER SET utf8 COLLATE utf8_general_ci NULL ,

　　`time` int(10) NULL DEFAULT NULL ,

　　PRIMARY KEY (`id`),

　　INDEX indexName (title(length))

　　)

　　–刪除索引

　　DROP INDEX indexName ON table

　　2. 唯一索引

　　與普通索引類似，不同的就是：索引列的值必須唯一，但允許有空值(注意和主鍵不同)。如果是組合索引，則列值的組合必須唯一，建立方法和普通索引類似。

　　–建立唯一索引

　　CREATE UNIQUE INDEX indexName ON table(column(length))

　　–修改表結構

　　ALTER table ADD UNIQUE indexName ON (column(length))

　　–建立表的時候直接指定

　　CREATE TABLE `table` (

　　`id` int(11) NOT NULL AUTO_INCREMENT ,

　　`title` 255) CHARACTER SET utf8 COLLATE utf8_general_ci NOT NULL ,

　　`content` text CHARACTER SET utf8 COLLATE utf8_general_ci NULL ,

　　`time` int(10) NULL DEFAULT NULL ,

　　PRIMARY KEY (`id`),

　　UNIQUE indexName (title(length))

　　);

　　3. 全文索引(FULLTEXT)

　　MySQL從3.23.23版開始支援全文索引和全文檢索，FULLTEXT索引僅可用於 MyISAM 表;他們可以從CHAR、VARCHAR或TEXT列中作為CREATE TABLE語句的一部分被建立，或是隨後使用ALTER TABLE 或CREATE INDEX被新增。////對於較大的資料集，將你的資料輸入一個沒有FULLTEXT索引的表中，然後建立索引，其速度比把資料輸入現有FULLTEXT索引的速度更為快。不過切記對於大容量的資料表，生成全文索引是一個非常消耗時間非常消耗硬碟空間的做法。

　　–建立表的適合新增全文索引

　　CREATE TABLE `table` (

　　`id` int(11) NOT NULL AUTO_INCREMENT ,

　　`title` 255) CHARACTER SET utf8 COLLATE utf8_general_ci NOT NULL ,

　　`content` text CHARACTER SET utf8 COLLATE utf8_general_ci NULL ,

　　`time` int(10) NULL DEFAULT NULL ,

　　PRIMARY KEY (`id`),

　　FULLTEXT (content)

　　);

　　–修改表結構新增全文索引

　　ALTER TABLE article ADD FULLTEXT index_content(content)

　　–直接建立索引

　　CREATE FULLTEXT INDEX index_content ON article(content)

　　4. 單列索引、多列索引

　　多個單列索引與單個多列索引的查詢效果不同，因為執行查詢時，MySQL只能使用一個索引，會從多個索引中選擇一個限制最為嚴格的索引。

　　5. 組合索引(最左字首)

　　平時用的SQL查詢語句一般都有比較多的限制條件，所以為了進一步榨取MySQL的效率，就要考慮建立組合索引。例如上表中針對title和time建立一個組合索引：ALTER TABLE article ADD INDEX index_titme_time (title(50),time(10))。建立這樣的組合索引，其實是相當於分別建立了下面兩組組合索引：

　　–title,time

　　–title

　　為什麼沒有time這樣的組合索引呢?這是因為MySQL組合索引“最左字首”的結果。簡單的理解就是隻從最左面的開始組合。並不是只要包含這兩列的查詢都會用到該組合索引，如下面的幾個SQL所示：

　　–使用到上面的索引

　　SELECT * FROM article WHREE title=“PHP程式設計師” AND time=1234567890

　　SELECT * FROM article WHREE utitle=“PHP程式設計師”

　　–不使用上面的索引

　　SELECT * FROM article WHREE time=1234567890

　　MySQL索引的最佳化

　　上面都在說使用索引的好處，但過多的使用索引將會造成濫用。因此索引也會有它的缺點：雖然索引大大提高了查詢速度，同時卻會降低更新表的速度，如對錶進行INSERT、UPDATE和DELETE。因為更新表時，MySQL不僅要儲存資料，還要儲存一下索引檔案。建立索引會佔用磁碟空間的索引檔案。一般情況這個問題不太嚴重，但如果你在一個大表上建立了多種組合索引，索引檔案的會膨脹很快。索引只是提高效率的一個因素，如果你的MySQL有大資料量的表，就需要花時間研究建立最優秀的索引，或最佳化查詢語句。下面是一些總結以及收藏的MySQL索引的注意事項和最佳化方法。

　　1. 何時使用聚集索引或非聚集索引?

　　動作描述使用聚集索引使用非聚集索引列經常被分組排序使用使用返回某範圍內的資料使用不使用一個或極少不同值不使用不使用小數目的不同值使用不使用大數目的不同值不使用使用頻繁更新的列不使用使用外來鍵列使用使用主鍵列使用使用頻繁修改索引列不使用使用

　　事實上，我們可以透過前面聚集索引和非聚集索引的.定義的例子來理解上表。如：返回某範圍內的資料一項。比如您的某個表有一個時間列，恰好您把聚合索引建立在了該列，這時您查詢2004年1月1日至2004年10月1日之間的全部資料時，這個速度就將是很快的，因為您的這本字典正文是按日期進行排序的，聚類索引只需要找到要檢索的所有資料中的開頭和結尾資料即可;而不像非聚集索引，必須先查到目錄中查到每一項資料對應的頁碼，然後再根據頁碼查到具體內容。其實這個具體用法我還不是很理解，只能等待後期的專案開發中慢慢學學了。

　　2. 索引不會包含有NULL值的列

　　只要列中包含有NULL值都將不會被包含在索引中，複合索引中只要有一列含有NULL值，那麼這一列對於此複合索引就是無效的。所以我們在資料庫設計時不要讓欄位的預設值為NULL。

　　3. 使用短索引

　　對串列進行索引，如果可能應該指定一個字首長度。例如，如果有一個CHAR(255)的列，如果在前10個或20個字元內，多數值是惟一的，那麼就不要對整個列進行索引。短索引不僅可以提高查詢速度而且可以節省磁碟空間和I/O操作。

　　4. 索引列排序

　　MySQL查詢只使用一個索引，因此如果where子句中已經使用了索引的話，那麼order by中的列是不會使用索引的。因此資料庫預設排序可以符合要求的情況下不要使用排序操作;儘量不要包含多個列的排序，如果需要最好給這些列建立複合索引。

　　5. like語句操作

　　一般情況下不鼓勵使用like操作，如果非使用不可，如何使用也是一個問題。like “%aaa%” 不會使用索引而like “aaa%”可以使用索引。

　　6. 不要在列上進行運算

　　例如：select * from users where YEAR(adddate)<2007，將在每個行上進行運算，這將導致索引失效而進行全表掃描，因此我們可以改成：select * from users where adddate<’2007-01-01′。關於這一點可以圍觀：一個單引號引發的MYSQL效能損失。

　　最後總結一下，MySQL只對一下運算子才使用索引：<,<=,=,>,>=,between,in,以及某些時候的like(不以萬用字元%或_開頭的情形)。而理論上每張表裡面最多可建立16個索引，不過除非是資料量真的很多，否則過多的使用索引也不是那麼好玩的，比如我剛才針對text型別的欄位建立索引的時候，系統差點就卡死了。

　　最後的最後PS：現在更新個技術文章真難，還得做大量實驗…

【資料庫索引的使用方法】相關文章：