更新時間:2023-01-10 14:10:10 來源:動力節(jié)點 瀏覽1156次
1. 什么是索引?
索引是一種數(shù)據(jù)結(jié)構(gòu),可以幫助我們快速的進行數(shù)據(jù)的查找.
2. 索引是個什么樣的數(shù)據(jù)結(jié)構(gòu)呢?
索引的數(shù)據(jù)結(jié)構(gòu)和具體存儲引擎的實現(xiàn)有關(guān), 在MySQL中使用較多的索引有Hash索引,B+樹索引等,而我們經(jīng)常使用的InnoDB存儲引擎的默認索引實現(xiàn)為:B+樹索引.
3. Hash索引和B+樹所有有什么區(qū)別或者說優(yōu)劣呢?
首先要知道Hash索引和B+樹索引的底層實現(xiàn)原理:
hash索引底層就是hash表,進行查找時,調(diào)用一次hash函數(shù)就可以獲取到相應(yīng)的鍵值,之后進行回表查詢獲得實際數(shù)據(jù).B+樹底層實現(xiàn)是多路平衡查找樹.對于每一次的查詢都是從根節(jié)點出發(fā),查找到葉子節(jié)點方可以獲得所查鍵值,然后根據(jù)查詢判斷是否需要回表查詢數(shù)據(jù).
那么可以看出他們有以下的不同:
hash索引進行等值查詢更快(一般情況下),但是卻無法進行范圍查詢.
因為在hash索引中經(jīng)過hash函數(shù)建立索引之后,索引的順序與原順序無法保持一致,不能支持范圍查詢.而B+樹的的所有節(jié)點皆遵循(左節(jié)點小于父節(jié)點,右節(jié)點大于父節(jié)點,多叉樹也類似),天然支持范圍.
hash索引不支持使用索引進行排序,原理同上.
hash索引不支持模糊查詢以及多列索引的最左前綴匹配.原理也是因為hash函數(shù)的不可預(yù)測.AAAA和AAAAB的索引沒有相關(guān)性.
hash索引任何時候都避免不了回表查詢數(shù)據(jù),而B+樹在符合某些條件(聚簇索引,覆蓋索引等)的時候可以只通過索引完成查詢.
hash索引雖然在等值查詢上較快,但是不穩(wěn)定.性能不可預(yù)測,當某個鍵值存在大量重復(fù)的時候,發(fā)生hash碰撞,此時效率可能極差.而B+樹的查詢效率比較穩(wěn)定,對于所有的查詢都是從根節(jié)點到葉子節(jié)點,且樹的高度較低.
因此,在大多數(shù)情況下,直接選擇B+樹索引可以獲得穩(wěn)定且較好的查詢速度.而不需要使用hash索引.
4. 上面提到了B+樹在滿足聚簇索引和覆蓋索引的時候不需要回表查詢數(shù)據(jù),什么是聚簇索引?
在B+樹的索引中,葉子節(jié)點可能存儲了當前的key值,也可能存儲了當前的key值以及整行的數(shù)據(jù),這就是聚簇索引和非聚簇索引. 在InnoDB中,只有主鍵索引是聚簇索引,如果沒有主鍵,則挑選一個唯一鍵建立聚簇索引.如果沒有唯一鍵,則隱式的生成一個鍵來建立聚簇索引.
當查詢使用聚簇索引時,在對應(yīng)的葉子節(jié)點,可以獲取到整行數(shù)據(jù),因此不用再次進行回表查詢.
5. 非聚簇索引一定會回表查詢嗎?
不一定,這涉及到查詢語句所要求的字段是否全部命中了索引,如果全部命中了索引,那么就不必再進行回表查詢.
舉個簡單的例子,假設(shè)我們在員工表的年齡上建立了索引,那么當進行select age from employee where age < 20的查詢時,在索引的葉子節(jié)點上,已經(jīng)包含了age信息,不會再次進行回表查詢.
6. 在建立索引的時候,都有哪些需要考慮的因素呢?
建立索引的時候一般要考慮到字段的使用頻率,經(jīng)常作為條件進行查詢的字段比較適合.如果需要建立聯(lián)合索引的話,還需要考慮聯(lián)合索引中的順序.此外也要考慮其他方面,比如防止過多的所有對表造成太大的壓力.這些都和實際的表結(jié)構(gòu)以及查詢方式有關(guān).
7. 聯(lián)合索引是什么?為什么需要注意聯(lián)合索引中的順序?
MySQL可以使用多個字段同時建立一個索引,叫做聯(lián)合索引.在聯(lián)合索引中,如果想要命中索引,需要按照建立索引時的字段順序挨個使用,否則無法命中索引.
具體原因為:
MySQL使用索引時需要索引有序,假設(shè)現(xiàn)在建立了"name,age,school"的聯(lián)合索引,那么索引的排序為: 先按照name排序,如果name相同,則按照age排序,如果age的值也相等,則按照school進行排序.
當進行查詢時,此時索引僅僅按照name嚴格有序,因此必須首先使用name字段進行等值查詢,之后對于匹配到的列而言,其按照age字段嚴格有序,此時可以使用age字段用做索引查找,,,以此類推.因此在建立聯(lián)合索引的時候應(yīng)該注意索引列的順序,一般情況下,將查詢需求頻繁或者字段選擇性高的列放在前面.此外可以根據(jù)特例的查詢或者表結(jié)構(gòu)進行單獨的調(diào)整.
8. 創(chuàng)建的索引有沒有被使用到?或者說怎么才可以知道這條語句運行很慢的原因?
MySQL提供了explain命令來查看語句的執(zhí)行計劃,MySQL在執(zhí)行某個語句之前,會將該語句過一遍查詢優(yōu)化器,之后會拿到對語句的分析,也就是執(zhí)行計劃,其中包含了許多信息. 可以通過其中和索引有關(guān)的信息來分析是否命中了索引,例如possilbe_key,key,key_len等字段,分別說明了此語句可能會使用的索引,實際使用的索引以及使用的索引長度.
以上就是“聊一聊這幾個sql基礎(chǔ)面試題及答案”,你能回答上來嗎?如果想要了解更多的Java面試題相關(guān)內(nèi)容,可以關(guān)注動力節(jié)點Java官網(wǎng)。