端的に言うと性能が良いからです。これを理解するにはバッファプールへの理解が必要です。ディスク指向のデータベースの上では有限のメモリを最大限活用することでメモリに入り切らない巨大なデータ群に対して良好な参照性能を出す必要があります。バッファプールとはディスク上のデータの羅列を固定サイズのページ（InnoDBの場合16KB）の羅列であるとして読み書きに必要な分だけをメモリに移し取り複数の書き込みをできる限りメモリ内で受け止めて後でまとめてディスクに書き戻すという、ライトバック型のキャッシュのような機構です。<img src="https://firebasestorage.googleapis.com/v0/b/pjt-knowledge.appspot.com/o/content-attachments%2F8a0ff736-fdc1-43e1-8246-66842c27593a.png?alt=media">この中においてバッファプールは有限のサイズしか無いので適宜プール内のデータを書き戻して入れ替えながら上手くやっていく必要があります。さてB+treeとB-treeの最大の違いは木のリーフ以外の部分（ブランチノードやインターナルノードと呼びます）にキーに対するバリューを保存するかどうかです。そしてノード1つはバッファプールで管理される1ページを保持しています。ページサイズが同じならB-treeはブランチノードの中にキーに加えて値の実体も保存する必要があるのでブランチノード1つが保持できる子ポインタの数は自ずと少なくなります。対するB+treeはキーに対応する値を持たず子ノードのポインタだけを持てばいいのでブランチノードが保持できる子ポインタの数はB-treeより多くなります。下図参照↓<img src="https://firebasestorage.googleapis.com/v0/b/pjt-knowledge.appspot.com/o/content-attachments%2F43bddad7-a6f7-4718-9c81-707af0cb85a4.png?alt=media">これによってB-treeは探索が木の途中で終わる可能性もある一方で木全体は個々のノードの小ポインタが少ないせいで高くなりがちでB+treeは木が低く抑えられます。データベースとしては検索対象のデータが常に全部バッファプールのメモリ内に収まらないという前提があるのでページのいくらかはディスクに置いたままにして、メモリの速度を最大限活かす必要があります。さて下にB-treeとB+treeを模式しました。B+treeの方が子を多く持てるので3〜4の子ノードを持ちます。B-treeは子ノードを持てる数が少ないので2ページを子として持ちます。赤のページがメモリに載っているページで同時に5枚までしかメモリに載らないとします、黄色のページがディスクにしか無いページでその読み出しには多大なコスト(HDDの場合10ミリ秒、3GhzのCPUにとって3000万クロック！)がかかります。B+treeはブランチノードがおよそずっとメモリに載り続ける仮定ができます。B-treeはルート含めどのページにも目当ての値が保存されている可能性があります。<img src="https://firebasestorage.googleapis.com/v0/b/pjt-knowledge.appspot.com/o/content-attachments%2F84eac04a-98d4-450d-8de4-27111e0a8ba6.png?alt=media">B+treeはどの値を読むときも常に確定で1回のディスクシークが必要ですが、メモリに乗り切らないデータを扱う以上は避けられないコストであります。B-treeは運が良ければメモリだけで値を返せる可能性もありますが最悪の場合はディスクシークが3回になります。しかも目的のページを運良くキャッシュできている可能性はディスクとメモリのサイズ比が広がる程に悪化していってしまいます。そのページに目当ての物があった場合のディスクシーク回数の回数を書き足すと以下のようになります。<img src="https://firebasestorage.googleapis.com/v0/b/pjt-knowledge.appspot.com/o/content-attachments%2Faebb2287-eb4d-4e6d-9e6c-7a740c63c90f.png?alt=media">B-treeは全部で15枚あるページに対して期待値1.53回(=23/15)のディスクシークでアクセスできます。B+treeは常に1回です。B+treeの方が少ないディスクシークと言えます。ハードディスクがとにかく遅い時代の設計なのでそれと比べるとツリーを辿ることのCPUコストは無視して論じる事が出来ます。とここまでが古典的データベースの話ですが、最近は結構事情が違います。近年では<ul><li>MySQLにアクセスするデータは99%以上バッファプール上のデータに当たるまでシャーディングなどでチューニングする事が良くある</li><li>メモリの価格が劇的に安くなったのでメモリに乗り切らないデータは扱わないと初めから割り切ったインメモリDBも台頭<ul><li>何なら世の中のDBの9割は5GB未満しか保存していないなんて与太話もある</li></ul></li><li>ディスクシークはNVMeでめちゃくちゃ速くなったのでデータベースアクセスの支配項が移った</li><li>構造上ブランチとリーフに多重で同一のキーが保存されるB+treeはキーが長い文字列や複合キーなどによって複雑に長くなった場合に無駄が多い</li></ul>など、MySQLが設計された頃とはハードウェアや使い方の様子が大きく様変わりしているので今後またB+tree以外のデータ構造にも脚光が集まるシーンが来るのではないかと期待しています。

自分はデータベースやこういうことは専門的ではないので、詳しい人によるより詳細な解説してくれることを期待したいところです。さて、まずB-treeとB+treeなんですが、どちらもほとんど同じ構造とアルゴリズムで、ごくわずかな違いしかありません。B+treeとB-treeの違いは次の2点であるとされます。<ul><li>B-treeは中間ノード（リーフでないノード）も値を持ちますが、B+treeは中間ノードはキーのみで、値はリーフからしか見えません</li><li>リーフノードは隣のリーフノードへのリンクを持っていて、リーフだけで連結リストのような構造になっています</li></ul>B+treeは中間ノードで値をもたないため、探索時にはかならずリーフまでたどる必要があります。直感的に効率はむしろ悪い可能性もありそうです。これについては次のような解説がよくなされます。中間ノードからデータへのポインタを省くことによって、同じ大きさの記憶領域により多くの子ノードへのリンクを配置できるようになります。ノードごとのリンク数が増えると木の高さも減り検索効率が向上します。またデータベースの場合にはインデックスがメモリではなくディスクなどの記憶領域にあったりするので、このことは探索時のIO操作数の減少にもつながり、結果的にはより効率よくインデックス上を探索できることにつながります。値データがリーフにしかないこと、リーフが連結リストになっていることですが、これによってインデックスの要素を順番にスキャンしたい場合の操作が単純かつ効率的に行えます。中間ノードに値データを持つ場合、リーフのデータをスキャンし終えたらいったん親ノードに戻って、1個データを読んだら次の子ノードに戻って、みたいな操作になります。先程のようにインデックスがディスク等にある場合にはIO操作が発生する可能性もあり、効率は劣化します。SQLでデータを処理する場合、ある値からべつな値までといった範囲指定は非常によくあり、インデックスの(部分的な)スキャンはめずらしいことではないので、スキャン操作が効率的に扱えることはデータベースでは重要であろうと思います。こういうことからデータベースという条件においては総じてB+treeのほうが効率が良いという考えかたが一般的であると思います。ただし、IO操作を伴わないインメモリなデータベースであれば、また別の議論が成立する余地があるかもしれません(もっともキャッシュヒット効率などで同様の議論が可能な可能性はあります)。B-treeは今日ではそれほど利用されることはないかなと思っていますが、たとえばRustではstd::collections::BTreeMap / BTreeSet などとして利用できます。

MySQLのインデックスですが、B-treeではなくB+treeを使用するのはどうしてなのでしょうか？

MySQLのインデックスですが、B-treeではなくB+treeを使用するのはどうしてなのでしょうか？