ひとりで勝手にはじめた蟻本読書会 座標圧縮 領域の個数 蟻本読書会 の続きです。

セグメント木とは?

セグメント木は、固定長配列にいくつかの操作を加えたデータ構造です。セグメント木は、基本的には以下の操作を時間計算量 O(logN) ですることができます。

i 番目の要素に x を代入
i 番目の要素を取得
l 番目の要素から r 番目の要素の最大値、最小値、総和などを計算する

配列のある区間の総和を高速で計算するアルゴリズムに累積和があります。累積和は事前に A[0] から A[i] までの総和である S[0], S[1], … S[N] を計算することで 区間 [a, b] の総和を S[b] – S[a – 1] で計算しようというものです。区間の総和を計算する大量のクエリに高速に対応することができます。

しかし累積和は途中で配列の要素が更新されるとS[0], S[1], … S[N] を再度計算しなおさないといけないので、配列の要素が更新されるクエリがある場合、高速に対応することができません。

セグメント木は「区間に対する処理を、高速に行うデータ構造」です。累積和だとできないような更新と計算の両方が必要なクエリにも対応できます。

データの更新

管理対象となるデータ件数の2倍のサイズの配列で、効率的にデータを管理します。またセグ木は完全二分木です。そのため管理対象のデータ数が 8 だとすると、配列のサイズは その 2 倍である 16 となりますが、9 個だと 32 になります。

扱いたいデータの個数を N としたとき、N ≦ 2^n を満たす 2^n を考えます。この 2^n を 2 倍した数が配列のサイズとなるのです(N = 9 なら 9 ≦ 2^4 = 16 なのでその 2倍の 32 が配列のサイズ)。

管理対象のデータ数が 8 だとすると、配列のサイズは 16 となりますが、管理の対象となるデータは 配列の index 7 に格納します。それよりも前の部分に各区間の値(最大値や総和など)を格納するのです。

この例では 8 個のデータの最大値を管理します。8 個のデータは index 7 ~ 14 に格納されます。 index 0 には全体の最大値、index 1 には index 7 ~ 10 の最大値、index 2 には index 11 ~ 14 の最大値、index 3 には index 7 ~ 8 の最大値、index 4 には index 9 ~ 10 の最大値 … というように格納していきます。データは 0 以上であり、最大値を考えているので最初は 0 が格納されています(最大値であれば int.MaxValue とか臨機応変に)。

データが更新されたらその上に格納されている各区間の最大値も更新します。

親の index は (子の index – 1) / 2 で切り捨て除算することで求められます。また(親の index * 2 + 1) で左の子の index が、(親の index * 2 + 2) で右の子の index を求めることができます。

そしてセグメント木であれば10万件のデータであったとしても17回で最下層の index から頂点の index 0 にたどり着くことができます。

任意の区間の最大値は?

任意の区間の最大値を知るにはどうすればよいでしょうか? 半開区間 [a,b) の最大値を計算する方法を考えます。

まず上の区間から順番に考えます。一番上の区間とはデータ全体です。任意の区間なので a == 0 かつ b == N でないなら再帰的に以下の操作をおこないます。

考えようとしている区間が、[a,b) に全く含まれないなら、操作に影響しない値(0 とか int.MaxValue など)を返す。

考えようとしている区間が [a,b) に完全に含まれているなら、その値を返す。

どちらでもない場合、2 つの子ノードに対して再帰的に操作をおこなう。

こうすることで区間の最大値を計算量 O(logN) で求めることができるのです。

遅延評価を伴わないセグメントツリー

以下は配列の要素の更新と区間の総和を計算するクエリーに対応する問題です。

B – Fenwick Tree

B – Fenwick Tree

長さ N の数列 a[0], a[1], …, a[N-1] に Q 個のクエリが飛んできます。処理してください。

0 p x ⇒ a[p] の値を p 増加させる
1 l r ⇒ a[l] から a[r-1] までの総和を出力する

入力されるデータ
N Q
a[0] a[1] … a[N-1]
Query 0
Query 1
Query Q-1

(ただし、1 ≦ N, Q ≦ 500,000
0 ≦ a[i], x ≦ 10^9 )

タイトルからわかるようにフェニック木をコーディングする問題ですが、セグメント木でも対応できます。

まずセグメント木をクラスで実装します。

定義したSegTreeクラスで解を求めます。

遅延評価セグメントツリー

遅延評価とは、値の伝播を遅らせるテクニックです。値の更新が特定の要素だけでなく、区間に対しておこなわれるとき、区間の長さだけ更新処理が必要になりそうですが、この処理にかかる計算量を減らそうというものです。

ここでは遅延評価用の配列を別に用意します。そして遅延評価用の配列では自ノードの区間に一様におこなわれた更新された値を持つことにします。

遅延評価用の配列に値が入っている要素は、どこかのタイミングで遅延配列の情報を実際に値が格納されている配列に伝播させなければいけません。これはどのタイミングでおこなえばよいのでしょうか? それはクエリでそのノードにアクセスしたときです。伝播させる処理は必要に迫られるまで先送りするわけです。

029 – Long Bricks

029 – Long Bricks

W 個の正方形のマスが左右に並んだ水平な部分があります。最初、すべての部分について、高さは 0 です。ここに高さ 1 のレンガを N 個、順番に積みます。高さ h の面に接着したレンガの上面の高さは h+1 になります。

i 番目に積むレンガは、左から L_i 番目から R_i 番目のマスをちょうど覆うように置きます。このとき、レンガが覆う範囲の中で最も高い水平な面で接着します。各レンガについて、上面の高さを求めてください。

入力される値

W N
L_1 R_1
L_2 R_2
L_3 R_3

L_N R_N

ただし
2 ≦ W ≦ 500,000
1 ≦ N ≦ 250,000
1 ≦ L_i ≦ R_i ≦ W

レンガは以下のような形で置かれていくわけですね。

以下のような入力が与えられた場合は

レンガは以下のように置かれます。答えは 1,2,3,3,4 となります。

ではどのように考えればよいでしょうか? 最初は閉区間 [3, 11] で高さの最大値を考えます。最初はレンガはひとつも置かれていないので 0 です。レンガを置くことで高さが 1 上昇します。レンガの上面は平らなので閉区間 [3, 11] すべての高さを 1 に変更します。

次は閉区間 [7, 15] で高さの最大値を考えます。この場合、高さの最大値は 1 です。レンガを置くことで高さが 1 上昇します。レンガの上面は平らなので閉区間 [3, 11] の高さはこの最大値に1を加えた 2 にすべて変更されます。

これは指定された区間の最大値の取得と指定された区間の値を更新するという大量のクエリに高速で対応せよという問題です。実は 平方分割で区間を指定した値の更新と最大値の取得という大量のクエリに対応する で同じ問題を扱っています。今回はセグメント木で攻略します。

セグメント木を以下のように定義します。

定義したSegTreeクラスを用いて解を求めます。SegTreeクラスのGetMax, Updatesメソッドは半開区間を想定しているので第二引数は right + 1 を渡します。