GIS用語解説

カーネル密度推定とは|密度計算・カーネル関数

8月 1, 2014

今回はカーネル密度推定についてご紹介ます。

カーネル密度推定とは

カーネル密度推定は、「有限の標本点から、全体の分布を推定する」手法の1つです。

例えば、手元に犯罪の発生地点を表すポイントデータがあったとします。そのポイントデータをサンプルデータとして、ポイントのない地点の犯罪発生率を補完して推定したいような場合にカーネル密度推定を使います。

下記では、7点を元にカーネル密度推定を行った例です。左図は、2次元の地図上にポイントを配置したものです。右図は、そのポイントを元にカーネル密度推定を行い、その値を3次元で表現したものです。点が集まってる部分は確率が高いと推定されます。

この結果を見ると、互いの点が近い場合は推定結果の値がつながっていたり高さが強調されていますが(右図の左側部分)、他の地点から離れた位置にある点は他の点に対してほとんど影響を与えてないことがわかります(右図の右側部分)。

このように、カーネル密度推定を3次元で表わすと、推定結果を視覚的にわかりやすく表現できます。

 カーネル密度の計算方法

カーネル密度を計算する場合は、以下の項目を定義する必要があります。

  • カーネル関数:各標本点の影響度の広がり方を定義
  • バンド幅:カーネル関数の広がりの幅を定義

カーネル関数の種類

カーネル密度推定に使用するカーネル関数には「正規分布(ガウス分布)」「均等化」「三角化」をはじめ、さまざまな種類があります。

  • 正規分布(ガウス分布):左右対称な曲線で分布を表現
  • 均等化:ヒストグラムで値を表現
  • 三角化:直線でグラフを表現

バンド幅

バンド幅とは、各標本が影響を及ぼす範囲を指定するものです。

バンド幅が小さすぎるといびつな結果になり、大きすぎると分析できないくらい滑らかな結果になります。

以下はバンド幅が小さすぎた例です。

カーネル密度計算例

カーネル密度の計算方法として、「正規分布」関数を使った例をご紹介します。

下図は、緑のグラフが各標本のカーネル関数に正規分布を使用したものです。

使用する関数やバンド幅を定義したのち、各標本点の密度分布を計算し、最後に値を足すことでカーネル密度推定を行うことができます。

赤いグラフがカーネル密度推定の結果です。

おわりに

カーネル密度推定では、分析対象の特性に合わせて適切なカーネル関数やバンド幅を選択することが重要です。

GISソフト「SIS」には、あらかじめ多数のカーネル関数が用意されているため、必要に応じた関数を選ぶことができます。

カーネル密度推定を使って色分け・3次元表示などさまざまな表現を行うことで、思いがけない知見が得られるかもしれません。

記事の評価をお願いします!

  • この記事を書いた人
  • 最新記事

空間情報クラブ編集部

空間情報クラブ編集部です。GISソフトの便利な機能をご紹介する活用講座やGIS用語解説、地図、位置情報、AI機械学習などをテーマにしたコラムを掲載しています。ご意見・ご感想、寄稿、コラボ企画などありましたらぜひご連絡ください。お待ちしております!

-GIS用語解説
-, , ,

© 2020 株式会社インフォマティクス