こんにちは、インフォマティクスの空間情報クラブ編集部です。
本記事では、データ分析に活用されるカーネル密度推定について、密度計算方法や密度推定例、カーネル関数の種類などをわかりやすくご紹介します。
参考
インフォマティクスでは、国内で約36,000のお客様に利用されているGIS(地理情報システム)製品SIS(エスアイエス)をご用意しております。
SISの資料をダウンロードする
目次
カーネル密度推定とは
カーネル密度推定は、限られた標本点から全体の分布を推定する手法の1つです。
密度を推定する際には、パラメトリックモデル(例:正規分布(ガウス分布)、指数分布、ガンマ分布)を用いる手法が一般的です。
しかし、分布をパラメトリックモデルで表現できない場合には、ノンパラメトリック推定が適用されます。カーネル密度推定は、代表的なノンパラメトリック手法です。
カーネル密度推定はノンパラメトリック手法であるため、確率分布を事前に仮定せず、観測されたデータに基づいて密度関数を推定することが可能です。
メモ
- パラメトリック手法:データが特定の確率分布(例えば、正規分布や指数分布)に従うと仮定し、その分布に基づいてパラメータを推定する方法です。
- ノンパラメトリック手法:特定の分布を仮定せず、観測データに基づいて推定します。カーネル密度推定はノンパラメトリック手法の1つです。
カーネル密度推定の例
犯罪データを使った密度推定
例えば、犯罪発生地点を示すポイントデータがあるとします。
このデータをサンプルとして、犯罪発生がない場所の発生率を推定したい場合にカーネル密度推定を利用します。
下図は、7つの地点を基にカーネル密度推定を行った例です。左側の図では、2次元の地図上にポイントが配置されています。
右側では、そのポイントデータを元にカーネル密度推定を行い、結果を3次元で表現しています。密度が高いエリアでは、確率が高いと推定されることがわかります。
右側の図を見ると、互いに近いポイントどうしでは、推定結果がつながり、値の高さが強調されていますが、離れた地点のポイントは、ほとんど他の点に影響を与えていないことが確認できます。
このようにカーネル密度推定を3次元で視覚的に表現することで、推定結果がより直感的に理解しやすくなります。

カーネル密度の計算方法|必要なパラメータと計算手順
カーネル密度を計算する場合は、以下のパラメータを定義する必要があります。
- カーネル関数:各標本点の影響度の広がり方を定義
カーネル関数とは、データ点周辺の密度を評価する際の重みづけ関数のことです。これにより、データがどの程度影響を与えるかが決まります。 - バンド幅:カーネル関数の広がりの幅を定義
バンド幅の定義は非常に重要です。過度に小さなバンド幅はノイズを強調し、大きすぎるバンド幅は情報をぼかしてしまいます。
カーネル関数の種類と特徴
カーネル密度推定に使用するカーネル関数には「正規分布(ガウス分布)」をはじめ、さまざまな種類があります。
- 正規分布(ガウス分布):左右対称な曲線で分布を表現(下図上)
- 均等化:ヒストグラムで値を表現(下図中)
- 三角化:直線でグラフを表現(下図下)

バンド幅|影響範囲の設定方法
バンド幅とは、各標本が影響を及ぼす範囲を設定するパラメータです。
バンド幅が小さすぎると、結果が不自然な形になりますが、大きすぎると過度に滑らかな結果となり、詳細な分析ができなくなります。
以下は、バンド幅が小さすぎた場合の例です。

カーネル密度計算の例|正規分布を使った密度推定
カーネル密度の計算方法として「正規分布」関数を使った例をご紹介します。
下図は、緑のグラフが各標本に正規分布を適用したカーネル関数を示しています。
使用する関数とバンド幅を設定した後、各標本点の密度分布を計算し、最終的にその値を足し合わせることでカーネル密度推定を行います。赤いグラフは、カーネル密度推定の結果を示しています。

おわりに
カーネル密度推定では、分析対象の特性に合わせて適切なカーネル関数やバンド幅を選ぶことが重要です。
GISソフト「SIS」には、あらかじめ多くのカーネル関数が用意されており、目的に応じて最適な関数を選ぶことができます。
カーネル密度推定を用いて色分けや3次元表示などさまざまな視覚化を行うことで、予想外の有益な知見を得られる可能性があります。
GISソフトをお探しなら
GISソフトをお探しの方、現在お使いのGISに課題を感じている方は、GIS(地理情報システム)製品SISのご利用を検討されてみてはいかがでしょうか。無償版もご用意しています。
SISの資料をダウンロードする >>
GISやAI機械学習を使った業務システムの構築に関するご相談を承っています。お気軽にお問い合わせください。