Pasek boczny

pl:przestrzenpl:losdotpl:nnipl

Analiza najbliższego sąsiedztwa

W Analizie najbliższego sąsiedztwa (ang. Nearest Neighbor Analysis) granice obszaru, w którym zamknięte są analizowane punkty, mają zasadniczy wpływ na uzyskany wynik. Poniższy przykład daje obraz regularnie rozłożonych punktów, gdy ich granicą jest mały prostokąt i rozkładu skupiskowego, gdy ich granicą jest duży prostokąt.

\begin{pspicture}(1,0)(12.5,3)
\psline[linestyle=dashed](5,0)(5,2.5)
\psline[linestyle=dashed](5,0)(8,0)
\psline[linestyle=dashed](5,2.5)(8,2.5)
\psline[linestyle=dashed](8,0)(8,2.5)
\psline{-}(5.7,0.5)(5.7,2)
\psline{-}(5.7,0.5)(7.3,0.5)
\psline{-}(5.7,2)(7.3,2)
\psline{-}(7.3,0.5)(7.3,2)
\rput(6.2,1){$\circ$}
\rput(6.8,1.5){$\circ$}
\rput(6.2,1.5){$\circ$}
\rput(6.8,1){$\circ$}
\end{pspicture}

Granice, w zależności od potrzeb, mogą być zdefiniowane za pomocą: otoczki wypukłej, najmniejszego prostokąta, prostokąta z granic warstwy lub najmniejszego okręgu. Badany obszar może być również zdefiniowany jedynie przez wielkość swojego pola.

Odległość pomiędzy punktami mierzona jest metryką Euklidesową.

Pierwszym etapem analizy najbliższego sąsiedztwa jest wyliczenie odległości pomiędzy wszystkimi punktami. Następnie dla każdego punktu szukany jest punkt, który jest położony najbliżej tzw. najbliższe sąsiedztwo ($NN$).

Uwaga!

Odległości pomiędzy wszystkimi punktami definiowane są poprzez macierz wag. W oknie analizy najbliższego sąsiedztwa możemy wybrać macierz wag wygenerowaną wcześniej za pomocą menu Analiza przestrzennaNarzędziaMacierz wag przestrzennych lub wskazać proponowaną przez program macierz wszystkich odległości wyliczanych zgodnie z metryką Euklidesową.

Podstawowe statystyki dla analizy najbliższych sąsiadów:

  • $d_i(NN)$ - odległość każdego punktu od jego najbliższego sąsiada,
  • $\overline{NN}$ - średnia odległość najbliższych sąsiadów:

    \begin{displaymath}
\overline{NN}=\sum_{i=1}^n\frac{d_i(NN)}{n}
\end{displaymath}
  • $SD_{(NN)}$ - odchylenie standardowe odległości najbliższych sąsiadów,
  • $\overline{ran}$ - średnia oczekiwana odległość najbliższych sąsiadów:

    \begin{displaymath}
\overline{ran}=\frac{0.5}{\sqrt{\frac{n}{A}}}
\end{displaymath}

Współczynnik Najbliższego Sąsiedztwa

Współczynnik Najbliższego Sąsiedztwa (ang. Nearest Neighbor Index (NNI)) bazuje na metodzie opisanej przez botaników: Clarka i Evansa (1954)1). $NNI$ porównuje obserwowane odległości pomiędzy najbliższymi punktami oraz odległości, które pojawiłyby się dla losowego rozkładu punktów. \begin{displaymath}
NNI=\frac{\overline{NN}}{\overline{ran}}
\end{displaymath} Kiedy porównywane odległości są takie same, wówczas $NNI=1$. Kiedy obserwowane odległości pomiędzy najbliższymi punktami są mniejsze niż oczekiwane, wówczas punkty są bliżej siebie niż w rozkładzie losowym i $NNI<1$. Tworzą się skupiska. Gdy jest odwrotnie, wówczas $NNI>1$, co świadczy o występowaniu efektu równomiernego rozproszenia, czyli punkty są regularniej umiejscowione niż wynikałoby to z ich losowego rozkładu.

Istotności Współczynnika Najbliższego Sąsiedztwa

Test do sprawdzania istotności Współczynnika Najbliższego Sąsiedztwa $NNI$ służy do weryfikacji hipotezy o tym, że obserwowane odległości pomiędzy najbliższymi punktami są takie same jak oczekiwane odległości, które pojawiłyby się dla losowego rozkładu punktów.

Hipotezy:

\begin{array}{cl}
\mathcal{H}_0: & NNI = 1, \\
\mathcal{H}_1: & NNI \ne 1.
\end{array}

Statystyka testowa ma postać: \begin{displaymath}
Z=\frac{\overline{NN}-\overline{ran}}{SE_{\overline{ran}}},
\end{displaymath}

gdzie:

\begin{array}{cl}
SE_{(ran)} = \sqrt{\frac{4-\pi A}{4\pi n^2}} & \textrm{- błąd standardowy  średniej oczekiwanej odległości}\\
&\textrm{najbliższych sąsiadów }
\end{array}

Statystyka $Z$ ma asymptotycznie (dla dużych liczności) rozkład normalny.

Wartość $p$, wyznaczoną na podstawie statystyki testowej, porównujemy z poziomem istotności $\alpha$:

\begin{array}{ccl}
$ jeżeli $ p \le \alpha & \Longrightarrow & $ odrzucamy $ \mathcal{H}_0 $ przyjmując $ 	\mathcal{H}_1, \\
$ jeżeli $ p > \alpha & \Longrightarrow & $ nie ma podstaw, aby odrzucić $ \mathcal{H}_0. \\
\end{array}

Analiza kolejnych najbliższych sąsiadów

By analizować kolejnych najbliższych sąsiadów, bierze się pod uwagę odległość do drugiego najbliższego sąsiada, trzeciego najbliższego sąsiada, aż do $k$-tego najbliższego sąsiada. Dla sąsiedztwa każdego stopnia (od najbliższego sąsiedztwa do sąsiedztwa $k$-tego stopnia) wylicza się kolejne Współczynniki Najbliższego Sąsiedztwa:

$k_{ordered}NNI$: \begin{displaymath}
k_{ordered}NNI=\frac{k_{ordered}\overline{NN}}{k_{ordered}\overline{ran}}
\end{displaymath}

gdzie:

$\displaystyle k_{ordered}\overline{NN}$ - średnia odległość do sąsiadów $k$-tego stopnia,

$\displaystyle k_{ordered}\overline{ran}=\frac{k(2k)!}{\left(2^kk!\right)^2\sqrt{\frac{n}{A}}}$ - średnia oczekiwana odległość do sąsiadów $k$-tego stopnia.

Wyniki analizy gęstości punktów przeprowadzanej dla kolejnych sąsiadów można przedstawić na wykresie, aby zobrazować w ten sposób położenie współczynników $NNI$ w stosunku do linii wskazującej losową strukturę punktów oraz by sprawdzić, czy dla współczynników uzyskano trend rosnący lub malejący.

Efekt krawędzi

Obiekty znajdujące się blisko granicy wykazują tendencję do większego oddalenia od najbliższych sąsiadów, niż inne obiekty znajdujące się w obszarze analizy. Wynika to z prostego faktu, że najbliżsi sąsiedzi obiektów przygranicznych mogą znajdować się poza granicami badanego obszaru. W takiej sytuacji można przeprowadzić analizę z korektą efektu granicy. Wówczas odległość punktu od jego najbliższego sąsiada ($d_i(NN)$) jest wyliczana jako minimum odległości punktu od jego sąsiadów i od granicy. Jeśli więc odległość punktu od granicy będzie mniejsza niż do jego sąsiadów, wówczas za $d_i(NN)$ przyjmowana jest odległość do granicy. Jednakże takie wyliczenie najbliższego sąsiedztwa wymaga założenia, że na granicy zawsze znajduje się punkt uznawany za sąsiada.

Okno z ustawieniami opcji analizy najbliższego sąsiedztwa wywołujemy poprzez menu Analiza przestrzennaStatystyki przestrzenneAnaliza najbliższego sąsiedztwa.

Przykład (katalog: districts, pliki SHP: districts)

Podział administracyjny Polski na powiaty z założenia powinien być równomierny. Czy tak rzeczywiście jest, sprawdzimy przy użyciu współczynnika NNI.

  • Mapa districts zawiera informacje o lokalizacji wielokątów (powiatów Polski).

Analiza najbliższego sąsiedztwa będzie się opierać na centroidach reprezentujących powiaty. Możemy je wyrysować (dodać warstwę centroid do mapy powiatów) korzystając z Menadżera map.

Analizę najbliższego sąsiedztwa przeprowadzimy wykorzystując informację o wielkości pola powierzchni Polski - wynosi ono $311888000000m^2$. Oprócz współczynnika pierwszego sąsiedztwa wyliczymy też współczynniki kolejnego sąsiedztwa aż do 15.

Podając wielkość pola w oknie analizy, uzyskano współczynnik najbliższego sąsiedztwa równy 1.37127 i istotnie statystycznie większy od wartości 1 ($p<0.000001$). Średnia odległość pomiędzy najbliższymi sąsiednimi centroidami wynosi $19668.564923m$ a odchylenie standardowe to $9102.84769m$. Bardzo podobny rezultat uzyskamy, gdy powrócimy do analizy (przycisk ) i jako obwiednię obiektów wybierzemy otoczkę wypukłą ($NNI=1.382828$, $p<0.000001$).

Granice wyznaczone przez otoczkę wypukłą dodajemy do mapy uruchamiając przycisk i wybierając warstwę obwiedni obiektów.

Zastosowanie korekty efektu tak rozumianej granicy obniża wartość $NNI$ do 1.340503 ale pozostawia niezmienioną ogólną tendencję kolejnych współczynników najbliższego sąsiedztwa.

W każdej z powyższych analiz kolejne współczynniki sąsiedztwa są większe niż 1 i mimo, że początkowo zbliżają się do 1, to od stopnia 5 stabilizują się na poziomie ok 1.1. Uzyskany wynik potwierdza zatem równomierne rozłożenie powiatów w Polsce.

Przykład (katalog: poplar, pliki SHP: T-poplar, S-poplar)

Konkurencja międzygatunkowa wpływa na zmiany w rozmieszczeniu poszczególnych gatunków roślin i ich zagęszczeniu. Konkurencja wewnątrzgatunkowa jest zwykle silniejsza od konkurencji międzygatunkowej, gdyż osobniki tego samego gatunku mają niemal identyczne wymagania i współzawodniczą o te same zasoby. Natężenie konkurencji wewnątrzgatunkowej rośnie wraz ze wzrostem liczebności populacji. By sprawdzić wpływ konkurencji na pewien gatunek topoli balsamicznej, analizie poddano obszar leśny nie regulowany przez człowieka. Badano lokalizację drzew młodych i drzew dorosłych.

  • Mapa T-poplar zawiera fikcyjne informacje o lokalizacji 121 punktów (dużych topoli balsamicznych) w prostokątnym wycinku lasu.
  • Mapa S-poplar zawiera fikcyjne informacje o lokalizacji 326 punktów (małych topoli balsamicznych) w prostokątnym wycinku lasu.

Na mapie drzewa młode (małe) oznaczono kolorem czerwonym a drzewa dorosłe (duże) kolorem niebieskim.

Na podstawie współczynników najbliższego sąsiedztwa, w obszarze wyznaczonym przez prostokąt z granic warstwy, porównana została struktura zagęszczenia topoli.

Drzewa młode występują gęściej niż drzewa dorosłe. Ich średnia odległość najbliższych sąsiadów wynosi $103.12m$, podczas gdy dla drzew dorosłych $282.27m$. Konkurencja w rozwoju struktury drzewostanu sprawia, że przestrzenny wzór dużych drzew jest bardziej regularny ($NNI=1.68$, $p<0.000001$) niż w przypadku drzew małych ($NNI=1.01$, $p=0.8498$).

1)
Clark P.J., Evans F.C. (1954), Distance to nearest neighbour as a measure of spatial relationships in populations. Ecology 35, 445-453
pl/przestrzenpl/losdotpl/nnipl.txt · ostatnio zmienione: 2014/08/25 21:17 (edycja zewnętrzna)

Narzędzia strony