pqstat.pl

Narzędzia użytkownika

Analiza przestrzenna - wstęp

Podstawowe definicje

System Informacji Geograficznej - GIS (ang. Geographic Information System) - jest systemem służącym do wprowadzania, gromadzenia, przetwarzania oraz wizualizacji danych geograficznych. Z technicznego punktu widzenia jest to narzędzie, które pozwala na analizę powiązanych ze sobą:

  • informacji o lokalizacji przestrzennej obiektów - reprezentowanej za pomocą mapy;
  • charakterystyki opisowej dotyczącej prezentowanych na mapie obiektów - reprezentowanej za pomocą bazy danych.

Obiekty prezentowane za pomocą mapy to:

  • Punkty - których lokalizację w przestrzeni 2D definiujemy poprzez dwie współrzędne $(x,y)$;
  • Wielopunkty - to punkty pogrupowane w zbiory:

\begin{pspicture}(3,0)(3,2.5)
\rput(0.5,1){$\bullet$}
\rput(1,2.3){$\circ$}
\rput(0.5,1.7){$\bullet$}
\rput(2.7,1.55){$\circ$}
\rput(3,1.1){$\star$}
\rput(0.7,0.3){$\circ$}
\rput(1.2,1.2){$\bullet$}
\rput(2.05,2.2){$\circ$}
\rput(1.6,2.2){$\circ$}
\rput(2.4,1.7){$\star$}
\rput(2.9,0.6){$\star$}
\rput(-1,2){$1)$}
\end{pspicture}
Przykład wielopunktu, w którym dla każdego punktu zdefiniowana jest jego przynależność do jednej z 3 grup.

  • Linie - powstają przez połączenie w odpowiednim porządku kolejnych punktów (linie mogą się przecinać);
  • Wielokąty - to zamknięte powierzchnie ograniczone przez zewnętrzne pierścienie (zamknięte, nie przecinające się linie przechodzące w określonej kolejności przez co najmniej 3 różne punkty). Wielokąty mogą zawierać również wewnętrzne pierścienie stanowiące ich granicę wewnętrzną. Przy czym pierścienie zewnętrzne definiowane są zgodnie z ruchem wskazówek zegara a pierścienie wewnętrzne odwrotnie.

\begin{pspicture}(-1,-1)(12,6)
\psline{<-}(1,4)(0,0)
\psline{<-}(3,5)(1,4)
\psline{<-}(4,2)(3,5)
\psline{<-}(3,1)(4,2)
\psline{<-}(0,0)(3,1)
\rput(1.9,-.7){$1)$}
\psline{<-}(8,4)(7,0)
\psline{<-}(10,5)(8,4)
\psline{<-}(11,2)(10,5)
\psline{<-}(10,1)(11,2)
\psline{<-}(7,0)(10,1)
\psline{->}(9.4,3)(10,2)
\psline{->}(10,2)(10.5,2.8)
\psline{->}(10.5,2.8)(9.3,3.5)
\psline{->}(9.3,3.5)(9.4,3)
\psline{->}(8.4,2)(8.8,1)
\psline{->}(8.8,1)(9.3,1.3)
\psline{->}(9.3,1.3)(8.3,2.7)
\psline{->}(8.3,2.7)(8.4,2)
\rput(8.9,-.7){$2)$}
\end{pspicture}

1)Przykład wielokąta posiadającego tylko granicę zewnętrzną (bez pierścieni wewnętrznych);
2)Przykład wielokąta posiadającego granice zewnętrzną i granice wewnętrzne (obszary zaznaczone przez pierścienie wewnętrzne stanowią część zewnętrznej powierzchni, czyli nie należą do wielokąta).

Atrybuty obiektów zapisane są w bazie za pomocą:

liczb - np. powierzchnia, temperatura,

tekstów - np. nazwy obiektów.

Projekcja mapy jest matematycznym sposobem odwzorowania powierzchni kuli ziemskiej na płaszczyznę. Istnieje szereg metod takiego odwzorowania. Odwzorowania mogą bazować na elipsoidzie obrotowej lub powierzchni kuli (sfera) bądź ich części.

Każde odwzorowanie jest bazą do zdefiniowania odpowiedniego układu współrzędnych. Ponieważ każda projekcja powierzchni niesie ze sobą pewne zniekształcenia (zniekształcenia kątów, pól, długości), wybór odpowiedniego układu uzależniony jest od celu do jakiego będzie użyta mapa.

Układy współrzędnych stosowane w kartografii dzielimy na:

  • układy współrzędnych geograficznych (określają szerokość i długość geograficzną);
  • układy współrzędnych prostokątnych płaskich (tożsame z układem kartezjańskim);
  • układy współrzędnych biegunowych.

Aby mapa została poprawnie wczytana, program PQStat wymaga wektorowej mapy zapisanej w pliku SHAPEFILE (shp) zdefiniowanej w odpowiednim układzie współrzędnych prostokątnych płaskich, wymagana miara liniowa.

Program stara się automatycznie wykrywać mapy zawierające współrzędne geograficzne. Jeżeli podczas importu mapy program wykryje układ współrzędnych geograficznych, zaproponowana zostanie konwersja współrzędnych do układu UTM (Universal Transverse Mercator) bazując na układzie odniesienia WGS-84. Ze względu na możliwość uzyskania błędnej konwersji (na skutek stosowania wielu układów współrzędnych geograficznych i braku pewności co do zastosowanego układu), zalecane jest używanie map odpowiednio już przygotowanych - w układzie współrzędnych prostokątnych płaskich.

 

Wczytywanie map

Mapa wraz z przypisaną do niej bazą atrybutów może być wczytana poprzez:

  • import pliku kształtów SHP do arkusza danych,
  • wczytanie pliku PQS/PQX zawierającego dane z plików kształtów SHP.

Import pliku kształtów SHP

Importu dokonujemy wybierając z menu PlikImportuj dane …SHP/SHX/DBF ESRI Shapefile (*.shp).

W oknie importu mamy możliwość podglądu importowanej mapy oraz jej atrybutów zapisanych w pliku DBF. Jeśli w katalogu, z którego dokonujemy importu znajdują się wszystkie pliki potrzebne do wczytania mapy, wówczas odpowiednie kontrolki sygnalizują kolorem żółtym poprawność odczytu odpowiednich plików. Atrybuty przypisane do pliku kształtów w formie bazy danych DBF nie są wymagane do poprawnego wczytania mapy, tabela atrybutów może zostać uzupełniona po wczytaniu pliku mapy poprzez wypełnienie odpowiednich komórek arkusza powiązanego z mapą.

 

Ograniczenie obszaru roboczego

Ograniczenie obszaru roboczego wykonuje się w celu wskazania tylko tych obiektów, których ma dotyczyć analiza. W programie obiekty takie wskazuje się poprzez ich aktywację lub dezaktywację. Obiekty nieaktywne nie biorą udziału w analizach statystycznych.

Ręczna aktywacja/dezaktywacja obiektów

  • Wskazanie wiersza w arkuszu danych opisującego odpowiedni obiekt i wybranie opcji Aktywuj/Dezaktywuj z menu kontekstowego na jego nazwie;
  • Wskazanie obiektu na mapie i wybranie z menu kontekstowego Aktywuj/Dezaktywuj lub IdentyfikujAktywuj/Dezaktywuj obiekt.

Automatyczna aktywacja/dezaktywacja obiektów

  • Selekcja obiektów na podstawie arkusza danych – przykładowo, można wskazać jako aktywne tylko te sklepy, które są sklepami spożywczymi o powierzchni nie większej niż 1000m2. Ustawienie odpowiednich warunków selekcji obiektów odbywa się wówczas w oknie Aktywacji/Dezaktywacji dostępnego po wybraniu menu EdycjaAktywuj/Dezaktywuj (filtr)…. Szczegółowy opis sposobów tego typu selekcji można znaleźć w Podręczniku Użytkownika - PQStat (rozdział: Ograniczanie obszaru roboczego arkusza).
  • Selekcja obiektów na podstawie mapy – przykładowo, można wyodrębnić tylko te sklepy, które znajdują się wewnątrz wskazanego na mapie prostokątnego lub eliptycznego obszaru. Obszar ten zaznaczamy korzystając z narzędzi obszaru zaznaczenia a następnie aktywujemy lub dezaktywujemy w oknie Aktywuj/Dezaktywuj w zaznaczeniu dostępnym po wybraniu menu NarzędziaAktywuj/Dezaktywuj w zaznaczeniu w oknie Menadżera map.

By aktywować wszystkie obiekty należy wybrać menu NarzędziaAktywuj wszystkie w oknie Menadżera map lub menu EdycjaAktywuj wszystkie w oknie programu PQStat.

 

Obliczenia geometryczne

Obliczenia geometryczne są to formuły obliczeniowe (patrz Podręcznik Użytkownika - PQStat (rozdział: Formuły)). Formuły dotyczyć mogą danych widocznych w arkuszu lub tych opisujących geometrię mapy.

  • Formuły dla danych opisujących geometrię mapy - funkcje geometryczne/geograficzne

Jako dane do transformacji wybieramy SHP - dane z pliku kształtów.

Dostępne formuły:

meanCenter (poly) - zwraca współrzędne centrów dla wielokątów,

centroid (poly) - zwraca współrzędne centroidów dla wielokątów,

area (poly) - zwraca pola powierzchni wielokątów,

perimeter (poly) - zwraca obwody wielokątów.

  • Formuły dla danych arkusza - tworzenie map

Dostępne formuły:

map (points) - zwraca wektorową mapę punktów wraz z przypisanym arkuszem.

 

Testowanie hipotez

Weryfikacja hipotez statystycznych, to sprawdzanie określonych założeń sformułowanych dla parametrów populacji generalnej na podstawie wyników z próby.

Sformułowanie hipotez, które będą weryfikowane za pomocą testów statystycznych.

Każdy test statystyczny podaje postać ogólną hipotezy zerowej - $\mathcal{H}_0$(ang. null hypothesis) i alternatywnej - $\mathcal{H}_1$ (ang. alternative hypothesis):

\begin{array}{cl}
\mathcal{H}_0: & \textrm{\textbf{w badanej populacji} \textcolor{red}{\textbf{NIE MA}} ważnej statystycznie}\\
&\textrm{\quad np. zależności},\\
&\textrm{\quad np. różnicy},\\
&\textrm{\quad ...}\\
&\textrm{\textbf{między}}\\
&\textrm{\quad np. rozkładem przestrzennym},\\
&\textrm{\quad np. występowaniem poszczególnych wartości},\\
&\textrm{\quad ...}\\
&\textrm{\textbf{w analizowanym obszarze}},\\\\
\mathcal{H}_1: & \textrm{\textbf{w badanej populacji} \textcolor{red}{\textbf{ISTNIEJE}} ważna statystycznie}\\
&\textrm{\quad np. zależności},\\
&\textrm{\quad np. różnicy},\\
&\textrm{\quad ...}\\
&\textrm{\textbf{między}}\\
&\textrm{\quad np. rozkładem przestrzennym},\\
&\textrm{\quad np. występowaniem poszczególnych wartości},\\
&\textrm{\quad ...}\\
&\textrm{\textbf{w analizowanym obszarze}}.\\\\
\end{array}

Przykład:

\begin{array}{cl}
\mathcal{H}_0: & \textrm{NIE MA ważnej statystycznie zależności między rozkładem przestrzennym}\\
&\textrm{sklepów chemicznych w Wielkopolsce - zakładamy, że ich rozkład na }\\
&\textrm{badanym obszarze jest losowy}.\\
\end{array}

Jeśli nie wiemy, czy rozkład sklepów może być bardziej regularny niż rozkład losowy czy też też odwrotnie - bardziej skupiony niż rozkład losowy, wówczas hipoteza alternatywna powinna być dwustronna, tzn. nie zakładamy kierunku:

\begin{array}{cl}
\mathcal{H}_1: & \textrm{ISTNIEJE ważna statystycznie zależność między rozkładem przestrzennym}\\
&\textrm{sklepów chemicznych w Wielkopolsce - zakładamy, że ich rozkład na }\\
&\textrm{badanym obszarze jest nielosowy, czyli zakładamy 2 kierunki: rozkład}\\
&\textrm{bardziej regularny niż losowy i rozkład bardziej skupiony niż losowy}.\\
\end{array}

Może się zdarzyć (są to bardzo rzadkie przypadki), że mamy pewność, iż znamy kierunek w hipotezie alternatywnej. Wówczas można zastosować jednostronną hipotezę alternatywną.

Weryfikacja hipotez

By sprawdzić, która z hipotez $\mathcal{H}_0$ czy $\mathcal{H}_1$ jest bardziej prawdopodobna, dobieramy odpowiedni test statystyczny.

Statystyka testowa wybranego testu wyliczana zgodnie z jej wzorem podlega odpowiedniemu dla niej rozkładowi teoretycznemu.

\psset{xunit=1.25cm,yunit=10cm}
\begin{pspicture}(-5,-0.1)(5,.5)
\psline{->}(-4,0)(4.5,0)
\psTDist[linecolor=green,nue=4]{-4}{4}
\pscustom[fillstyle=solid,fillcolor=cyan!30]{%
\psTDist[linewidth=1pt,nue=4]{-4}{-2.776445}%
\psline(-2.776445,0)(-4,0)}
\pscustom[fillstyle=solid,fillcolor=cyan!30]{%
\psline(2.776445,0)(2.776445,0)%
\psTDist[linewidth=1pt,nue=4]{2.776445}{4}%
\psline(4,0)(2.776445,0)}
\rput(-3.6,0.2){$\alpha/2$}
\psline{->}(-3.6,0.15)(-3.1,0.04)
\rput(3.6,0.2){$\alpha/2$}
\psline{->}(3.6,0.15)(3,0.04)
\rput(1,0.5){$1-\alpha$}
\psline{->}(1,0.46)(0.55,0.35)
\rput(2.5,-0.04){wartość statystyki testowej}
\end{pspicture}

Program wylicza wartość statystyki testowej, oraz wartość $p$ dla tej statystyki (czyli część pola pod krzywą, która odpowiada wartości statystyki testowej). Wartość $p$ pozwala wybrać spośród hipotezy zerowej i alternatywnej tę bardziej prawdopodobną. Przy czym zawsze zakładamy prawdziwość hipotezy zerowej, a zebrane w danych dowody mają dostarczyć wystarczającej ilości argumentów przeciwko tej hipotezie:

\begin{array}{ccl}
$ jeżeli $ p \le \alpha & \Longrightarrow & $ odrzucamy $ \mathcal{H}_0 $ przyjmując $ 	\mathcal{H}_1, \\
$ jeżeli $ p > \alpha & \Longrightarrow & $ nie ma podstaw, aby odrzucić $ \mathcal{H}_0. \\
\end{array}

Zwykle wybiera się poziom istotności $\alpha=0.05$, zgadzając się, że w 5% sytuacji odrzucimy hipotezę zerową gdy jest ona prawdziwa. W szczególnych przypadkach można wybrać inny poziom istotności np. 0.01 lub 0.001.

 

Narzędzia strony