[Croatia] Benchmarking prostornih baza

Mario Miler mmiler at geoinfo.geof.hr
Thu Jan 27 03:50:44 EST 2011


On 27.1.2011. 8:14, Dragan Podvezanec wrote:
> Evo što mene zanima:
>
> - Join poligona u multipolygone, jer znam da Oracle s tim ima problema, pa me zanima kako se ponašaju druge baze, prvenstveno postgis.
> - kreiranje view-a sa geometrijom transformiranom u drugu projekciju.
> - sama brzina "dohvata" podataka - select prema bbox-u ili drugom prostornom upitu
>
> Mislim da je za ovakve vrste testova dovoljno "napadati" bazu sa samo jednog klijenta.
Slažem se, pogotovo sa trećim prijedlogom jer upravo takvi upiti su 
najčešće korišteni od strane standardnih kilenata poput Geoservera, 
Mapserver, AutoCAD-a i sl. koji i jesu najčešće korišteni u praksi, 
predpostavljam da je na to Dragan mislio. Mislim da su ova tri 
prijedloga dobra za početak.
Join poligona u multipoligone, novodno PostGIS je tu jako dobar u 
novijim verzijama.
Ovo sa transformacijom neću moći srediti za MS SQL server jer nije 
izvedivo, ali općenito dobra ideja.
Palo mi je na pamet, da bi bilo dobro testirati tako da uzmemo jedan 
veliki poligon s puno točaka unutar njega i onda testirati 
točka-unutar-polygona, tu index nema skoro nikakve veze, kaj ne? Možda 
još naći neki upit gdje index ne bi pomogao čak i da postoji.

Ajmo prvo srediti podatke. Jučer sam krenuo raditi triangulaciju POI od 
dataseta iz njemačke koje je Darko predložio, ali sam shvatio da to nema 
smisla jer to neće biti realni poligoni već trokuti što ne predstavlja 
neki veliki problem za bazu jer ima samo tri točke. I manje više, s 
obzirom da ih ima puno i upiti prekog veliko područja Onda sam išao 
raditi Voronoi dijagrame, pa sam shvatio da će mi za to trebati dosta 
vremena, a nepotrebno je. Mislim da u samom datasetu ima dovoljno 
poligona i dovoljno kompleksih poligona za testiranje. Samo shapefile od 
šuma ima cca 412 000 poligona. Ako se tu još dodaju neki drugi featuri, 
mislim da će biti i više nego dovoljno.
Ono što je Dražen bio rekao da se testira sa više klienata odjednom, 
možda i ima smisla, ali samo kada bi se simulirali upiti slični onima 
Geoserver, Mapserva i sl. To bi mogli probati. Testirati ST_Union i sl. 
upiti sa više klienata nekako ne vidim smisla. To se skoro nikada (ili 
rijetko) dešava u praksi.

Idemo za početak vidjeti koje podatke koristiti. Darko je rekao da se 
uzmu podaci iz Njemačke OSM. Možemo krenuti od toga. Pripremiti ih, 
maknuti nepotrebna polja i transformirati.
Upite možemo pripremiti, ali njih možemo napisati i prije testiranja, 
nije to neka velika mudrost ako znamo što želimo testirati.
Što se tiče brzine unosa podataka, možemo i to probati zašto ne. To se 
isto može napisati u Javi, Python, C# ili čemu već dosta brzo, pa čak i 
tamo kada budemo probali. Također nije neka mudrost.
Najveći problem je ubiti naći se i to je to. Manje više sve se može 
riješiti on-the-fly. Od velikog mudrovanja nećemo ništa dobiti. Ionako 
to radimo iz gušta i zbog druženja, kaj ne? :)

-- 
Mario Miler, dipl.ing.geod.
Asistent na Katedri za geoinformatiku Geodetskog fakulteta
tel: 01/4639454
mob: 098/1674-321
e-mail: mmiler at geof.hr
	mario.miler at zg.htnet.hr
---
Mario Miler, dipl.ing.surv.
Research assistant , Chair of Geoinformation Science at Faculty of Geodesy, University of Zagreb
Direct: +385 1 4639454
Mobile: +385 98 1674321
e-mail: mmiler at geof.hr
	mario.miler at zg.htnet.hr



More information about the Croatia mailing list