[Croatia] Benchmarking prostornih baza

Darko Boto darko.boto at gmail.com
Thu Jan 27 04:11:00 EST 2011


2011/1/27 Mario Miler <mmiler at geoinfo.geof.hr>:
> On 27.1.2011. 8:14, Dragan Podvezanec wrote:
>>
>> Evo što mene zanima:
>>
>> - Join poligona u multipolygone, jer znam da Oracle s tim ima problema, pa
>> me zanima kako se ponašaju druge baze, prvenstveno postgis.
>> - kreiranje view-a sa geometrijom transformiranom u drugu projekciju.
>> - sama brzina "dohvata" podataka - select prema bbox-u ili drugom
>> prostornom upitu
>>
>> Mislim da je za ovakve vrste testova dovoljno "napadati" bazu sa samo
>> jednog klijenta.
>
> Slažem se, pogotovo sa trećim prijedlogom jer upravo takvi upiti su najčešće
> korišteni od strane standardnih kilenata poput Geoservera, Mapserver,
> AutoCAD-a i sl. koji i jesu najčešće korišteni u praksi, predpostavljam da
> je na to Dragan mislio. Mislim da su ova tri prijedloga dobra za početak.
> Join poligona u multipoligone, novodno PostGIS je tu jako dobar u novijim
> verzijama.
> Ovo sa transformacijom neću moći srediti za MS SQL server jer nije izvedivo,
> ali općenito dobra ideja.
> Palo mi je na pamet, da bi bilo dobro testirati tako da uzmemo jedan veliki
> poligon s puno točaka unutar njega i onda testirati točka-unutar-polygona,
> tu index nema skoro nikakve veze, kaj ne? Možda još naći neki upit gdje
> index ne bi pomogao čak i da postoji.
>
> Ajmo prvo srediti podatke. Jučer sam krenuo raditi triangulaciju POI od
> dataseta iz njemačke koje je Darko predložio, ali sam shvatio da to nema
> smisla jer to neće biti realni poligoni već trokuti što ne predstavlja neki
> veliki problem za bazu jer ima samo tri točke. I manje više, s obzirom da ih
> ima puno i upiti prekog veliko područja Onda sam išao raditi Voronoi
> dijagrame, pa sam shvatio da će mi za to trebati dosta vremena, a nepotrebno
> je. Mislim da u samom datasetu ima dovoljno poligona i dovoljno kompleksih
> poligona za testiranje. Samo shapefile od šuma ima cca 412 000 poligona. Ako
> se tu još dodaju neki drugi featuri, mislim da će biti i više nego dovoljno.
> Ono što je Dražen bio rekao da se testira sa više klienata odjednom, možda i
> ima smisla, ali samo kada bi se simulirali upiti slični onima Geoserver,
> Mapserva i sl. To bi mogli probati. Testirati ST_Union i sl. upiti sa više
> klienata nekako ne vidim smisla. To se skoro nikada (ili rijetko) dešava u
> praksi.
>
> Idemo za početak vidjeti koje podatke koristiti. Darko je rekao da se uzmu
> podaci iz Njemačke OSM. Možemo krenuti od toga. Pripremiti ih, maknuti
> nepotrebna polja i transformirati.
> Upite možemo pripremiti, ali njih možemo napisati i prije testiranja, nije
> to neka velika mudrost ako znamo što želimo testirati.
> Što se tiče brzine unosa podataka, možemo i to probati zašto ne. To se isto
> može napisati u Javi, Python, C# ili čemu već dosta brzo, pa čak i tamo kada
> budemo probali. Također nije neka mudrost.
> Najveći problem je ubiti naći se i to je to. Manje više sve se može riješiti
> on-the-fly. Od velikog mudrovanja nećemo ništa dobiti. Ionako to radimo iz
> gušta i zbog druženja, kaj ne? :)
>

Slazem se da se nebi trebalo previse komplicirati pa predlazem da se
okviri ovog testa zadrze na "funkcionalnim testovima i testovima
performansi" pri cemu bi trebali koristiti operatore za topološke
odnose, geometrijske operacije i agregatne funkcije (kako je opisano
na wiki-ju). Drugim rjecima ja bih da se zadrzimo na testovima
prostornih extenzija i njihovim implementacijama.
Mislim da nebi trebali ici na vise od 10 prostornih queri-ja kako bi
ipak dobili neke relevantne usporedne rezultate. Osim prostornih
queri-ja u scenarijima je opisano par nefunkcionalnih stvari koje su
relevantne (kao npr. brzina loada, veličina baze te kreiranje
prostornog indexa pri cemu bi mjerili i vrijeme i velicinu).

Tomislave... ccini mi se da bi testove trebalo napraviti na samoj bazi
tj koristenjem ST_ funkcija. Ako se izvucemo iz baze u neku okolinu
moguce da ce se poceti pokazivati neke internalije i implementacijske
razlike koje ovise o okolini.

Mario i Drazene, definitivno bi mogli probati i visestruke napade na
bazu preko Geoservera/Mapservera (whatever). Ono sto namontiramo ce
ostati na serveru i jedino ce poslije trebati isprogramirati neki
programcic koji ce napadati WMS sa random upitima unutar nekog
extenta.
To mi se cini dobra tema za npr. drugu fazu tastova.

Da.. ajmo na posao :)
Sve mozemo remote napraviti pa onda dogovaramo veliko okupljanje
geogeekova (veliki GeoSabor ;))
Nebi se smjeli previse zapetljavati oko koncepta i cini mi se da se
slazemo oko toga sto hocemo napraviti.

> --
> Mario Miler, dipl.ing.geod.
> Asistent na Katedri za geoinformatiku Geodetskog fakulteta
> tel: 01/4639454
> mob: 098/1674-321
> e-mail: mmiler at geof.hr
>        mario.miler at zg.htnet.hr
> ---
> Mario Miler, dipl.ing.surv.
> Research assistant , Chair of Geoinformation Science at Faculty of Geodesy,
> University of Zagreb
> Direct: +385 1 4639454
> Mobile: +385 98 1674321
> e-mail: mmiler at geof.hr
>        mario.miler at zg.htnet.hr
>
> _______________________________________________
> Croatia mailing list
> Croatia at lists.osgeo.org
> http://lists.osgeo.org/mailman/listinfo/croatia
>


More information about the Croatia mailing list