<div dir="ltr">Hi Imre,<br><div><br></div><div>Thank you for your reply! And it is a great question!</div><div><br></div><div>As I mentioned in the proposal, the priority R-tree has been proved to have a theoretical optimal <b>query</b> performance but it may be too complex to build one which would cost a lot of time. And the current project mainly focuses on the <b>building </b>process of a spatial index. From previous experience, a z-order pre-sorting may be a trade-off between <b>building</b> and <b>query</b>. In fact, the GeoHash, as you mentioned, is essentially equivalent to the z-order method[1].</div><div><br></div><div>From my perspective, the dataset should be divided into several subgroups to be put in the index which is called <b>partition </b>in this paper[2] because of the scalability. The memory of machines cannot hold so much data at the same time. And then sort data in the subset with a pre-defined order such as z-order. There are many algorithms to determine where to cut the dataset into subsets as mentioned in the paper. But at present, I just choose to implement a trivial one that cuts the dataset into some small one evenly. Because the performance of different methods are very dependent on the sizes of the dataset and the memories of machines which may need a fine tuning just like what many HPC engineers are doing.</div><div><br></div><div>To conclude, the whole project is a research and test based program. There are two major problems, <b>subset partitioning</b> and <b>internal pre-sorting</b>. And first I want to implement a z-order pre-sorting method on a small random dataset and some real data from OSM which my mentors recommend. And then study on the subset partitioning.</div><div><br></div><div>I am very happy to receive the suggestion from you! I hope this answers your question. Feel free to ask me more or give me some suggestions! I am looking forward to hearing from you!</div><div><br></div><div>Best regards,</div><div>Han</div><div><br></div><div>[1] <a href="https://en.wikipedia.org/wiki/Geohash" target="_blank">https://en.wikipedia.org/wiki/Geohash</a></div><div>[2] <a href="http://www.cse.cuhk.edu.hk/~taoyf/paper/vldb18-sfc.pdf" target="_blank">http://www.cse.cuhk.edu.hk/~taoyf/paper/vldb18-sfc.pdf</a></div></div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">On Tue, May 25, 2021 at 3:14 PM Imre Samu <<a href="mailto:pella.samu@gmail.com" target="_blank">pella.samu@gmail.com</a>> wrote:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><div dir="ltr">Hi Han,<div><br></div><div>Thank you for working on this topic!  :) </div><div><br></div><div>> Feel free to give me suggestions or ask me anything! I<br></div><div><br></div><div>my question: </div><div>- in the research paper ( "2018" - mentioned in your proposal ) -  "partitioning" mentioned multiple times ..  </div><div>  Do you have any plan - for adding spatial partitioning to the test cases?  </div><div><br></div><div>comment:</div><div><br></div><div>As I know  - in the OpenStreetMap word - the current clustering/"pre-sorting method":  is the GeoHash based sorting:</div><div><a href="https://www.paulnorman.ca/blog/2016/06/improving-speed-with-reclustering/" target="_blank">https://www.paulnorman.ca/blog/2016/06/improving-speed-with-reclustering/</a><br></div><div><a href="https://www.paulnorman.ca/blog/2016/05/improve-your-st-geohash-sorting-with-these-three-simple-tricks/" target="_blank">https://www.paulnorman.ca/blog/2016/05/improve-your-st-geohash-sorting-with-these-three-simple-tricks/</a><br></div><div>Maybe you can borrow some ideas for your benchmark. :)  </div><div><br></div><div>Thanks, </div><div>  Imre</div><div><br></div></div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">Han Wang <<a href="mailto:hanwgeek@gmail.com" target="_blank">hanwgeek@gmail.com</a>> ezt írta (időpont: 2021. máj. 25., K, 4:19):<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><div dir="ltr">Hi all,<div><br></div><div>My name is Han WANG. I am a first year graduate student majoring in GIS at Peking University, and will get my Master's degree in 2023. And this is my github(<a href="https://github.com/HanwGeek" target="_blank">https://github.com/HanwGeek</a>) and my linkedin(<a href="https://www.linkedin.com/in/hanwgeek/" target="_blank">https://www.linkedin.com/in/hanwgeek/</a>). I am interested in all cool things. And it is very exciting to join the open source community! My research interest includes massive spatial temporal data management and analysis. Currently, I am working on a machine learning project based on big trajectory data, which is stored in PostgreSQL database and managed by PostGIS.<br></div><div><br></div><div>My project title is to <b>implement a pre-sorting method for PostGIS data types before building GiST</b> <b>index. </b>Some previous research about building GiST indexes in PostGreSQL has been proved that data pre-sorting method will reduce the time of building an index. And the new feature will be added in PostGreSQL 14. So it is necessary to apply this new feature to some basic geometry data type. And my initial proposal is here(<a href="https://docs.google.com/document/d/1_mY_F2hPDk3vmXH5PPp2z9BuQWt-ZMORk6KxtdVQ3HY/edit?usp=sharing" target="_blank">https://docs.google.com/document/d/1_mY_F2hPDk3vmXH5PPp2z9BuQWt-ZMORk6KxtdVQ3HY/edit?usp=sharing</a>). </div><div><br></div><div>I am excited to make a contribution to the open source community. Feel free to give me suggestions or ask me anything! I am looking forward to hearing from you all!</div><div><br></div><div>Best regards,</div><div>Han</div></div>
_______________________________________________<br>
postgis-devel mailing list<br>
<a href="mailto:postgis-devel@lists.osgeo.org" target="_blank">postgis-devel@lists.osgeo.org</a><br>
<a href="https://lists.osgeo.org/mailman/listinfo/postgis-devel" rel="noreferrer" target="_blank">https://lists.osgeo.org/mailman/listinfo/postgis-devel</a><br>
</blockquote></div>
_______________________________________________<br>
postgis-devel mailing list<br>
<a href="mailto:postgis-devel@lists.osgeo.org" target="_blank">postgis-devel@lists.osgeo.org</a><br>
<a href="https://lists.osgeo.org/mailman/listinfo/postgis-devel" rel="noreferrer" target="_blank">https://lists.osgeo.org/mailman/listinfo/postgis-devel</a><br>
</blockquote></div>