Can anyone comment on the accuracy of the Tiger geocoder vs MapMarker?<br><br>Thanks<br>Mark<br><br><div class="gmail_quote">On Tue, Mar 2, 2010 at 11:40 AM, Stephen Woodbridge <span dir="ltr"><<a href="mailto:woodbri@swoodbridge.com">woodbri@swoodbridge.com</a>></span> wrote:<br>
<blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">Hi Kevin,<br>
<br>
I have worked with the Tiger data for about 10 years now. The recent improvements in tiger are really great to see, but not without their own set of issues. Tiger has a lot of known limitations based on the rules, regs and requirements of the US Census. The recent work has georectified the street data and added lots of new streets based on digitizing high-res satellite imagery. but that does not let you read the street names so they are added after the fact. There are a lot of street segments that do not have names. We can only hope that these will be added over time. Because of non-disclosure, address ranges can be weird also. Many small streets have address ranges 1-100 encoded on them, in spite of the fact that the real address ranges only run from 1-20. This has the effect of skewing all the locations to the front end of the street.<br>

<br>
Because language is ambiguous and typos and sounds-like errors, fuzzy searching is employed. Most geocoders do some form of fuzzy searching so you often run into the Main St vs Main Ln issue or you find W Main St when you are search for E Main St.<br>

<br>
When a geocoder says "Found it!", you need to be prepared to say Found What? or be tolerant to mis-geocodes. I like geocoders the score the results and return them in ranked order.<br>
<br>
In general a geocoder can never be better than its data and can in fact be much worse than its data. Fuzzy searching lets you find possible candidates in the data that might not have been encoded correctly in either the input address or the data address, but with the uncertainty that this is the actual location wanted or not.<br>

<br>
You might also want to look at PAGC Geocoder. It is written in C and uses some statistical matching techniques which are very good, There are some change in one of the branches that let you load all the Tiger data for the US.<br>

<br>
<a href="http://www.pagcgeo.org/" target="_blank">http://www.pagcgeo.org/</a><br>
<br>
<br>
-Steve<br>
<br>
<br>
Kevin Galligan wrote:<br>
<blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;"><div class="im">
I actually bought an early access copy of the book.  I work in linux and have been playing around with different geocoders and the tiger files.  Most recently with a ruby geocoder, for no other reason than I'm trying to find one that is fairly complete and functional.<br>

<br>
Any idea how "production quality" this particular one is?  If its fairly high, I'll probably put some time in to get it working on linux.  I have the full 2009 tiger dataset on an EC2 block drive, waiting to import into a different database.<br>

<br>
Right now I'm using zip+4 data to get a rough geocode, which is good enough for what we're doing, but it only gets 92% of our non-PO Box data.  From my experience with the tiger data, it only adds a couple percent at most above that, but the geocoders I've used have been pretty hacky, so its possible that was the issue.  Also, some of them seem to not be concerned with stuff like matching "Main St" when you're looking for "Main Ln", which is pretty terrible.<br>

<br>
On the plus side, if there is major work going on with this geocoder (or any tiger geocoder), I have a huge national data volume that will help stress test the system.<br>
<br>
Recently I've been toying with USC's free geocoder project.  In some areas it actually gets about half of the data I previously could not, which is impressive.<br>
<br>
The really frustrating thing is, in general, the first 90% is cheap/free.  The next 3-4% is marginally expensive.  The rest is really pricey.<br>
<br>
Is there any idea how complete the tiger data is, and why there is this apparent lack of data in there?  I find it strange.  Some streets are just missing.  Stuff like that.<br>
<br>
Rambling.  Anyway, will take a look later.  Thoughts on the quality of the geocoder appreciated.<br>
<br>
-Kevin<br>
<br></div><div><div></div><div class="h5">
On Fri, Feb 26, 2010 at 11:52 PM, Paragon Corporation <<a href="mailto:lr@pcorp.us" target="_blank">lr@pcorp.us</a> <mailto:<a href="mailto:lr@pcorp.us" target="_blank">lr@pcorp.us</a>>> wrote:<br>
<br>
    David,<br>
<br>
    As a matter of fact we've been working on that for chapter 10 of our<br>
    upcoming book and think we have it all working.  As a part of the<br>
    example<br>
    generation process for our chapter 10, we had to come up with a way<br>
    to load<br>
    the tables that works on both windows and Linux.  Unfortunately we<br>
    haven't<br>
    had a chance to test the Linux loading approach, but is pretty much a<br>
    parallel of the windows approach.<br>
<br>
    To do so we started out with Steve's code, added some additional<br>
    skeleton<br>
    tables and a database function that generates a command line script<br>
    for the<br>
    respective OS.  Hopefully it all makes sense from the readme file we<br>
    have<br>
    packaged.<br>
<br>
    We also changed one of the functions because there was an error in<br>
    it and<br>
    revised slightly to work with Tiger 2009 data.  You can dowload our<br>
    slightly<br>
    hacked version of Steve's code from our chapter 10 page.<br>
<br>
    Steve -- if you are listening we are hoping to remerge your version<br>
    with our<br>
    loader part and bring back into the PostGIS distribution as part of<br>
    PostGIS<br>
    1.5.1 or 2.0 release.<br>
<br>
    <a href="http://www.postgis.us/chapter_10" target="_blank">http://www.postgis.us/chapter_10</a><br>
<br>
<br>
    Leo and Regina<br>
    <a href="http://www.postgis.us/" target="_blank">http://www.postgis.us/</a><br>
<br>
<br>
    -----Original Message-----<br>
    From: <a href="mailto:postgis-users-bounces@postgis.refractions.net" target="_blank">postgis-users-bounces@postgis.refractions.net</a><br>
    <mailto:<a href="mailto:postgis-users-bounces@postgis.refractions.net" target="_blank">postgis-users-bounces@postgis.refractions.net</a>><br>
    [mailto:<a href="mailto:postgis-users-bounces@postgis.refractions.net" target="_blank">postgis-users-bounces@postgis.refractions.net</a><br>
    <mailto:<a href="mailto:postgis-users-bounces@postgis.refractions.net" target="_blank">postgis-users-bounces@postgis.refractions.net</a>>] On Behalf Of<br>
    Dave<br>
    Fuhry<br>
    Sent: Friday, February 26, 2010 3:04 PM<br>
    To: PostGIS Users Discussion<br>
    Subject: [postgis-users] TIGER geocoder with Census 2009 shapefiles<br>
<br>
    I'm trying to set up the TIGER geocoder from<br>
    <a href="http://www.snowman.net/git/tiger_geocoder/" target="_blank">http://www.snowman.net/git/tiger_geocoder/</a> which is new and aims to work<br>
    with the new TIGER shapefiles.  I'm trying with the 2009 shapefiles from<br>
    <a href="http://www2.census.gov/geo/tiger/TIGER2009/" target="_blank">www2.census.gov/geo/tiger/TIGER2009/</a><br></div></div>
    <<a href="http://www2.census.gov/geo/tiger/TIGER2009/" target="_blank">http://www2.census.gov/geo/tiger/TIGER2009/</a>>.<div><div></div><div class="h5"><br>
<br>
    I'm not sure how to create the roads_local table (derived closely from<br>
    completechain in the old version).  A join between edges and addr?<br>
<br>
    Wondering if anyone can offer any direction.  A relevant ticket is<br>
    <a href="http://trac.osgeo.org/postgis/ticket/135" target="_blank">http://trac.osgeo.org/postgis/ticket/135</a>.  The out-of-date file<br>
    which used<br>
    to create the roads_local table is tables/roads_local.sql, in the above<br>
    repository.<br>
<br>
    -Dave<br>
<br>
                                          Table "tiger.edges"<br>
      Column   |          Type          |                         Modifiers<br>
    ------------+------------------------+----------------------------------<br>
    ------------+------------------------+--------------------------<br>
     gid        | integer                | not null default<br>
    nextval('public.edges_gid_seq'::regclass)<br>
     statefp    | character varying(2)   |<br>
     countyfp   | character varying(3)   |<br>
     tlid       | bigint                 |<br>
     tfidl      | bigint                 |<br>
     tfidr      | bigint                 |<br>
     mtfcc      | character varying(5)   |<br>
     fullname   | character varying(100) |<br>
     smid       | character varying(22)  |<br>
     lfromadd   | character varying(12)  |<br>
     ltoadd     | character varying(12)  |<br>
     rfromadd   | character varying(12)  |<br>
     rtoadd     | character varying(12)  |<br>
     zipl       | character varying(5)   |<br>
     zipr       | character varying(5)   |<br>
     featcat    | character varying(1)   |<br>
     hydroflg   | character varying(1)   |<br>
     railflg    | character varying(1)   |<br>
     roadflg    | character varying(1)   |<br>
     olfflg     | character varying(1)   |<br>
     passflg    | character varying(1)   |<br>
     divroad    | character varying(1)   |<br>
     exttyp     | character varying(1)   |<br>
     ttyp       | character varying(1)   |<br>
     deckedroad | character varying(1)   |<br>
     artpath    | character varying(1)   |<br>
     persist    | character varying(1)   |<br>
     gcseflg    | character varying(1)   |<br>
     offsetl    | character varying(1)   |<br>
     offsetr    | character varying(1)   |<br>
     tnidf      | bigint                 |<br>
     tnidt      | bigint                 |<br>
     the_geom   | public.geometry        |<br>
<br>
<br>
                                         Table "tiger.addr"<br>
     Column   |         Type          |                         Modifiers<br>
    -----------+-----------------------+------------------------------------<br>
    -----------+-----------------------+-----------------------<br>
     gid       | integer               | not null default<br>
    nextval('public.addr_gid_seq'::regclass)<br>
     tlid      | bigint                |<br>
     fromhn    | character varying(12) |<br>
     tohn      | character varying(12) |<br>
     side      | character varying(1)  |<br>
     zip       | character varying(5)  |<br>
     plus4     | character varying(4)  |<br>
     fromtyp   | character varying(1)  |<br>
     totyp     | character varying(1)  |<br>
     fromarmid | integer               |<br>
     toarmid   | integer               |<br>
     arid      | character varying(22) |<br>
     mtfcc     | character varying(5)  |<br>
     statefp   | character varying(2)  | not null<br>
    _______________________________________________<br>
    postgis-users mailing list<br>
    <a href="mailto:postgis-users@postgis.refractions.net" target="_blank">postgis-users@postgis.refractions.net</a><br></div></div>
    <mailto:<a href="mailto:postgis-users@postgis.refractions.net" target="_blank">postgis-users@postgis.refractions.net</a>><div class="im"><br>
    <a href="http://postgis.refractions.net/mailman/listinfo/postgis-users" target="_blank">http://postgis.refractions.net/mailman/listinfo/postgis-users</a><br>
<br>
<br>
    _______________________________________________<br>
    postgis-users mailing list<br>
    <a href="mailto:postgis-users@postgis.refractions.net" target="_blank">postgis-users@postgis.refractions.net</a><br></div>
    <mailto:<a href="mailto:postgis-users@postgis.refractions.net" target="_blank">postgis-users@postgis.refractions.net</a>><div class="im"><br>
    <a href="http://postgis.refractions.net/mailman/listinfo/postgis-users" target="_blank">http://postgis.refractions.net/mailman/listinfo/postgis-users</a><br>
<br>
<br>
<br>
------------------------------------------------------------------------<br>
<br>
_______________________________________________<br>
postgis-users mailing list<br>
<a href="mailto:postgis-users@postgis.refractions.net" target="_blank">postgis-users@postgis.refractions.net</a><br>
<a href="http://postgis.refractions.net/mailman/listinfo/postgis-users" target="_blank">http://postgis.refractions.net/mailman/listinfo/postgis-users</a><br>
</div></blockquote><div><div></div><div class="h5">
<br>
_______________________________________________<br>
postgis-users mailing list<br>
<a href="mailto:postgis-users@postgis.refractions.net" target="_blank">postgis-users@postgis.refractions.net</a><br>
<a href="http://postgis.refractions.net/mailman/listinfo/postgis-users" target="_blank">http://postgis.refractions.net/mailman/listinfo/postgis-users</a><br>
</div></div></blockquote></div><br><br clear="all"><br>-- <br>Mark Vantzelfde<br>NetMasters, Inc.<br>