JP: Hi! :-D That is a good point. It is not a problem unless they know what the addresses represent. All I need back are the coordinates.<div><br></div><div>Puneet: Thanks, I will keep that in mind, but these are not US addresses.</div>
<div><br></div><div>Cheers,</div><div>JP<br clear="all"><br><div><div class="gmail_quote">On Fri, Feb 4, 2011 at 3:23 PM, JP Glutting <span dir="ltr">&lt;<a href="mailto:jpglutting@gmail.com">jpglutting@gmail.com</a>&gt;</span> wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex;">Thanks for all the responses! I will track them all down and see how they work. <div><br></div><div>Stark, I have 146,472 addresses in the city of Barcelona. Many of them are duplicates, but at the very least I have 31,514 that need to be coded, although that would leave out many that I want to use. I am in the process of developing filters to clean out apartment numbers, etc., to be able to pull a single coordinate for a whole set of addresses, and there are at least 6,000 that are invalid (from the original 146k, so 140k). It is a lot. I will take a look at openaddresses and do some testing. </div>

<div><br></div><div>Thanks!</div><div>JP<font color="#888888"><br>
<br><br></font><div class="gmail_quote"><div><div></div><div class="h5">On Fri, Feb 4, 2011 at 3:10 PM, Stark Hans-Jörg <span dir="ltr">&lt;<a href="mailto:hansjoerg.stark@fhnw.ch" target="_blank">hansjoerg.stark@fhnw.ch</a>&gt;</span> wrote:<br>
</div></div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div><div></div><div class="h5">


<div lang="DE-CH" link="blue" vlink="purple"><div><p class="MsoNormal"><span lang="EN-GB" style="font-size:11.0pt;color:#1F497D">The OpenAddresses project (</span><span style="font-size:11.0pt;color:#1F497D"><a href="http://www.openaddresses.org" target="_blank"><span lang="EN-GB">www.openaddresses.org</span></a></span><span lang="EN-GB" style="font-size:11.0pt;color:#1F497D">) is supposed to solve exactly your problem.</span></p>


<p class="MsoNormal"><span lang="EN-GB" style="font-size:11.0pt;color:#1F497D">You can use the provided geocoding services (</span><a href="http://code.google.com/p/openaddresses/wiki/RESTService" target="_blank"><span lang="EN-GB">http://code.google.com/p/openaddresses/wiki/RESTService</span></a><span lang="EN-GB" style="font-size:11.0pt;color:#1F497D">)</span></p>


<p class="MsoNormal"><span lang="EN-GB" style="font-size:11.0pt;color:#1F497D"> </span></p><p class="MsoNormal"><span lang="EN-GB" style="font-size:11.0pt;color:#1F497D">OpenAddresses has some regions where data was donated – there you will get high-quality results. Unfortunately this is not yet globally available…</span></p>


<p class="MsoNormal"><span lang="EN-GB" style="font-size:11.0pt;color:#1F497D"> </span></p><p class="MsoNormal"><span lang="EN-GB" style="font-size:11.0pt;color:#1F497D">Hth</span></p><p class="MsoNormal"><span lang="EN-GB" style="font-size:11.0pt;color:#1F497D">-hj</span></p>


<div><p class="MsoNormal"><span lang="EN-GB" style="font-size:11.0pt;color:#1F497D"> </span></p><p class="MsoNormal" style="margin-left:35.4pt"><b><span lang="DE" style="font-size:10.0pt">Von:</span></b><span lang="DE" style="font-size:10.0pt"> <a href="mailto:discuss-bounces@lists.osgeo.org" target="_blank">discuss-bounces@lists.osgeo.org</a> [mailto:<a href="mailto:discuss-bounces@lists.osgeo.org" target="_blank">discuss-bounces@lists.osgeo.org</a>] <b>Im Auftrag von </b>JP Glutting<br>


<b>Gesendet:</b> Freitag, 4. Februar 2011 14:34<br><b>An:</b> <a href="mailto:discuss@lists.osgeo.org" target="_blank">discuss@lists.osgeo.org</a><br><b>Betreff:</b> [OSGeo-Discuss] Batch geocoding</span></p><p class="MsoNormal" style="margin-left:35.4pt">


 </p></div><p class="MsoNormal" style="margin-left:35.4pt">Hello, </p><div><div></div><div><div><p class="MsoNormal" style="margin-left:35.4pt"> </p></div><div><p class="MsoNormal" style="margin-left:35.4pt">I have a large set of addresses (around 150k) that I need to geocode for a study (my Masters thesis on heat-related mortality). I am looking into different solutions, but I can&#39;t find anything that seems like it would work properly.</p>


</div><div><p class="MsoNormal" style="margin-left:35.4pt"> </p></div><div><p class="MsoNormal" style="margin-left:35.4pt">I could script a solution using Google&#39;s map API, but there is a limit of 2,500 addreses per day (I can get around them with a little patience). </p>


</div><div><p class="MsoNormal" style="margin-left:35.4pt"> </p></div><div><p class="MsoNormal" style="margin-left:35.4pt">Right now the best solution I am looking at geopy for geocoding addresses (<a href="http://code.google.com/p/geopy/" target="_blank">http://code.google.com/p/geopy/</a>). It seems like a good system, I think I can use it to pull addresses out of my database and write back coordinates. There is one thing that I am not sure, about, though, is whether I am actually allowed to use the Google API without my use being liked to a specific web page. The terms of service and form for getting a Google API key require a URL linked to a Google account. In fact, it looks like the API can only be used through a web site:</p>


</div><div><p class="MsoNormal" style="margin-left:35.4pt"> </p></div><blockquote style="margin-left:30.0pt;margin-right:0cm"><div><p class="MsoNormal" style="margin-left:35.4pt">&quot;<span><span>5.2 <u>Account Key</u>. After supplying Google with your account information and the URL of your Maps API Implementation, and accepting the Terms, you will be issued an alphanumeric key assigned to you by Google that is uniquely associated with your Google Account and the URL of your Maps API Implementation. Your Maps API Implementation must import the Google Maps APIs using this key as described in the <a href="http://code.google.com/apis/maps/documentation/" title="Maps APIs Documentation" target="_blank"><span style="color:#0000CC">Maps APIs Documentation</span></a>, and Google will block requests with an invalid key or invalid URL. You may only obtain and use a key in accordance with these Terms and the <a href="http://code.google.com/apis/maps/documentation/" title="Maps APIs Documentation" target="_blank"><span style="color:#0000CC">Maps APIs Documentation</span></a>.</span></span>&quot;</p>


</div></blockquote><p class="MsoNormal" style="margin-left:35.4pt"> </p><div><p class="MsoNormal" style="margin-left:35.4pt">So it looks like I can&#39;t even get it to work without a URL. </p></div><div><p class="MsoNormal" style="margin-left:35.4pt">


 </p></div><div><p class="MsoNormal" style="margin-left:35.4pt">I can always write a script that loops through results extracted from the database, creates URLs and parses the XML results one at a time, but that seems like a fairly inelegant solution. </p>


</div><div><p class="MsoNormal" style="margin-left:35.4pt"> </p></div><div><p class="MsoNormal" style="margin-left:35.4pt">Does anyone have any good ideas about how to geocode a few thousand addresses?</p></div><div><p class="MsoNormal" style="margin-left:35.4pt">


 </p></div><div><p class="MsoNormal" style="margin-left:35.4pt">Many thanks,</p></div><div><p class="MsoNormal" style="margin-left:35.4pt">JP</p></div></div></div></div></div><br></div></div><div class="im">_______________________________________________<br>



Discuss mailing list<br>
<a href="mailto:Discuss@lists.osgeo.org" target="_blank">Discuss@lists.osgeo.org</a><br>
<a href="http://lists.osgeo.org/mailman/listinfo/discuss" target="_blank">http://lists.osgeo.org/mailman/listinfo/discuss</a><br>
<br></div></blockquote></div><br>
</div>
</blockquote></div><br></div></div>