<html>
  <head>

  </head>
  <body style="font-weight: normal; font-family: Comic Sans MS; margin-bottom: 1px; margin-left: 4px; font-style: normal; line-height: normal; margin-top: 4px; margin-right: 4px; font-variant: normal; font-size: 12pt">
    <p style="margin-bottom: 0; margin-top: 0">
      <font face="Comic Sans MS" size="3">All&#44;</font>    </p>
<br>      
    <p style="margin-bottom: 0; margin-top: 0">
      <font face="Comic Sans MS" size="3">I did something similar to this a couple of years ago &#40;for fun of all things&#41; where I parsed a Craigslist listing&#44; and used the city location information &#40;I used a Census Placename SHP file I think&#41; to plot a location for each item for sale on a map. &nbsp;The plan at the time was to mapify Craigslist and be able to do geo-filtered queries. &nbsp;I gotrlb.sharedgeo.o it to work&#44; but got onto other things and never went back to it.</font>    </p>
<br>      
    <p style="margin-bottom: 0; margin-top: 0">
      <font face="Comic Sans MS" size="3">I used PERL&#44; and as I recall&#44; it wasn&#39;t that long of a script&#44; maybe 50 lines or so. &nbsp;I can look for the code if there is interest.</font>    </p>
<br>      
    <p style="margin-bottom: 0; margin-top: 0">
      <font face="Comic Sans MS" size="3">bobb</font>    </p>
<br>      
    <p style="margin-bottom: 0; margin-top: 0">
      <br>
      <br>
      &gt;&gt;&gt; Stephen Woodbridge &lt;woodbri@swoodbridge.com&gt; wrote:<br>    </p>
    <table style="margin-bottom: 0; margin-left: 15px; margin-top: 0; margin-right: 0; font-size: 1em" border="0" bgcolor="#f3f3f3">
      <tr>
        <td>
          <div style="border-left: solid 1px #050505; padding-left: 7px">
            <p style="margin-bottom: 0; margin-top: 0">
              Here are some more links that you might find useful.<br><br><a href="http://www.biomedcentral.com/1471-2105/10/385">http://www.biomedcentral.com/1471-2105/10/385</a><br><a href="http://www.ijcte.org/papers/005.pdf">http://www.ijcte.org/papers/005.pdf</a><br><a href="http://www.e-perimetron.org/Vol_4_1/Martins_et_al.pdf">http://www.e-perimetron.org/Vol_4_1/Martins_et_al.pdf</a><br><a href="http://nltk.googlecode.com/svn/trunk/doc/book/ch07.html">http://nltk.googlecode.com/svn/trunk/doc/book/ch07.html</a><br><br>I can not find a potentially excelent reference that was done by about 5<br>years ago by maybe a GSoC student that I think then hired on with<br>Google&#44; but the basically he wrote a document parser that looked for<br>location references in the text and then tagged the document with<br>locations and lat/longs. If I remember correctly it as a gazetteer based<br>system and it is open source and was online somewhere also.<br><br>-Steve<br><br>On 1/13/2012 6:00 PM&#44; slesage wrote:<br>&gt; Hi&#44;<br>&gt;<br>&gt; does anybody knows about some opensource software dedicated to automatic<br>&gt; geocoding of text documents &#63; The idea of that &quot;black box&quot; would be:<br>&gt; &#42; give&#44; as an input&#44; a text document or a PDF&#44;<br>&gt; &#42; receive&#44; as an output&#44; a list of place names with their coordinates /<br>&gt; a map of POI corresponding to that places.<br>&gt;<br>&gt; Using the geonames database &#40;http://www.geonames.org/&#41;&#44; the solution<br>&gt; appears to be only a fulltext search&#44; that could be done using Lucene<br>&gt; &#40;https://lucene.apache.org/java/docs/index.html&#41;.<br>&gt;<br>&gt; I found the metacarta solution<br>&gt; &#40;http://www.metacarta.com/products-platform-geotag.htm&#41; but couldn&#39;t<br>&gt; find any opensource solution.<br>&gt;<br>&gt; Thanks for your suggestions.<br>&gt;<br>&gt; Sylvain Lesage.<br>&gt; _______________________________________________<br>&gt; Discuss mailing list<br>&gt; Discuss@lists.osgeo.org<br>&gt; <a href="http://lists.osgeo.org/mailman/listinfo/discuss">http://lists.osgeo.org/mailman/listinfo/discuss</a><br><br>_______________________________________________<br>Discuss mailing list<br>Discuss@lists.osgeo.org<br><a href="http://lists.osgeo.org/mailman/listinfo/discuss">http://lists.osgeo.org/mailman/listinfo/discuss</a><br>
            </p>
          </div>
        </td>
      </tr>
    </table>
  </body>
</html>