<div>Norman, You mentioned a bot (a web crawler) which probably needs a gatherer component to 'harvest' metadata (aka 'deep web' crawler) using one of these protocols (CSW, WFS or OAI-PMH). </div>
<div>&nbsp;</div>
<div>What I am currently thinking about here - inspired by OAI-PMH and Dublin Core - is a) do we need persistent metadata identifiers, b)&nbsp;is an attribute&nbsp;indicating protocol&nbsp;enough as an entry point to 'discover and bind' even specific services like WMS and later on SOAP (according to &quot;occam's razor prinziple&quot; or to the parsimonious approoach)?
</div>
<div>&nbsp;</div>
<div>Or did you mean to spidering also through HTML pages as a 'focused crawler'? If yes, I know Heritrix and I am sure there are some tools around at OAI-PMH tools page. What do you plan to use?</div>
<div>&nbsp;</div>
<div>-- Stefan</div>