<html>
  <head>

  </head>
  <body style="font-weight: normal; font-size: 12pt; margin-bottom: 1px; margin-left: 4px; font-family: Comic Sans MS; font-variant: normal; font-style: normal; margin-top: 4px; line-height: normal; margin-right: 4px">
    <p style="margin-top: 0; margin-bottom: 0">
      <font size="3" face="Comic Sans MS">All&#44;</font>    </p>
<br>      
    <p style="margin-top: 0; margin-bottom: 0">
      <font size="3" face="Comic Sans MS">I&#39;m working on a similar project currently. &nbsp;Setting up 50tb of storage&#44; we went the route of multiple CPUs&#44; with large disks. &nbsp;&nbsp;Redundant raid config&#44; so half of physical disk available for storage. &nbsp;We&#39;re in the 30&#43;tb of real storage across a 4U setup right now. &nbsp;Cost &#40;with hardware/setup/initial config&#41; is below those numbers below &#40;so far&#41;&#44; because we&#39;re building from scratch and learning along the way.</font>    </p>
<br>      
    <p style="margin-top: 0; margin-bottom: 0">
      <font size="3" face="Comic Sans MS">I would tend to agree on not using the off site stuff&#44; just considering the moving of the data and the idea of co-lo to some other remote location starts to fall apart. &nbsp;&nbsp;The transfer costs&#44; in bandwidth and/or time&#44; really start to eat into things cost wise. &nbsp;Some of this depends on the end uses as well. &nbsp;We&#39;re building a data site for distribution of really large files and datasets.</font>    </p>
<br>      
    <p style="margin-top: 0; margin-bottom: 0">
      <font size="3" face="Comic Sans MS">bobb</font>    </p>
    <p style="margin-top: 0; margin-bottom: 0">
      <br>
      <br>
      &gt;&gt;&gt; Paul Spencer &lt;pspencer@dmsolutions.ca&gt; wrote:<br>    </p>
    <table bgcolor="#f3f3f3" border="0" style="font-size: 1em; margin-bottom: 0; margin-left: 15px; margin-top: 0; margin-right: 0">
      <tr>
        <td>
          <div style="border-left: solid 1px #050505; padding-left: 7px">
            <p style="margin-top: 0; margin-bottom: 0">
              Hi&#44;<br><br>I would personally recommend against AWS S3/EBS for anything of this scale as the I/O is pretty pathetic unless you invest in their very high end instances.&#160;&#32;We&#39;ve set up a 4TB &#39;SAN&#39; using glusterfs on AWS EC2 using 1TB EBS volumes and separate instances for each - the performance has been so poor that we have had to redesign our workflow to get copies of data onto EBS attached to each mapserver instance - for scaling that sucks and even then the I/O performance of EBS is not that great on the normal instances.<br><br>I&#39;m not a hardware guy but I think the purpose of a dedicated SAN box is to provide high bandwidth access to large amounts storage so that the data can effectively be distributed to/from multiple machines over a network - ideal for scaling mapserver onto multiple servers but rendering from the same data.&#160;&#32;I&#160;&#32;read an article about a year ago from a company that provides petabyte storage for online storage&#44; it details how they built their storage devices - they say &#36;7867 for 67 terabytes<br><br><a href="http://blog.backblaze.com/2009/09/01/petabytes-on-a-budget-how-to-build-cheap-cloud-storage/">http://blog.backblaze.com/2009/09/01/petabytes-on-a-budget-how-to-build-cheap-cloud-storage/</a><br><br>Seems pretty geeky&#44; but perhaps you are the hardware type or know someone who is :&#41;<br><br><br>On 2011-01-28&#44; at 3:41 AM&#44; tigana.fluens@gmail.com wrote:<br><br>&gt; Hello guys&#44; we&#39;re a startup and new to mapserver. We&#39;re expecting large amounts of data to come by &#40;at least on our scale&#41; around 40-60TB of raster images for mapserver to render. My question is for the infrastructure&#44; what is the best way to store this &#40;cost-efficiently&#41;&#63;<br>&gt;<br>&gt; - Do we just get a dedicated server with a lot of HDDs&#63; I&#39;m looking at a 48TB setup in RAID 1&#43;0 so i get 24TB right what happens now if we need more&#63; Also&#44; how can we scale from the mapserver side&#63;&#160;&#32;Is access to different storage servers possible&#63;<br>&gt; - I&#39;ve considered SANs but then it&#39;s not practical right because only one machine will access the storage&#63;<br>&gt; - What about Amazon&#39;s S3&#63; or EBS&#63; Anything we can use on that&#63;<br>&gt;<br>&gt; I wish to get awesome advice on this storage issue&#44; basically what the considered best practice is for the mapserver people :P Thanks<br>&gt; _______________________________________________<br>&gt; mapserver-users mailing list<br>&gt; mapserver-users@lists.osgeo.org<br>&gt; <a href="http://lists.osgeo.org/mailman/listinfo/mapserver-users">http://lists.osgeo.org/mailman/listinfo/mapserver-users</a><br><br><br>__________________________________________<br><br>&#160;&#160;&#32;Paul Spencer<br>&#160;&#160;&#32;Chief Technology Officer<br>&#160;&#160;&#32;DM Solutions Group Inc<br>&#160;&#160;&#32;<a href="http://research.dmsolutions.ca/">http://research.dmsolutions.ca/</a><br><br>_______________________________________________<br>mapserver-users mailing list<br>mapserver-users@lists.osgeo.org<br><a href="http://lists.osgeo.org/mailman/listinfo/mapserver-users">http://lists.osgeo.org/mailman/listinfo/mapserver-users</a><br>
            </p>
          </div>
        </td>
      </tr>
    </table>
  </body>
</html>