Even,<br><br>I think I&#39;ve figured this out, in my particular example I had a filename which contained the character &#39;é&#39;  (U+00E9), which in UTF-8 encoding is the two byte sequence 0xC3 0xA9. However, this character is also in the ANSI character set (233 decimal), which explains why passing a &quot;normal&quot; ANSI encoded C String to GDALOpen will open the file. If we instead try a filename with a character that is not in the ANSI character set, for example &#39;ə&#39; (U+0259), then the function will not work (even) with a normal C String.<br>

<br>So the  current Win32 C/C++ API does not support UTF-8 encoded strings. Are you aware of any workarounds that may be available?<br><br>Best Regards,<br>Louis.<br><br> <br><div class="gmail_quote">On Mon, Aug 31, 2009 at 7:19 PM, Even Rouault <span dir="ltr">&lt;<a href="mailto:even.rouault@mines-paris.org">even.rouault@mines-paris.org</a>&gt;</span> wrote:<br>

<blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">Louis, Chaintanya,<br>
<br>
I just wanted to mention that the topic of encoding for filenames dealt by GDAL<br>
or OGR is a known issue that has not been addressed yet. You can read<br>
<a href="http://trac.osgeo.org/gdal/wiki/rfc5_unicode" target="_blank">http://trac.osgeo.org/gdal/wiki/rfc5_unicode</a> which was a proposal but has not<br>
been implemented. Some infrastructure for re-encoding has been introduced during<br>
the implementation of <a href="http://trac.osgeo.org/gdal/wiki/rfc23_ogr_unicode" target="_blank">http://trac.osgeo.org/gdal/wiki/rfc23_ogr_unicode</a> (but<br>
RFC23 only addresses the issue of encoding in OGR field values, not for<br>
filenames)<br>
<br>
My understanding is that :<br>
* on Windows the current API used by GDAL/OGR does not expect UTF8 or Unicode<br>
but ANSI.<br>
* on Linux systems, UTF-8 is now assumed<br>
<br>
Best regards,<br>
<br>
Even<br>
<br>
Selon Lodewijk Pool &lt;<a href="mailto:louis.pool@gmail.com">louis.pool@gmail.com</a>&gt;:<br>
<div><div></div><div class="h5"><br>
&gt; Hi Chaitanya,<br>
&gt;<br>
&gt; I appreciate you taking the time to check. The TAB extension is MapInfo&#39;s<br>
&gt; vector file format. The odd thing is that I did exactly the same test as you<br>
&gt; did, I renamed a GeoTiff file to the offending filename and tried the normal<br>
&gt; Raster Driver and got the same problem. Still, as far as you aware these<br>
&gt; functions should support UTF-8 encoded strings?  There could possibly be a<br>
&gt; peculiarity in the way I pack UTF-8 strings, though I am reasonably certain<br>
&gt; that they are encoded correctly.<br>
&gt;<br>
&gt; Could you perhaps send me the code snippet you used to test the<br>
&gt; functionality (the part where you pass the string to GDALOpen). Do you think<br>
&gt; there is a chance that my compiled version may differ from your own, i.e. is<br>
&gt; it possible that I compiled a version of GDAL without UTF support?<br>
&gt;<br>
&gt; Best Regards,<br>
&gt; Louis.<br>
&gt;<br>
&gt; On Mon, Aug 31, 2009 at 6:35 PM, Chaitanya kumar CH<br>
&gt; &lt;<a href="http://chaitanya.ch" target="_blank">chaitanya.ch</a>@<a href="http://gmail.com" target="_blank">gmail.com</a>&gt;wrote:<br>
&gt;<br>
&gt; &gt; Louis,<br>
&gt; &gt;<br>
&gt; &gt; I couldn&#39;t reproduce the problem on my WinXP-32 system with vc8 with locale<br>
&gt; &gt; set to uk english. However, I used the filename on a GeoTiff file. I<br>
&gt; &gt; couldn&#39;t identify the .TAB extension. I am not sure that is a problem.<br>
&gt; &gt;<br>
&gt; &gt; Some of the drivers may not handle non-ascii data but file names should not<br>
&gt; &gt; be a problem.<br>
&gt; &gt;<br>
&gt; &gt; If you don&#39;t find any problem at your application side, submit a bug report<br>
&gt; &gt; at <a href="http://trac.osgeo.org/gdal/" target="_blank">http://trac.osgeo.org/gdal/</a><br>
&gt; &gt;<br>
&gt; &gt;<br>
&gt; &gt; On Mon, Aug 31, 2009 at 8:02 PM, Lodewijk Pool &lt;<a href="mailto:louis.pool@gmail.com">louis.pool@gmail.com</a>&gt;wrote:<br>
&gt; &gt;<br>
&gt; &gt;&gt; Hi Chaitanya,<br>
&gt; &gt;&gt;<br>
&gt; &gt;&gt; Yes, this is using the C/C++ API, the functions I am using are declared in<br>
&gt; &gt;&gt; *gdal.h* and *ogrsf_frmts.h* respectively. I am using WinXP 32bit (UK<br>
&gt; &gt;&gt; English locale) and a version of GDAL 1.6.2 that I compiled for Win32<br>
&gt; using<br>
&gt; &gt;&gt; the supplied nmake script files for VC8. The specific filename that is<br>
&gt; &gt;&gt; causing me problems is this one; *&quot;découpage_geographique.TAB&quot;*. If I<br>
&gt; &gt;&gt; remove the &#39;é&#39; character in that string and replace it with a normal &#39;e&#39;<br>
&gt; the<br>
&gt; &gt;&gt; file opens without any problems.<br>
&gt; &gt;&gt;<br>
&gt; &gt;&gt; Any help would be appreciated.<br>
&gt; &gt;&gt;<br>
&gt; &gt;&gt; Best Regards,<br>
&gt; &gt;&gt; Louis.<br>
&gt; &gt;&gt;<br>
&gt; &gt;&gt;<br>
&gt; &gt;&gt;<br>
&gt; &gt;&gt;<br>
&gt; &gt;&gt;<br>
&gt; &gt;&gt; On Mon, Aug 31, 2009 at 4:10 PM, Chaitanya kumar CH &lt;<a href="http://chaitanya.ch" target="_blank">chaitanya.ch</a>@<br>
&gt; &gt;&gt; <a href="http://gmail.com" target="_blank">gmail.com</a>&gt; wrote:<br>
&gt; &gt;&gt;<br>
&gt; &gt;&gt;&gt; Louis,<br>
&gt; &gt;&gt;&gt;<br>
&gt; &gt;&gt;&gt; GDAL/OGR usually supports utf-8 encoding. I just don&#39;t know where it<br>
&gt; &gt;&gt;&gt; doesn&#39;t support.<br>
&gt; &gt;&gt;&gt; Can you provide the details of the OS you are working on? Also, some<br>
&gt; &gt;&gt;&gt; sample file names that caused you problems will come handy.<br>
&gt; &gt;&gt;&gt; I presume you are working in C/C++.<br>
&gt; &gt;&gt;&gt;<br>
&gt; &gt;&gt;&gt; On Mon, Aug 31, 2009 at 6:37 PM, Lodewijk Pool<br>
&gt; &lt;<a href="mailto:louis.pool@gmail.com">louis.pool@gmail.com</a>&gt;wrote:<br>
&gt; &gt;&gt;&gt;<br>
&gt; &gt;&gt;&gt;&gt; Hi All,<br>
&gt; &gt;&gt;&gt;&gt;<br>
&gt; &gt;&gt;&gt;&gt; I&#39;m having problems opening Raster and Vector Datasources that have<br>
&gt; &gt;&gt;&gt;&gt; filenames and paths with special characters. I&#39;m using GDALOpen for<br>
&gt; Raster<br>
&gt; &gt;&gt;&gt;&gt; sources and OGRSFDriverRegistrar::Open() for Vector sources, the strings<br>
&gt; I<br>
&gt; &gt;&gt;&gt;&gt; pass for the filenames are UTF-8 encoded. Does anyone know whether these<br>
&gt; &gt;&gt;&gt;&gt; functions support UTF-8 encoding, and if not, whether there are any<br>
&gt; other<br>
&gt; &gt;&gt;&gt;&gt; API entry points that do support UTF-8 and/or UTF-16?<br>
&gt; &gt;&gt;&gt;&gt;<br>
&gt; &gt;&gt;&gt;&gt; Thank you in advance,<br>
&gt; &gt;&gt;&gt;&gt; Louis.<br>
&gt; &gt;&gt;&gt;&gt;<br>
&gt; &gt;&gt;&gt;&gt;  _______________________________________________<br>
&gt; &gt;&gt;&gt;&gt; gdal-dev mailing list<br>
&gt; &gt;&gt;&gt;&gt; <a href="mailto:gdal-dev@lists.osgeo.org">gdal-dev@lists.osgeo.org</a><br>
&gt; &gt;&gt;&gt;&gt; <a href="http://lists.osgeo.org/mailman/listinfo/gdal-dev" target="_blank">http://lists.osgeo.org/mailman/listinfo/gdal-dev</a><br>
&gt; &gt;&gt;&gt;&gt;<br>
&gt; &gt;&gt;&gt;<br>
&gt; &gt;&gt;&gt;<br>
&gt; &gt;&gt;&gt;<br>
&gt; &gt;&gt;&gt; Best regards,<br>
&gt; &gt;&gt;&gt; --<br>
&gt; &gt;&gt;&gt; Chaitanya kumar CH.<br>
&gt; &gt;&gt;&gt;<br>
&gt; &gt;&gt;<br>
&gt; &gt;&gt;<br>
&gt; &gt;<br>
&gt; &gt;<br>
&gt; &gt; Best regards,<br>
&gt; &gt; --<br>
&gt; &gt; Chaitanya kumar CH.<br>
&gt; &gt;<br>
&gt;<br>
<br>
<br>
</div></div></blockquote></div><br>