<div dir="ltr"><div>Hi Martin,<br></div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">On Wed, 24 Aug 2022 at 04:25, Martin Landa <<a href="mailto:landa.martin@gmail.com">landa.martin@gmail.com</a>> wrote:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><div dir="ltr"><br><div>the question is also why we are using default OS encoding to decode HTML pages [1]. Couldn't we simply use UTF-8 regardless of OS system locale?<br></div></div></blockquote><div><br></div><div>This seems to be some general confusion around that, or more likely just some legacy code.</div><div><br></div><div>The lib/gis/parser_html.c puts iso-8859-1 into the HTML files (I just checked that now), so that's what an HTML reader should be using. That's of course not what we want at this point. It just should be UTF-8 everywhere.<br></div><div><br></div><div><meta http-equiv="Content-Type" content="text/html; charset=iso-8859-1">  <br></div><div><br></div><div>The HTML files may already use UTF-8 (?), but the parser may emit HTML in system-dependent encoding. However, the source code it is using should be UTF-8 or more likely it is simply ASCII, so perhaps not much to worry about.</div><div><br></div><div>Vaclav<br></div></div></div>