<DIV>&nbsp;Hi, all<BR>&nbsp;&nbsp;&nbsp; There are instances that when an HTML file has meta tags, the charset declared in 
<META> tag is not right, because the HTML content next is using a different encoding. But lxml will parse accroding to what 
<META> said. In this situation, it may report error information of error decoding, but some times it can parse, and generate a DOM that is not complete. eg. I have a WEB file has&nbsp; while the following content is encoded with GBK(which is a Supper set of GB2312). We have got a result with only part of the HTML tags parsed out. I wan't to know, if lxml have any warning or error information reported for this situation? What it is? and how can we deal with this kind of fault ? Is there any common method?</DIV>
<DIV>&nbsp;&nbsp; I have also seen some HTML files have <HTML> tag attributes "lang", I don't know whether this attribute is used in the HTML parsing process. In meta tag like 
<META http-equiv="Content-Language" content="zh-cn">, there are also language statement, But in the htmlCheckMeta method of libxml2 library source, I didn't find any processing with the http-equiv attribute value "Content-Language". Is it because that "Content-Language" is not standerd?&nbsp; Is lxml support this attribute? if so , how to deal with the " content="zh-cn"&nbsp; " declaration when it was saying another different language?<BR>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; yours<BR><BR><BR></HTML></DIV><br><!-- footer --><br><span title="neteasefooter"/><hr/>
<a href="http://qiye.163.com/?ft=1">业务订单流失怎么办?</a>
</span>