关于网友提出的“php如何去除字符串中由于字节丢失造成的乱码字符”问题疑问,本网通过在网上对“php如何去除字符串中由于字节丢失造成的乱码字符”有关的相关答案进行了整理,供用户进行参考,详细问题解答如下:
问题:php如何去除字符串中由于字节丢失造成的乱码字符
描述:比如字符串 "怎么搭配?1212?宿在游戏中" 出现了乱码字符,猜测是字节丢失造成的。这样的字符串构建的xml拿去解析就会XML parse error: not well-formed (invalid token)
,要如何写段程序过滤掉字符串中的这些的字符?
解决方案1:http://php.net/manual/en/function.iconv.php
If you append the string //IGNORE, characters that cannot be represented in the target charset are silently discarded.
解决方案2:出错之后前后字符还能正常,猜测是 UTF-8。那样的话,把不符合 UTF-8 编码的字节删去就行了。具体看 UTF-8 的编码试试。
我不懂 PHP。在 Python 里的话,直接指定编码/解码时出错时如何处理就行了,比如 errors='ignore' 就可以忽略掉乱七八糟的部分。
解决方案3:不是字节丢失,是编码不一致
以上介绍了“php如何去除字符串中由于字节丢失造成的乱码字符”的问题解答,希望对有需要的网友有所帮助。
本文网址链接:http://www.codes51.com/itwd/1495015.html