如何将windows-1250 / Cp1250中编码的String转换为utf-8?

正如标题所说…… 我从htto响应中读到了内容 InputStream is = response.getEntity().getContent(); String cw = IOUtils.toString(is); byte[] b = cw.getBytes(Cp1250); String x = StringUtils.newStringUtf8(b);

正如标题所说……

我从htto响应中读到了内容

  InputStream is = response.getEntity().getContent();
    String cw = IOUtils.toString(is);
    byte[] b = cw.getBytes("Cp1250");
    String x = StringUtils.newStringUtf8(b);
    String content = new String(b,"UTF-8");

    System.out.println(content);

我尝试了很多变化.我对用作字符串的正确编码常量有点困惑. windows-1250或Cp1250. UTF-8或utf-8还是utf8?

您似乎认为String对象具有编码.那不对.编码用作从二进制数据(byte []或InputStream)到文本数据(String或char []等)的转换的一部分.

目前尚不清楚IOUtils.toString正在做什么,但它几乎肯定会丢失数据或至少不恰当地处理它.如果您的数据最初是在Windows-1250中,那么您应该使用包装InputStream的InputStreamReader,在InputStreamReader构造函数调用中指定charset.

目前尚不清楚UTF-8的用武之地 – 您可能希望之后以UTF-8写出数据,但结果将是byte [],而不是字符串.

作者: dawei

【声明】:永州站长网内容转载自互联网,其相关言论仅代表作者个人观点绝非权威,不代表本站立场。如您发现内容存在版权问题,请提交相关链接至邮箱:bqsm@foxmail.com,我们将及时予以处理。

为您推荐

联系我们

联系我们

0577-28828765

在线咨询: QQ交谈

邮箱: xwei067@foxmail.com

工作时间:周一至周五,9:00-17:30,节假日休息

返回顶部