java – GZIPInputStream填充结束了吗?
内容导读
互联网集市收集整理的这篇技术教程文章主要介绍了java – GZIPInputStream填充结束了吗?,小编现在分享给大家,供广大互联网技能从业者学习和参考。文章包含3174字,纯文字阅读大概需要5分钟。
内容图文
![java – GZIPInputStream填充结束了吗?](/upload/InfoBanner/zyjiaocheng/725/026dc53d0e944af99d239156f363d0f2.jpg)
解压缩文件我遇到了一个奇怪的问题,我正在考虑使用charset UTF-8.我正在使用Guava库.
public static byte[] gzip(final CharSequence cs, final Charset charset) throws IOException {
final ByteArrayOutputStream os = new ByteArrayOutputStream(cs.length());
final GZIPOutputStream gzipOs = new GZIPOutputStream(os);
gzipOs.write(charset.encode(CharBuffer.wrap(cs)).array());
Closeables.closeQuietly(gzipOs);
return os.toByteArray();
}
public static boolean gzipToFile(final CharSequence from, final File to, final Charset charset) {
try {
Files.write(StreamUtils.gzip(from, charset), to);
return true;
} catch (final IOException e) {
// ignore
}
return false;
}
public static String gunzipFromFile(final File from, final Charset charset) {
String str = null;
try {
str = charset.decode(ByteBuffer.wrap(gunzip(Files.toByteArray(from)))).toString();
} catch (final IOException e) {
// ignore
}
return str;
}
public static byte[] gunzip(final byte[] b) throws IOException {
GZIPInputStream gzipIs = null;
final byte[] bytes;
try {
gzipIs = new GZIPInputStream(new ByteArrayInputStream(b));
bytes = ByteStreams.toByteArray(gzipIs);
} finally {
Closeables.closeQuietly(gzipIs);
}
return bytes;
}
这里有一个小JUnit.为了测试,我使用了不同语言的lorem ipsum,如英语,德语,俄语……我首先将原始文本压缩到文件中,然后解压缩文件并将其与原始文本进行比较:
@Test
public void gzip() throws IOException {
final String originalText = Files.toString(ORIGINAL_IPSUM_LOREM, Charsets.UTF_8);
// create temporary file
final File tmpFile = this.tmpFolder.newFile("loremIpsum.txt.gz");
// check if gzip write is OK
final boolean status = StreamUtils.gzipToFile(originalText, tmpFile, Charsets.UTF_8);
Assertions.assertThat(status).isTrue();
Assertions.assertThat(Files.toByteArray(tmpFile)).isEqualTo(Files.toByteArray(GZIPPED_IPSUM_LOREM));
// unzip it again
final String uncompressedString = StreamUtils.gunzipFromFile(tmpFile, Charsets.UTF_8);
Assertions.assertThat(uncompressedString).isEqualTo(originalText);
}
并且JUnit失败了以下:
调试器显示uncompressedText和orignalText之间的区别:
[-17, -69, -65, 76, 111, ... (omitted) ... , -117, 32, -48, -66, -48, -76, -47, -128, 32, -48, -78, -48, -75, -47, -127, 46, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ... (omitted) ... , 0, 0, 0, 0]
..和originalText没有拖尾零:
[-17, -69, -65, 76, 111, ... (omitted) ... , -117, 32, -48, -66, -48, -76, -47, -128, 32, -48, -78, -48, -75, -47, -127, 46]
知道什么可能是错的???谢谢 :-)
解决方法:
我认为问题在于:
charset.encode(CharBuffer.wrap(cs)).array()
array()的javadoc表示它返回ByteBuffer的后备数组.但支持数组可能比缓冲区的有效内容大……我怀疑在这种情况下它是.
FWIW …我怀疑Buffer对象的明确用户和ByteArray流对象正在帮助提高性能.
我怀疑你这样做会更好:
public static boolean gzipToFile(CharSequence from, File to, Charset charset) {
try (FileOutputStream fos = new FileOutputStream(to);
BufferedOutputStream bos = new BufferedOutputStream(fos);
GZIPOutputStream gzos = new GZIPOutputStream(bos);
OutputStreamWriter w = new OutputStreamWriter(gzos, charset)) {
w.append(from);
w.close();
return true;
} catch (final IOException e) {
// ignore
}
return false;
}
(相当于阅读.)
为什么?我怀疑中间ByteArray流的额外副本很可能会抵消使用Buffer获得的潜在加速.
此外,我的直觉是,压缩/解压缩步骤将主导其他任何事情.
内容总结
以上是互联网集市为您收集整理的java – GZIPInputStream填充结束了吗?全部内容,希望文章能够帮你解决java – GZIPInputStream填充结束了吗?所遇到的程序开发问题。 如果觉得互联网集市技术教程内容还不错,欢迎将互联网集市网站推荐给程序员好友。
内容备注
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 gblab@vip.qq.com 举报,一经查实,本站将立刻删除。
内容手机端
扫描二维码推送至手机访问。