首页 > Linux/Unix > linux 压缩解压zip中文名文件,乱码解决

linux 压缩解压zip中文名文件,乱码解决

压缩解压缩的文件中的中文名乱码,是由于windows的文件名中文编码默认为GBK,而Linux中默认文件名编码为UTF8,由于编码不一致,所以导致了文件名乱码的问题,解决这个问题的做法就是对文件名进行转码。(仅仅是对文件名,不是对文件内容)

Linux中专门提供了一种工具convmv进行文件名编码的转换,可以将文件名从GBK转换成UTF-8编码,或者从UTF-8到GBK进行转码。

首先看一下系统上是否安装了convmv,如果没安装的话用:
yum install convmv
安装。
下面看一下convmv的具体用法:

convmv -f 源编码 -t 新编码 [选项] 文件名

常用参数:
-r 递归处理子文件夹
–notest 真正进行操作,请注意在默认情况下是不对文件进行真实操作的,而只是试验。
–list 显示所有支持的编码
–unescap 可以做一下转义,比如把%20变成空格
比如我们有一个utf8编码的文件名,转换成GBK编码,命令如下:

convmv -r -f UTF-8 -t GBK –notest utf8编码的文件名/或者文件夹

如果是-r递归处理的话,文件夹内不能有非源编码的文件,否则会转化失败。
this file was not validly encoded in UTF-8: “searchtoolsExport/��.txt”
To prevent damage to your files, we won’t continue.
First fix this or correct options!

转换以后”utf8编码的文件名”会被转换成GBK编码(只是文件名编码的转换,文件内容不会发生变化)。

然后在进行zip或者tar的打包/压缩,拷贝到windows下,就可以顺利打开,不乱码了。

  1. 还没有评论
评论提交中, 请稍候...

留言

可以使用的标签: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>
Trackbacks & Pingbacks ( 0 )
  1. 还没有 trackbacks