个人工具

解决文件名mp3标签和文本文件内容的乱码问题

来自Ubuntu中文

跳转至: 导航, 搜索

从Windows迁移到Ubuntu的用户,往往会发现自己在Windows在创建/下载/保存的音乐文件出现乱码问题。出现这个问题的原因:一些音乐文件的标签的编码不是Ubuntu使用的UTF-8(一种Unicode编码,适用于所有语言),而是简体中文Windows系统使用的是GBK(一种中国国家标准编码,只适用于简体中文)。所以,只要将标签的编码做一下转换,或者修改音乐播放器默认的标签读取编码,就能解决乱码的问题。

命令行解决方案在Ubuntu使用技巧中已被收录。

转换标签编码法

使用图形界面的EasyTAG工具

安装EasyTAG:

sudo apt-get install easytag 
  • 启动EasyTAG
  • 找到首选项--ID3标签设置--修改下面两项:
  • 读取ID3标签时用的字符集,请选择 简体中文GBK (繁体的应该是BIG5)。
  • 写入ID3标签时用的字符集,ID3v2和ID3v1.x都选成UTF-8。(注:依照Linux Wiki的原理分析,Id3v1写为GBK编码更合适)
  • 然后重启EasyTAG,
  • 然后在主界面双击你的歌曲目录,保存,以后你的mp3在播放器都能正常显示中文了。
  • 该选择和该修改的地方
   Easytag screenshot.png
 对照这个
   Easytag-首选项.png

基于命令行的工具

  • 需要用到的工具
 sudo apt-get install convmv iconv python-mutagen

要转换文件编码请先进入要转换文件的目录

  • 转换文件名由GBK为UTF8
 convmv -r -f cp936 -t utf8 --notest *
  • 转换文件内容由GBK到UTF8
 iconv -f gbk -t utf8 $i > newfile 
  • 转换 mp3 标签编码(下面方法会导致windows和部分移动设备无法正确识别mp3标签,建议使用mid3tagiconv
 find . -iname "*.mp3" -execdir mid3iconv -e GBK {} \;

注意:保证自己对需转换文件有写权限

修改播放器默认编码法

使用工具转换标签的编码对于已有的文件可以解决乱码问题,但是对于新下载的音乐文件,可能需要再次进行转换。所以解决乱码问题的另一种思路是修改音乐播放器默认的标签读取编码。

以用GStreamer作为后端的播放器Rhythmbox为例,可以在系统环境变量(/etc/profile)或用户的环境变量(~/.profile)中增加如下的内容:

 export GST_ID3_TAG_ENCODING=GBK:UTF-8:GB18030
 export GST_ID3V2_TAG_ENCODING=GBK:UTF-8:GB18030

其他播放器可以参考ArchWiki的一个词条中的其他指导。

注:因为修改系统环境变量对系统影响较大,用户可以考虑只修改~/.profile。