Linux教程網 >> Linux基礎 >> Linux教程 >> Vim顯示utf-8文檔亂碼解決方法

Vim顯示utf-8文檔亂碼解決方法

日期：2017/2/28 14:29:20 编辑：Linux教程

1.相關基礎知識介紹

在Vim中，有四個與編碼有關的選項，它們是：fileencodings、fileencoding、encoding和termencoding。在實際使用中，任何一個選項出現錯誤，都會導致出現亂碼。因此，每一個Vim用戶都應該明確這四個選項的含義。下面，我們詳細介紹一下這四個選項的含義和作用。

（1）encoding

encoding是Vim內部使用的字符編碼方式。當我們設置了encoding之後，Vim內部所有的buffer、寄存器、腳本中的字符串等，全都使用這個編碼。Vim 在工作的時候，如果編碼方式與它的內部編碼不一致，它會先把編碼轉換成內部編碼。如果工作用的編碼中含有無法轉換為內部編碼的字符，在這些字符就會丟失。因此，在選擇 Vim 的內部編碼的時候，一定要使用一種表現能力足夠強的編碼，以免影響正常工作。

由於encoding選項涉及到Vim中所有字符的內部表示，因此只能在Vim啟動的時候設置一次。在Vim工作過程中修改encoding會造成非常多的問題。用戶手冊上建議只在 .vimrc中改變它的值，事實上似乎也只有在 .vimrc中改變它的值才有意義。如果沒有特別的理由，請始終將encoding設置為utf-8。為了避免在非UTF-8的系統如Windows下，菜單和系統提示出現亂碼，可同時做這幾項設置：

set encoding=utf-8

set langmenu=zh_CN.UTF-8

language message zh_CN.UTF-8

（2）termencoding

termencoding是Vim用於屏幕顯示的編碼，在顯示的時候，Vim會把內部編碼轉換為屏幕編碼，再用於輸出。內部編碼中含有無法轉換為屏幕編碼的字符時，該字符會變成問號，但不會影響對它的編輯操作。如果termencoding沒有設置，則直接使用encoding不進行轉換。

舉個例子，當你在Windows下通過telnet登錄Linux工作站時，由於Windows的telnet是GBK編碼的，而Linux下使用UTF-8編碼，你在telnet下的Vim中就會亂碼。此時有兩種消除亂碼的方式：一是把Vim的encoding改為gbk，另一種方法是保持encoding為utf-8，把termencoding改為gbk，讓Vim在顯示的時候轉碼。顯然，使用前一種方法時，如果遇到編輯的文件中含有GBK無法表示的字符時，這些字符就會丟失。但如果使用後一種方法，雖然由於終端所限，這些字符無法顯示，但在編輯過程中這些字符是不會丟失的。

對於圖形界面下的GVim，它的顯示不依賴TERM，因此termencoding對於它沒有意義。在GTK2下的GVim 中，termencoding永遠是utf-8，並且不能修改。而Windows下的GVim則忽略termencoding的存在。

（3）fileencoding

當Vim從磁盤上讀取文件的時候，會對文件的編碼進行探測。如果文件的編碼方式和Vim的內部編碼方式不同，Vim就會對編碼進行轉換。轉換完畢後，Vim會將fileencoding選項設置為文件的編碼。當Vim存盤的時候，如果encoding和fileencoding不一樣，Vim就會進行編碼轉換。因此，通過打開文件後設置fileencoding，我們可以將文件由一種編碼轉換為另一種編碼。但是，由前面的介紹可以看出，fileencoding是在打開文件的時候，由Vim進行探測後自動設置的。因此，如果出現亂碼，我們無法通過在打開文件後重新設置fileencoding來糾正亂碼。

簡而言之，fileencoding是Vim中當前編輯的文件的字符編碼方式，Vim保存文件時也會將文件保存為這種字符編碼方式 (不管是否新文件都如此)。

（4）fileencodings

編碼的自動識別是通過設置fileencodings實現的，注意是復數形式。fileencodings是一個用逗號分隔的列表，列表中的每一項是一種編碼的名稱。當我們打開文件的時候，VIM按順序使用fileencodings中的編碼進行嘗試解碼，如果成功的話，就使用該編碼方式進行解碼，並將fileencoding設置為這個值，如果失敗的話，就繼續試驗下一個編碼。

因此，我們在設置fileencodings的時候，一定要把要求嚴格的、當文件不是這個編碼的時候更容易出現解碼失敗的編碼方式放在前面，把寬松的編碼方式放在後面。例如，latin1是一種非常寬松的編碼方式，任何一種編碼方式得到的文本，用latin1進行解碼，都不會發生解碼失敗——當然，解碼得到的結果自然也就是理所當然的“亂碼”。因此，如果你把latin1放到了fileencodings的第一位的話，打開任何中文文件都是亂碼也就是理所當然的了。

--------------------------------------分割線 --------------------------------------

把VIM打造成一個簡單實用的IDE http://www.linuxidc.com/Linux/2011-06/37032.htm

Vim學習指南 http://www.linuxidc.com/Linux/2013-08/89096.htm

快速學會 Vi編輯器 http://www.linuxidc.com/Linux/2013-08/88586.htm

強大的Vim 編輯器 http://www.linuxidc.com/Linux/2013-07/87544.htm

在CentOS 6.2上搭建Vim開發環境 http://www.linuxidc.com/Linux/2013-07/87363.htm

CentOS 5.4 安裝高亮Vim編輯工具 http://www.linuxidc.com/Linux/2013-06/86508.htm

Vim技巧分享:C語言設置 http://www.linuxidc.com/Linux/2012-12/77124.htm

Ubuntu中設置Vim的行號 http://www.linuxidc.com/Linux/2012-12/75485.htm

Vim編輯器使用基礎教程 http://www.linuxidc.com/Linux/2013-05/84031.htm

--------------------------------------分割線 --------------------------------------

以下是網上推薦的一個fileencodings設置：