歡迎來到Linux教程網
Linux教程網
Linux教程網
Linux教程網
Linux教程網 >> Linux編程 >> Linux編程 >> Python讀取中文字符編碼問題

Python讀取中文字符編碼問題

日期:2017/3/1 9:28:39   编辑:Linux編程

preface:許久沒遇到過編碼問題,一沒注意就被絆倒腳了。。

一、編輯器是以ASICC編碼格式的,若想在程序中有中文,需要改為utf-8格式,加入如下代碼可破:

import sys
reload(sys)
sys.setdefaultencoding('utf8')

或者參考轉載的這篇 http://www.linuxidc.com/Linux/2015-06/118734.htm,另外一種方式可破。

二、讀取中文文檔時,鹵主天真的以為字符長度是根據中文長度來著,但是讀入後發現是根據字符長度來著,一個中文字長度字符長度為3。發現codecs可破:

import codecs
with codecs.open("XXX.txt", encoding = "utf-8") as f:
text = f.readlines()
for i in text:
i = i.strip("\n")
print i,len(i)

無需操作系統直接運行 Python 代碼 http://www.linuxidc.com/Linux/2015-05/117357.htm

CentOS上源碼安裝Python3.4 http://www.linuxidc.com/Linux/2015-01/111870.htm

《Python核心編程 第二版》.(Wesley J. Chun ).[高清PDF中文版] http://www.linuxidc.com/Linux/2013-06/85425.htm

《Python開發技術詳解》.( 周偉,宗傑).[高清PDF掃描版+隨書視頻+代碼] http://www.linuxidc.com/Linux/2013-11/92693.htm

Python腳本獲取Linux系統信息 http://www.linuxidc.com/Linux/2013-08/88531.htm

在Ubuntu下用Python搭建桌面算法交易研究環境 http://www.linuxidc.com/Linux/2013-11/92534.htm

Python 語言的發展簡史 http://www.linuxidc.com/Linux/2014-09/107206.htm

Python 的詳細介紹:請點這裡
Python 的下載地址:請點這裡

Copyright © Linux教程網 All Rights Reserved