您现在的位置： Linux教程網 >> UnixLinux > >> Unix知識 >> 關於Unix

適合初學者的Perl的文件操作（2）

讀入多個記錄如果你調用，返回文件中剩余的記錄。如果你處於文件尾，則返回空表： @records = ; if (@records) print "There were ", scalar(@records), " records read.n"; 在下面的一步中，進行賦值和測試兩項工作： if (@records = ) print "There wer
　　讀入多個記錄
　　如果你調用，返回文件中剩余的記錄。如果你處於文件尾，則返回空表：
　　
　　@records = ;
　　
　　if (@records) {
　　
　　print "There were ", scalar(@records), " records read.n";
　　
　　}
　　
　　在下面的一步中，進行賦值和測試兩項工作：
　　
　　if (@records = ) {
　　
　　print "There were ", scalar(@records), " records read.n";
　　
　　}
　　
　　chomp() 也可適用對數組操作：
　　
　　@records = ;
　　
　　chomp(@records);
　　
　　對於任何表達式，都可以進行chomp操作，故你可以在下面的一步中這樣寫：
　　
　　chomp(@records = );
　　
　　什麼是記錄？
　　記錄的缺省定義為：“行”。
　　
　　記錄的定義由$/ 變量控制的，該變量存放所輸入的記錄的分隔符，因為換行符字符(根據定義！)是用來分隔行的，故其缺省值為串“n”。
　　
　　例如，你可以用任何你想要替換的符號來代替“n”。
　　
　　$/ = ";";
　　
　　$record = ; # 讀入下一個用分號分隔的記錄
　　
　　$/可以取其它兩個有趣的值：空串("") 和undef。
　　
　　讀入段落
　　$/ =""的寫法是用來指示Perl讀入段落的，段落是由兩個或兩個以上的換行符構成的文本塊。這不同於設置為"nn"，後者僅讀入由兩行組成的文本塊。在這種情況下，將出現這樣一個問題：如果有連續的空行存在，例如“textnnnn”，你既可以把它解釋為一個段落 ("text")，也可以解釋為兩個段落 ("text", 後面跟兩個換行符，以及一個空段落，後面跟兩個空行。)
　　
　　在讀入文本時，第二個解釋用途不大。如果你正在讀的段落出現上述情況，你不必過濾出“空”段落。
　　
　　$/ = "nn";
　　
　　while () {
　　
　　chomp;
　　
　　next unless length; # 跳過空段
　　
　　# ...
　　
　　}
　　
　　你可以把 $/設置為undef，它用於讀入後面跟著兩個或多個換行符組成的段落： undef $/;
　　
　　while () {
　　
　　chomp;
　　
　　# ...
　　
　　}
　　
　　讀入整個文件
　　$/ 的其它有趣的值為undef。如果設置為該值，就將告訴Perl，讀命令將把文件的剩余部分作為一個串返回：
　　
　　undef $/;
　　
　　$file = ;
　　
　　因為改變了 $/的值，將會影響以後的每次讀操作，而不僅是下一個讀操作。通常，你需要將該操作限制在局部。通過下面的例子，可以把文件句柄的內容讀入到一個串中：
　　
　　{
　　
　　local $/ = undef;
　　
　　$file = ;
　　
　　}
　　
　　記住：Perl變量可讀入很長的串。盡管你的文件大小不可以超出你的虛擬內存容量的限度，你仍可以讀入盡可能多的數據。
　　
　　用正則表達式對文件進行操作
　　一旦你有個包含了整個串的變量，你可以使用正則表達式，對整個文件進行操作，而不是對文件中的某個塊進行操作。有兩個有用的正則表達式標記/s和/m。一般，Perl的正則表達式對行進行處理，你可以這樣寫：
　　
　　undef $/;
　　
　　$line = ;
　　
　　if ($line =~ /(b.*grass)$/) {
　　
　　print "found $1n";
　　
　　}
　　
　　如果把我們的文件填入如下內容：
　　browngrass
　　
　　bluegrass
　　
　　則輸出為：
　　
　　found bluegrass
　　
　　它沒有找到“browngrass”，這是因為$ 僅在串尾尋找其匹配， (或者在串結束前的一行)。如果在包含很多行的串中，用"^" 和"$" 來匹配，, 我們可以使用 /m ("multiline") 選項：
　　
　　if ($line =~ /(b.*grass)$/m) {}
　　
　　現在程序會把如下的信息輸出：
　　
　　found browngrass
　　
　　類似地，句點可以匹配除了換行符之外的所有字符：
　　
　　while () {
　　
　　if (/19(.*)$/) {
　　
　　if ($1 < 20) {
　　
　　$year = 2000+$1;
　　
　　} else {
　　
　　$year = 1900+$1;
　　
　　}
　　
　　}
　　
　　}
　　
　　如果我們從文件中讀入“1981”，$_ 將包含“1981n”。正則表達式中的句點匹配“8”和“1”, 而不匹配“n”。這裡正需要這樣做，因為換行符不是日期的組成部分。
　　
　　對於一個包含很多行的串，我們也許要提取其中的大的塊，這些塊可能會跨越行分隔符。在這種情況下，我們可以使用 /s 選項，並用句點來匹配除了換行符以外的所有字符。
　　
　　if (m{(.*?)}s) {
　　
　　print "Found bold text: $1n";
　　
　　}
　　
　　此處，我用了{}來表示正則表達式的起始和結束，而不用斜槓，所以，我就可以告訴 Perl我正在匹配，起始字符為"m"，結束字符為"s"。你可以把/s 和/m 選項組合使用：
　　
　　if (m{^(.*?)}sm) {
　　
　　# ...
　　
　　}
　　
　　總結
　　有兩種方法打開文件：open()函數的特點是快速簡捷，而sysopen()函數功能強大而復雜。通過操作符，可以讀入一個記錄，$/ 變量可以讓你控制記錄是什麼。如果你打算把很多行的內容讀入到一個串中，不要使用忘記/s和/m 這兩個正則表達式標記。

上一篇文章：適合初學者的Perl的文件操作（1）
下一篇文章： Linux環境中的Mod

關於Unix

功能豐富的Perl：用Perl讀寫Excel文件