歡迎來到Linux教程網
Linux教程網
Linux教程網
Linux教程網
Linux教程網 >> Linux編程 >> PERL編程 >> 適合初學者的Perl的文件操作(2)

適合初學者的Perl的文件操作(2)

日期:2017/2/27 9:26:58   编辑:PERL編程
  讀入多個記錄   如果你調用,返回文件中剩余的記錄。如果你處於文件尾,則返回空表:     @records = ;     if (@records) {     print "There were ", scalar(@records), " records read.n";     }     在下面的一步中,進行賦值和測試兩項工作:     if (@records = ) {     print "There were ", scalar(@records), " records read.n";     }     chomp() 也可適用對數組操作:     @records = ;     chomp(@records);     對於任何表達式,都可以進行chomp操作,故你可以在下面的一步中這樣寫:     chomp(@records = );     什麼是記錄?   記錄的缺省定義為:“行”。     記錄的定義由$/ 變量控制的,該變量存放所輸入的記錄的分隔符,因為換行符字符(根據定義!)是用來分隔行的,故其缺省值為串“n”。     例如,你可以用任何你想要替換的符號來代替“n”。     $/ = ";";     $record = ; # 讀入下一個用分號分隔的記錄     $/可以取其它兩個有趣的值:空串("") 和undef。     讀入段落   $/ =""的寫法是用來指示Perl讀入段落的,段落是由兩個或兩個以上的換行符構成的文本塊。這不同於設置為"nn",後者僅讀入由兩行組成的文本塊。在這種情況下,將出現這樣一個問題:如果有連續的空行存在,例如“textnnnn”,你既可以把它解釋為一個段落 ("text"),也可以解釋為兩個段落 ("text", 後面跟兩個換行符,以及一個空段落,後面跟兩個空行。)     在讀入文本時,第二個解釋用途不大。如果你正在讀的段落出現上述情況,你不必過濾出“空”段落。     $/ = "nn";     while () {     chomp;     next unless length; # 跳過空段     # ...     }     你可以把 $/設置為undef,它用於讀入後面跟著兩個或多個換行符組成的段落: undef $/;     while () {     chomp;     # ...     }     讀入整個文件   $/ 的其它有趣的值為undef。如果設置為該值,就將告訴Perl,讀命令將把文件的剩余部分作為一個串返回:     undef $/;     $file = ;     因為改變了 $/的值,將會影響以後的每次讀操作,而不僅是下一個讀操作。通常,你需要將該操作限制在局部。通過下面的例子,可以把文件句柄的內容讀入到一個串中:     {     local $/ = undef;     $file = ;     }     記住:Perl變量可讀入很長的串。盡管你的文件大小不可以超出你的虛擬內存容量的限度,你仍可以讀入盡可能多的數據。     用正則表達式對文件進行操作   一旦你有個包含了整個串的變量,你可以使用正則表達式,對整個文件進行操作,而不是對文件中的某個塊進行操作。有兩個有用的正則表達式標記/s和/m。一般,Perl的正則表達式對行進行處理,你可以這樣寫:     undef $/;     $line = ;     if ($line =~ /(b.*grass)$/) {     print "found $1n";     }     如果把我們的文件填入如下內容:   browngrass     bluegrass     則輸出為:     found bluegrass     它沒有找到“browngrass”,這是因為$ 僅在串尾尋找其匹配, (或者在串結束前的一行)。如果在包含很多行的串中,用"^" 和"$" 來匹配,, 我們可以使用 /m ("multiline") 選項:     if ($line =~ /(b.*grass)$/m) {}     現在程序會把如下的信息輸出:     found browngrass     類似地,句點可以匹配除了換行符之外的所有字符:     while () {     if (/19(.*)$/) {     if ($1 < 20) {     $year = 2000+$1;     } else {     $year = 1900+$1;     }     }     }     如果我們從文件中讀入“1981”,$_ 將包含“1981n”。正則表達式中的句點匹配“8”和“1”, 而不匹配“n”。這裡正需要這樣做,因為換行符不是日期的組成部分。     對於一個包含很多行的串,我們也許要提取其中的大的塊,這些塊可能會跨越行分隔符。在這種情況下,我們可以使用 /s 選項,並用句點來匹配除了換行符以外的所有字符。     if (m{(.*?)}s) {     print "Found bold text: $1n";     }     此處,我用了{}來表示正則表達式的起始和結束,而不用斜槓,所以,我就可以告訴 Perl我正在匹配,起始字符為"m",結束字符為"s"。你可以把/s 和/m 選項組合使用:     if (m{^(.*?)}sm) {     # ...     }     總結   有兩種方法打開文件:open()函數的特點是快速簡捷,而sysopen()函數功能強大而復雜。通過 操作符,可以讀入一個記錄,$/ 變量可以讓你控制記錄是什麼。如果你打算把很多行的內容讀入到一個串中,不要使用忘記/s和/m 這兩個正則表達式標記。




Copyright © Linux教程網 All Rights Reserved