歡迎來到Linux教程網
Linux教程網
Linux教程網
Linux教程網
Linux教程網 >> Unix知識 >> 關於Unix >> 適合初學者的Perl的文件操作(2)

適合初學者的Perl的文件操作(2)

日期:2017/3/6 15:50:08   编辑:關於Unix
讀入多個記錄 如果你調用,返回文件中剩余的記錄。如果你處於文件尾,則返回空表: @records = ; if (@records) print "There were ", scalar(@records), " records read.n"; 在下面的一步中,進行賦值和 測試 兩項工作: if (@records = ) print "There wer
  讀入多個記錄
  如果你調用,返回文件中剩余的記錄。如果你處於文件尾,則返回空表:
  
  @records = ;
  
  if (@records) {
  
  print "There were ", scalar(@records), " records read.n";
  
  }
  
  在下面的一步中,進行賦值和測試兩項工作:
  
  if (@records = ) {
  
  print "There were ", scalar(@records), " records read.n";
  
  }
  
  chomp() 也可適用對數組操作:
  
  @records = ;
  
  chomp(@records);
  
  對於任何表達式,都可以進行chomp操作,故你可以在下面的一步中這樣寫:
  
  chomp(@records = );
  
  什麼是記錄?
  記錄的缺省定義為:“行”。
  
  記錄的定義由$/ 變量控制的,該變量存放所輸入的記錄的分隔符,因為換行符字符(根據定義!)是用來分隔行的,故其缺省值為串“n”。
  
  例如,你可以用任何你想要替換的符號來代替“n”。
  
  $/ = ";";
  
  $record = ; # 讀入下一個用分號分隔的記錄
  
  $/可以取其它兩個有趣的值:空串("") 和undef。
  
  讀入段落
  $/ =""的寫法是用來指示Perl讀入段落的,段落是由兩個或兩個以上的換行符構成的文本塊。這不同於設置為"nn",後者僅讀入由兩行組成的文本塊。在這種情況下,將出現這樣一個問題:如果有連續的空行存在,例如“textnnnn”,你既可以把它解釋為一個段落 ("text"),也可以解釋為兩個段落 ("text", 後面跟兩個換行符,以及一個空段落,後面跟兩個空行。)
  
  在讀入文本時,第二個解釋用途不大。如果你正在讀的段落出現上述情況,你不必過濾出“空”段落。
  
  $/ = "nn";
  
  while () {
  
  chomp;
  
  next unless length; # 跳過空段
  
  # ...
  
  }
  
  你可以把 $/設置為undef,它用於讀入後面跟著兩個或多個換行符組成的段落: undef $/;
  
  while () {
  
  chomp;
  
  # ...
  
  }
  
  讀入整個文件
  $/ 的其它有趣的值為undef。如果設置為該值,就將告訴Perl,讀命令將把文件的剩余部分作為一個串返回:
  
  undef $/;
  
  $file = ;
  
  因為改變了 $/的值,將會影響以後的每次讀操作,而不僅是下一個讀操作。通常,你需要將該操作限制在局部。通過下面的例子,可以把文件句柄的內容讀入到一個串中:
  
  {
  
  local $/ = undef;
  
  $file = ;
  
  }
  
  記住:Perl變量可讀入很長的串。盡管你的文件大小不可以超出你的虛擬內存容量的限度,你仍可以讀入盡可能多的數據。
  
  用正則表達式對文件進行操作
  一旦你有個包含了整個串的變量,你可以使用正則表達式,對整個文件進行操作,而不是對文件中的某個塊進行操作。有兩個有用的正則表達式標記/s和/m。一般,Perl的正則表達式對行進行處理,你可以這樣寫:
  
  undef $/;
  
  $line = ;
  
  if ($line =~ /(b.*grass)$/) {
  
  print "found $1n";
  
  }
  
  如果把我們的文件填入如下內容:
  browngrass
  
  bluegrass
  
  則輸出為:
  
  found bluegrass
  
  它沒有找到“browngrass”,這是因為$ 僅在串尾尋找其匹配, (或者在串結束前的一行)。如果在包含很多行的串中,用"^" 和"$" 來匹配,, 我們可以使用 /m ("multiline") 選項:
  
  if ($line =~ /(b.*grass)$/m) {}
  
  現在程序會把如下的信息輸出:
  
  found browngrass
  
  類似地,句點可以匹配除了換行符之外的所有字符:
  
  while () {
  
  if (/19(.*)$/) {
  
  if ($1 < 20) {
  
  $year = 2000+$1;
  
  } else {
  
  $year = 1900+$1;
  
  }
  
  }
  
  }
  
  如果我們從文件中讀入“1981”,$_ 將包含“1981n”。正則表達式中的句點匹配“8”和“1”, 而不匹配“n”。這裡正需要這樣做,因為換行符不是日期的組成部分。
  
  對於一個包含很多行的串,我們也許要提取其中的大的塊,這些塊可能會跨越行分隔符。在這種情況下,我們可以使用 /s 選項,並用句點來匹配除了換行符以外的所有字符。
  
  if (m{(.*?)}s) {
  
  print "Found bold text: $1n";
  
  }
  
  此處,我用了{}來表示正則表達式的起始和結束,而不用斜槓,所以,我就可以告訴 Perl我正在匹配,起始字符為"m",結束字符為"s"。你可以把/s 和/m 選項組合使用:
  
  if (m{^(.*?)}sm) {
  
  # ...
  
  }
  
  總結
  有兩種方法打開文件:open()函數的特點是快速簡捷,而sysopen()函數功能強大而復雜。通過 操作符,可以讀入一個記錄,$/ 變量可以讓你控制記錄是什麼。如果你打算把很多行的內容讀入到一個串中,不要使用忘記/s和/m 這兩個正則表達式標記。

Copyright © Linux教程網 All Rights Reserved