歡迎來到Linux教程網
Linux教程網
Linux教程網
Linux教程網
Linux教程網 >> Linux基礎 >> Linux教程 >> Ubuntu 8.10下moses測試平台搭建全記錄

Ubuntu 8.10下moses測試平台搭建全記錄

日期:2017/2/28 16:46:00   编辑:Linux教程

  實驗室換了新機器,重新安裝了最新的Ubuntu 8.10,這樣不得不重新搭建moses測試平台。拿自己寫的<<Moses相關介紹>>作參考,感覺寫得不夠細,這裡把安裝的全過程記錄下來,屬於一個step-by-step的過程,希望對大家有用。

一、在用戶52nlp目錄下建立moses平台主目錄mtworkdir:

  52nlp@52nlp-desktop:~$ mkdir mtworkdir

  52nlp@52nlp-desktop:~$ cd mtworkdir/

二、安裝語言模型工具SRILM:

1、建立srilm目錄:

  52nlp@52nlp-desktop:~/mtworkdir$ mkdir srilm

  52nlp@52nlp-desktop:~/mtworkdir$ cd srilm/

2.下載最新的的srilm包(目前最新版本為 srilm-1.5.7.tar.gz)

  52nlp@52nlp-desktop:~/mtworkdir/srilm$ wget   ’ftp://ftp.speech.sri.com/pub/people/stolcke/srilm/srilm-1.5.7.tar.gz’

  顯示信息如下:

=> `srilm-1.5.7.tar.gz’

正在解析主機 ftp.speech.sri.com… 130.107.33.205

正在連接 ftp.speech.sri.com|130.107.33.205|:21… 已連接。

正在以 anonymous 登錄 … 登錄成功!

==> SYST … 完成。 ==> PWD … 完成。

==> TYPE I … 完成。 ==> CWD /pub/people/stolcke/srilm … 完成。

==> SIZE srilm-1.5.7.tar.gz … 完成。

==> PASV … 完成。 ==> RETR srilm-1.5.7.tar.gz … 完成。

長度:48526656 (46M) (非正式數據)

出現下載進度條,等待約一段時間之後,下載完畢

3.解壓:tar -zxvf srilm-1.5.7.tar.gz

4.首先確認srilm依賴的這些工具是否已安裝:

 A template-capable ANSI-C/C++ compiler, preferably gcc version 3.4.3 or higher.

 GNU make, to control compilation and installation.

 GNU gawk, required for many of the utility scripts.

 GNU gzip to unpack the distribution, and to allow SRILM programs to handle “.Z” and “.gz” compressed datafiles (highly recommended).

 bzip2 to handle “.bz2″ compressed files (optional).

 p7zip to handle “7-zip” compressed files (optional).

 The Tcl embeddable scripting language library (only required for some of the test executables).

 除了上面這些工具外,還需要裝一個csh。Ubuntu8.10自帶的軟件不多,安裝時用apt-get或新利得都行。

5. 修改MakeFile:

 在以上工具都安裝完畢後,首先修改srilm/MakeFile:

   cp Makefile Makefile.bak(備份)

   vi Makefile

 修改或在第7行下面加上一行

 # SRILM = /home/speech/stolcke/project/srilm/devel (原)

 SRILM = $(PWD) (修改)

 再修改srilm/common/Makefile.machine.i686:

  cd common/

  cp Makefile.machine.i686 Makefile.machine.i686.bak

  vi Makefile.machine.i686

 將第15行 # Use the GNU C compiler下的三行修改如下:

  GCC_FLAGS = -mtune=pentium3 -Wreturn-type -Wimplicit

  CC = gcc $(GCC_FLAGS)

  CXX = g++ $(GCC_FLAGS) -DINSTANTIATE_TEMPLATES

 注:我的新機器的cpu是intel64位,所以嘗試了一下64位的編譯方法,不太成功,這裡的方法對於64位機器也是可以的。

 將51行 # Tcl support (standard in Linux) 下的兩行修改如下:

  TCL_INCLUDE = -I/usr/include/tcl8.5

  TCL_LIBRARY = -L/usr/lib/tcl8.5

 注:我裝的是tcl8.5,如果是其他版本,請相應修改。

6.回到srilm目錄下編譯:

  cd ..

  make World

 順利的話,srilm就編譯通過了。如果出現問題,很可能就是相應的依賴工具沒有裝完全,請回到第4步檢查。

Copyright © Linux教程網 All Rights Reserved