歡迎來到Linux教程網
Linux教程網
Linux教程網
Linux教程網
Linux教程網 >> Linux基礎 >> Linux教程 >> RedHat安裝SLURM

RedHat安裝SLURM

日期:2017/2/28 15:31:46   编辑:Linux教程

之前在Windows下用虛擬機跑程序,後來被學長鄙視,就改用linux平台,結果由於種種原因virtualbox一裝虛擬機就掛掉,所以只好在物理節點上做實驗了。

其實和Ubuntu下面差不多的Ubuntu下配置Slurm,沒有那麼簡單的apt-get使用,就從源碼編譯。

參考:http://www.linuxidc.com/Linux/2012-10/71552.htm

munge的路徑好像不太一樣,不是/xxxx而是/usr/local/xxxx。後面還會說到這個問題。

SLURM會提示出錯

plugin_load_from_file: dlopen(/usr/local/lib/slurm/crypto_munge.so): libmunge.so.2: cannot open shared object file: No such file or directory

還是缺munge的包,上網搜一個libmunge.so.2下就好了.

查看版本號的方式

uname -a

cat /etc/issue

lsb_release -a

cat /etc/RedHat-release

不過我用這幾個命令出來的結果不一樣啊,有的說是EL4,有的說是EL5,所以我就下了舊版本的庫。。。

運行slurm報錯沒有找到/var/run/munge/munge.socket.2。

呵呵。

到/var/run裡面去建個鏈接到/usr/local/var/run/munge就好了。


因為是物理機器,所以比虛擬機的環境要復雜一點點。比如我的幾個節點的時間是不同步的。這樣munge就不能正常工作了。

date

顯示時間

date -s “Sep 15 12:30:07"

修改時間為9月15xxxxxx


因為每台機器都不一樣,所以在每台機器上建的用戶tomxice的uid和gid都不同。。。然後munge又不干了。

usermod -u uid username 改變用戶uid

groupmod -g gid groupname 改變組的gid

usermod -g groupname username 將用戶加到組裡(我很納悶為什麼我的tomxice建出來不在tomxice組裡面)

似乎就可以工作了,OY~

Copyright © Linux教程網 All Rights Reserved