Linux教程網 >> Linux基礎 >> Linux教程 >> Pig安裝及本地模式測試,體驗

Pig安裝及本地模式測試,體驗

日期：2017/2/28 14:50:16 编辑：Linux教程

Pig是Apache的一個開源項目，用於簡化MapReduce的開發。研究了一段時間，略有心得。系廢話不多說，我們直接步入實際測試。

Pig的運行有兩種模式，本地單擊模式和集群模式。我目前只是測試學習，是為了檢驗Pig的運行流程以及學習語法，沒必要使用分布式模式，分布式模式下也都是大同小異的。

我的環境：

1. 系統： Ubuntu 12.04 64位

2. JDK：Oracle JDK1.7.0_15

3. Pig：0.9.2

和Apache其他項目一樣，安裝Pig都很簡單，解壓到系統任意目錄，設置環境變量就能使用。

export PIG_HOME=path
export PATH=$PATH:$PIG_HOME/bin

設置環境變量後注銷後登錄或者打開終端輸入：source /etc/profile 使新加入的環境變量生效最後在終端中輸入：pig -version，正常應該出現如下字樣

Warning: $Hadoop_HOME is deprecated.

Apache Pig version 0.9.2 (r1232772)
compiled Jan 18 2012, 07:57:19

到這裡Pig的安裝算是成功了。（當然如果不成功檢查你的JDK安裝及環境變量是否正確）現在你可以輸入：

pig -x local

進入一個外殼程序。

學習Hadoop一般的入門都是Oreilly的《《Hadoop權威指南》》中文版，其中測試MapReduce的第一個程序就是統計一個文本文件中單詞出現的次數。Pig是為了簡化MapReduce開發的，肯定也是能實現這個的。我以這個為例，寫一個測試的例子。

相關鏈接：Hadoop權威指南（中文第2版）PDF http://www.linuxidc.com/Linux/2012-07/65972.htm

我准備了一個文件，文件名為：nie.txt 裡邊是一片普通的英文文章，比較長，大約52KB。

上一頁:Pig安裝與配置教程
下一頁:用busybox制作微Linux及詳解過程中可能出現的問題

Linux教程

Debian文件結構

├── bin 基礎系統所需要的最基礎的命令├

Zabbix監控MySQL

如何查看crontab的日志記錄

安裝Linux應該了解的六個技術

Fedora 7下使用Virutalbox虛擬Windows XP

Linux系統下任務作業自動化執行工具

Linux系統入門學習：教你在VirtualBox 安裝 Fedora 22

Fedora8英文環境下使用scim啟用中文輸入法

紅旗Linux 6.0下Wine使用的一點體會

Linux教程網

linux當前網絡連接狀態

查看當前網絡連接狀態命令netstat -n | awk '/^tc

PLIP--Linux 並口網絡解決方案

立足自身價值點開源商業化正生機勃發

centos find 的正則表達寫法

Linux逐步進入企業應用健力寶成為第一家企業Linux試點單位

利用post

蘋果拋棄不氣餒 IBM加大Power推廣力度

Linux下網卡設置常見問題(5)

Linux下抓包工具tcpdump使用介紹

Linux基礎知識 Linux入門 Linux技術 Linux教程 Linux服務器關於Linux

文章推荐

突破LVS瓶頸，LVS Cluster部署（OSPF + LVS）

sed命令在文本的行尾或行首添加字符

CentOS6.6+Puppet3.7.4分布式部署Nagios監控系統

基於kubernetes構建Docker集群管理詳解

热点聚焦

Linux下“base64”命令工具的使用

Git 管理Qemu本地代碼

RHEL6.5上Vim 最新版的安裝並增加對Python2.7.5的支持

Linux下掛載光驅、軟驅、U盤

Ubuntu Linux 下安裝 Sayonara Player

Linux下性能分析命令總結]

Linux下用戶組、文件權限詳解

RRDtool中的數據類型GAUGE、COUNTER和DERIVE

Ubuntu 10.10升級Ubuntu 11.04成功

Ubuntu下打開與關閉筆記本觸摸板的方法