歡迎來到Linux教程網
Linux教程網
Linux教程網
Linux教程網
Linux教程網 >> Linux基礎 >> Linux技術 >> 編程語言漫談

編程語言漫談

日期:2017/3/3 12:06:56   编辑:Linux技術

寫在前邊:我們知道現有語言的編程范式有:過程式,面向對象,函數式,邏輯式。隨著軟件工業化程度的普及,以及軟件的復雜度越來越高,編程語言的發展歷程也是從最初的過程式(命令式)語言c,發展到以java語言為代表的面向對象編程語言。而邏輯編程語言(以prolog為代表)和函數式語言(lisp系列)還多用在學術和人工智能領域中。

近幾年,隨著多核,雲計算時代的到來。函數式編程語言逐漸浮出水面,最經典的語言以scheme、common-lisp、ml、clojure、go為代表。最近的jdk8也逐步加入了functional、closure、lambda等語法,而且scala的作者也越來越推崇編碼者以函數式語言的思維來coding。可見編程語言的發展也是滿足時代的變化不斷變化著。從其中的發展歷程中我們可以看到:技術的發展都是在圍繞著解決“軟件的復雜度”這個基本的需求而發展的。

一、 編程語言概述

編程語言是計算機的符號,是人和計算機交流的語言。我們學習一門新的編程語言時,應該觀察這門語言的那些特性呢?《SICP》一書的作者列舉了一下三點:基本元素(primitive elements)

組合手段(means of combination)

抽象手段(means of abstraction)

以上3個特性,基本上涵蓋了所有編程語言的特性,並且也是一個語言設計者從開始就要考慮的。我對這三點的理解:“基本元素”表示語言的基本符號(基本數據類型,關鍵字等)也就是詞法部分。“組合手段”利用基本元素通過組合的過程構建大型程序的手段,不同的語言提供的組合手段是不同的。“抽象手段”表示抽象,抽象是解決軟件復雜度的重要手段,讓軟件的可讀性,可擴展,可重復利用等得到提升。

下邊會從組合元素和抽象手段來對比語言特性。

二、 組合手段

匯編語言:算是最簡單的詞法和語法形式了,被稱作低級語言。匯編器通過直譯的過程將匯編代碼翻譯為native code(cpu指令集)。 提供的基本元素有:數字,字符,-,+,*,/ , case,if, break, go,指令等基本元素;通過這些元素組合成計算機執行序列符號。c語言相比匯編語言更高級,讓程序員脫離和cpu,寄存器,內存直接打交道的工作,提供了更多的組合手段:比如數組,結構體等數據結構。

java語言自稱是面向對象語言,所以比c語言更進一步,通過強大的類型系統手段來組合屬性和方法。

go語言和ML語言非常相仿,“接口”,"高階函數“,”閉包“,"duck type","返回多值”,並提供goroutine等來組合。

prolog語言完全是模式匹配的邏輯語言。他的思想基於:世間所有的定理都給予一個最簡單的定理推理而來,就像數學的基礎是“1+1=2”,然後才能推導出“萬有引力”,“相對論”等定律。

lisp方言以s-expression(著名的S表達式)來組合數據和函數。在lisp中不區分數據和函數,一切皆為數據。

題外話:lisp方言是和圖靈機的思想一脈相承的,編碼的時候完全感受不到計算機體系結構。而其他語言更多的是馮·洛伊曼的計算,存儲思想而設計,要麼是“堆棧”結構,要麼是“寄存器”結構;

三、 抽象手段

從c語言開始,以函數為單元提供了對程序的抽象。這樣大大的提高了程序的可復用,模塊化等。讓團隊合作編碼也成為可能。面向對象編程:基本上隱藏了計算機的細節,開發者通過對象來抽象具體業務。但嚴格意義上來說java也屬於imperative-lang的范疇而且都是傳值調用。相比來說,python,ruby更面向對象一些,python融合了面向對象和函數式編程范式,更接近自然語言些。

以lisp為代表的函數式語言:以函數為基本和唯一的抽象;common-lisp也基於宏開發了一套object-oriented的編程方式。我比較傾向於函數式編程理念:函數的無副作用(不用考慮線程安全,特別是對於變態的Haskell),高階函數,閉包,lambda等。

四、 類型系統

大家平時經常會說:javascript是一個弱類型的語言,java語言是強類型的語言。將編程語言從類型系統的角度區分語言也很有趣。一般來說弱類型語言更偏向自然語言一些,語法也很自由活潑些。而現今語言的走勢也趨向與弱類型方向。計算機是結構化很強的,堆棧上一個二進制位的錯誤就會導致溢出,bus等錯誤。所以語言層面的自由得益於編譯器或者解釋器的功勞。比如java,c等語言有很強的編譯時類型檢測機制,強類型的好處驅使編碼人員寫出很少有語法,語義錯誤的代碼,對IDE的支持也便捷,是大型技術團隊的合作基石。

弱類型語言讓我們獲取了自由(不需要類型信息),讓程序員少敲了許多鍵盤。自由是有代價的,編譯器或解釋器中內含類型推理(infer type); (類型推理是利用歸一方法,基於上下文中的變量顯式類型,操作符,返回值等信息,利用棧和逐漸替換的過程來推到出類型。) 弱類型雖然可以輕松編譯通過(或者不需要編譯而是解釋執行),但也是有類型檢查過程的,只是將此過程延遲到運行時了。所以弱類型語言結構化不強,編碼時很難確保類型無誤,IDE支持較難。但是通過一些分析器可以不斷的檢測語法,語義錯誤,相當於達到了強類型語言的IDE效果。近幾年語言的方向朝著逐漸脫離計算機體系結構,向自然語言方向在演進,程序員像藝術家一樣用代碼自由描繪。

五、編譯/解釋

java語言是解釋型還是編譯型的呢? 這個很難說,從java source code -> class byte code 的過程式javac編譯器的過程。但是 byte code 在jvm上執行的過程可能是解釋執行也可能是編譯執行的。解釋型和編譯型的內部都遵從編譯原理的過程:詞法分析-> 語法分析->語義解析 -> 編譯器後端-> native code的過程。 但有各自的優點:解釋器:加載code速度快;解釋器需要維護運行時上下文等信息。所以加載必要的代碼,片段解釋執行。但是對於相同的代碼都經過編譯過程就很多余,造成時間浪費。

編譯器:執行速度快。而且編譯器後端也更容易優化中間代碼,因為優化過程式一個結構化過程:往往需要遍歷整個中間代碼,整體優化代碼,提高運行效率。

runtime:一般來說解釋型語言需要在內存維護運行時上下文信息,服務於運行過程中變量的查找,綁定,scope等。 而編譯語言基於寄存器堆棧模型執行代碼,基本上數據綁定都在棧結構中完成,運行速度稍微快一些;

hotspot-jvm結合了解釋和編譯的各自優點;最先解釋執行過程,如果方法被頻繁執行,而且達到熱點(hotspot),jvm會啟動編譯過程,將次代碼編譯為native-code,然後緩存起來,下一次的調用直接執行即可。hotspot-jvm執行基於堆棧指令bytecode, 這一點也是基於跨平台的考慮而犧牲了寄存器指令; (而基於android操作系統上的dalvik虛擬機是基於寄存器指令的);

所以說,語言的設計往往是一個權衡過程;獲取的“自由”越多,"犧牲“也更大。

六、 總結

alt 最初從圖靈為了解決萊布尼茨提出的:是否存在一個通用模型來解決一切計算任務這個命題,發明了圖靈機理論。到馮洛伊曼仿真人腦神經元思考過程產生第一台基於存儲器,運算器的計算機ENIAC,至今,計算機硬件技術並沒有實質性的變化,只是隨著摩爾定律的破滅,人們發展了多級高速緩存,多核,多cpu技術來支撐越來越大的計算任務。 在這個過程中,隨著人們對邏輯學,符號學,算法的不斷研究,用來和計算機交互的語言也越來越抽象和豐富。我們通過這個形象的符號來抽象時間和空間,通過這個形象的符號來解決軟件的復雜性問題,通過這個符號來和計算機傳達我們的思想。

Copyright © Linux教程網 All Rights Reserved