R語(yǔ)言簡(jiǎn)介
R是用于統(tǒng)計(jì)分析、繪圖的語(yǔ)言和操作環(huán)境。R是屬于GNU系統(tǒng)的一個(gè)自由、免費(fèi)、源代碼開(kāi)放的軟件,它是一個(gè)用于統(tǒng)計(jì)計(jì)算和統(tǒng)計(jì)制圖的優(yōu)秀工具。
R語(yǔ)言是一個(gè)開(kāi)源的數(shù)據(jù)分析環(huán)境,起初是由數(shù)位統(tǒng)計(jì)學(xué)家建立起來(lái),以更好的進(jìn)行統(tǒng)計(jì)計(jì)算和繪圖,這篇wiki中包含了一些基本情況的介紹。由于R可以通過(guò)安裝擴(kuò)展包(Packages)而得到增強(qiáng),所以其功能已經(jīng)遠(yuǎn)遠(yuǎn)不限于統(tǒng)計(jì)分析。
R語(yǔ)言的特點(diǎn)
R作為一種統(tǒng)計(jì)分析軟件,是集統(tǒng)計(jì)分析與圖形顯示于一體的。它可以運(yùn)行于UNIX,Windows和Macintosh的操作系統(tǒng)上,而且嵌入了一個(gè)非常方便實(shí)用的幫助系統(tǒng),相比于其他統(tǒng)計(jì)分析軟件,R還有以下特點(diǎn):1.R是自由軟件。這意味著它是完全免費(fèi),開(kāi)放源代碼的。可以在它的網(wǎng)站及其鏡像中下載任何有關(guān)的安裝程序、源代碼、程序包及其源代碼、文檔資料。標(biāo)準(zhǔn)的安裝文件身自身就帶有許多模塊和內(nèi)嵌統(tǒng)計(jì)函數(shù),安裝好后可以直接實(shí)現(xiàn)許多常用的統(tǒng)計(jì)功能。
2.R是一種可編程的語(yǔ)言。作為一個(gè)開(kāi)放的統(tǒng)計(jì)編程環(huán)境,語(yǔ)法通俗易懂,很容易學(xué)會(huì)和掌握語(yǔ)言的語(yǔ)法。而且學(xué)會(huì)之后,我們可以編制自己的函數(shù)來(lái)擴(kuò)展現(xiàn)有的語(yǔ)言。這也就是為什么它的更新速度比一般統(tǒng)計(jì)軟件,如,SPSS,SAS等快得多。大多數(shù)最新的統(tǒng)計(jì)方法和技術(shù)都可以在R中直接得到。
3. 所有R的函數(shù)和數(shù)據(jù)集是保存在程序包里面的。只有當(dāng)一個(gè)包被載入時(shí),它的內(nèi)容才可以被訪問(wèn)。一些常用、基本的程序包已經(jīng)被收入了標(biāo)準(zhǔn)安裝文件中,隨著新的統(tǒng)計(jì)分析方法的出現(xiàn),標(biāo)準(zhǔn)安裝文件中所包含的程序包也隨著版本的更新而不斷變化。在另外版安裝文件中,已經(jīng)包含的程序包有:base一R的基礎(chǔ)模塊、mle一極大似然估計(jì)模塊、ts一時(shí)間序列分析模塊、mva一多元統(tǒng)計(jì)分析模塊、survival一生存分析模塊等等。
4.R具有很強(qiáng)的互動(dòng)性。除了圖形輸出是在另外的窗口處,它的輸入輸出窗口都是在同一個(gè)窗口進(jìn)行的,輸入語(yǔ)法中如果出現(xiàn)錯(cuò)誤會(huì)馬上在窗口口中得到提示,對(duì)以前輸入過(guò)的命令有記憶功能,可以隨時(shí)再現(xiàn)、編輯修改以滿足用戶的需要。輸出的圖形可以直接保存為JPG,BMP,PNG等圖片格式,還可以直接保存為PDF文件。另外,和其他編程語(yǔ)言和數(shù)據(jù)庫(kù)之間有很好的接口。[2] 5.如果加入R的幫助郵件列表一,每天都可能會(huì)收到幾十份關(guān)于R的郵件資訊??梢院腿蛞涣鞯慕y(tǒng)計(jì)計(jì)算方面的專家討論各種問(wèn)題,可以說(shuō)是全世界最大、最前沿的統(tǒng)計(jì)學(xué)家思維的聚集地。
R是基于S語(yǔ)言的一個(gè)GNU項(xiàng)目,所以也可以當(dāng)作S語(yǔ)言的一種實(shí)現(xiàn),通常用S語(yǔ)言編寫(xiě)的代碼都可以不作修改的在R環(huán)境下運(yùn)行。 R的語(yǔ)法是來(lái)自Scheme。R的使用與S-PLUS有很多類似之處,這兩種語(yǔ)言有一定的兼容性。S-PLUS的使用手冊(cè),只要稍加修改就可作為R的使用手冊(cè)。所以有人說(shuō):R,是S-PLUS的一個(gè)“克隆”。但是請(qǐng)不要忘了:R是免費(fèi)的(R is free)。R語(yǔ)言源代碼托管在github,具體地址可以看參考資料。
R語(yǔ)言的下載可以通過(guò)CRAN的鏡像來(lái)查找。
R語(yǔ)言有域名為.cn的下載地址,有六個(gè),其中兩個(gè)由Datagurn,由中國(guó)科學(xué)技術(shù)大學(xué)提供的。R語(yǔ)言Windows版,其中由兩個(gè)下載地點(diǎn)是Datagurn和USTC提供的。
R語(yǔ)言基礎(chǔ)入門(mén)教程一:
1、學(xué)習(xí)前提
在繼續(xù)學(xué)習(xí)本教程之前,您應(yīng)該基本了解計(jì)算機(jī)編程術(shù)語(yǔ)。 對(duì)任何編程語(yǔ)言的基本理解將幫助您理解R語(yǔ)言編程概念,并在學(xué)習(xí)軌道上快速移動(dòng)
R語(yǔ)言適用人群
本教程是為期待使用R編程開(kāi)發(fā)統(tǒng)計(jì)軟件的軟件程序員,統(tǒng)計(jì)學(xué)家和數(shù)據(jù)挖掘者設(shè)計(jì)的。 如果你試圖理解R編程語(yǔ)言作為一個(gè)初學(xué)者,本教程將給你足夠的了解語(yǔ)言的幾乎所有的概念,從那里你可以把自己的更高水平的專業(yè)知識(shí)。
2 為什么要學(xué)習(xí)R語(yǔ)言
可能你想說(shuō),“我已經(jīng)學(xué)會(huì)了spss/sas/stata.。。,為什么還要去學(xué)習(xí)R呢?”如下幾方面可能會(huì)吸引到你:
R是免費(fèi)開(kāi)源軟件:現(xiàn)在很多學(xué)術(shù)期刊都對(duì)分析軟件有版權(quán)要求,而免費(fèi)的分析工具可以使你在這方面不會(huì)有什么擔(dān)心。另一方面,如果學(xué)術(shù)界出現(xiàn)一種新的數(shù)據(jù)分析方法,那么要過(guò)很長(zhǎng)一段時(shí)間才會(huì)出現(xiàn)在商業(yè)軟件中。但開(kāi)源軟件的好處就在于,很快就會(huì)有人將這種方法編寫(xiě)成擴(kuò)展包,或者你自己就可以做這件工作。
命令行工作方式:許多人喜歡類似SPSS菜單式的操作,這對(duì)于初學(xué)者來(lái)說(shuō)很方便入門(mén),但對(duì)于數(shù)據(jù)分析來(lái)說(shuō),命令行操作會(huì)更加的靈活,更容易進(jìn)行編程和自動(dòng)化處理。而且命令行操作會(huì)更容易???,不是嘛,一般人看到你在狂敲一推代碼后得到一個(gè)分析結(jié)果,對(duì)你投來(lái)的目光是會(huì)不一樣的。
小巧而精悍:R語(yǔ)言的安裝包更小,大約不到40M,相比其它幾個(gè)大家伙它算是非常小巧精悍了。目前R語(yǔ)言非常受到專業(yè)人士歡迎,根據(jù)對(duì)數(shù)據(jù)挖掘大賽勝出者的調(diào)查可以發(fā)現(xiàn),他們用的工具基本上都是R語(yǔ)言。此外,從最近幾次R語(yǔ)言大會(huì)上可以了解到,咨詢業(yè)、金融業(yè)、醫(yī)藥業(yè)都在大量的使用R語(yǔ)言,包括google/facebook的大公司都在用它。因此,學(xué)習(xí)R語(yǔ)言對(duì)你的職業(yè)發(fā)展一定是有幫助的。
3 R語(yǔ)言的下載和GUI界面
R語(yǔ)言安裝包可以在官方網(wǎng)站下載,windows版可直接點(diǎn)擊這個(gè)連接
在ubuntu下面安裝R則更容易,在終端里頭運(yùn)行如下命令即可
sudo apt-get update
sudo apt-get install r-base
此外,學(xué)習(xí)R語(yǔ)言時(shí)強(qiáng)烈推薦安裝Rstudio做為R的圖形界面,關(guān)于Rstudio之前的博文有過(guò)簡(jiǎn)單介紹,點(diǎn)這里可能轉(zhuǎn)到它的官方網(wǎng)站。
4 R語(yǔ)言的學(xué)習(xí)方法
學(xué)習(xí)R并不是一件非常輕松的事情,初學(xué)者需要記住的就是:
親手鍵入代碼并理解其意義
在筆記里記下一些重點(diǎn)或心得(個(gè)人推薦Evernote)
堅(jiān)持練習(xí),對(duì)手邊的數(shù)據(jù)進(jìn)行應(yīng)用分析
理解背景知識(shí),細(xì)節(jié)很重要。
5 哪里可以得到參考資料
1.官方網(wǎng)站 http://cran.csdb.cn/index.html (官方文獻(xiàn)集中地)
2.統(tǒng)計(jì)之都論壇
3.人大經(jīng)濟(jì)論壇-R子論壇 (免費(fèi)資料也不少)
4.http://library.nu/ 這是網(wǎng)上電子書(shū)最多的地方,其中有一個(gè)R語(yǔ)言專門(mén)書(shū)柜(也就是一個(gè)shelves)
5.關(guān)于R語(yǔ)言的教材小結(jié)
6.筆者在verycd上發(fā)的一個(gè)書(shū)單
7.一個(gè)國(guó)外著名的R語(yǔ)言群博 http://www.r-bloggers.com/
8.展示R語(yǔ)言的各類繪圖 http://addictedtor.free.fr/graphiques/
本人博客里也有一些關(guān)于R語(yǔ)言的資料:xccds1977.blogspot.com (需FQ)
如果有一些簡(jiǎn)單的入門(mén)問(wèn)題,也可以在推特上follow me twitter: @xccds
6 本系列博文的目的
本系列入門(mén)的目的是為初學(xué)者提供最簡(jiǎn)潔清晰的資料,以迅速入門(mén)。所針對(duì)的讀者人群是那些正在大學(xué)里學(xué)習(xí)初級(jí)統(tǒng)計(jì)學(xué)的同學(xué)。本系列計(jì)劃包括內(nèi)容有:基本命令,數(shù)據(jù)操作;描述統(tǒng)計(jì)和繪圖;重要的R語(yǔ)言函數(shù)計(jì)算;統(tǒng)計(jì)推斷和估計(jì);非參數(shù)統(tǒng)計(jì)方法;方差分析;線性回歸和一般線性模型。
評(píng)論