R語言如何將大型Excel文件轉為dta格式詳解

本文以2000年度我國工業企業數據庫為例,該文件後綴名為xlsx,包含約16萬條記錄,文件有88M這麼大。直接使用Excel打開都費勁:等待時間久,電腦風扇呼呼呼作響。如果嘗試用Stata打開該xlsx文件,則會出現提示報錯。

報錯原因在於,Stata無法讀取超過40M的Excel文件。

這就好比瓜迪奧拉的傳控足球固然美麗,但是面對擺大巴的球隊無能為力。

破大巴需要攻城錘,這把錘子的名字就是R語言。萬事開頭難啊,正憧憬著數據清洗和花式選取變量建模呢,可不能連數據們長啥模樣都沒見著啊。R語言適時挺身而出,幫助Stata叩開大型Excel文件之門。

在RStudio中運行如下代碼,過程較為淺顯,首先引入兩個R包,然後輸入xlsx後綴名文件,最後便可輸出dta後綴名文件。等待2分鐘,誰讓文件那麼龐大呢,接下來便是見證奇跡的時刻。

library(openxlsx)
library(foreign)

x = read.xlsx('2000.xlsx',1)  # 讀取 Excel 的 Sheet1
# View(x)
write.dta(x, '2000.dta')    # 輸出為 Stata 能讀取的格式

在Stata中打開該文件,屏幕會顯示這份文件是在R中轉化而來。

也許你有更好的轉化方法,歡迎賜教。

總結

到此這篇關於R語言如何將大型Excel文件轉為dta格式的文章就介紹到這瞭,更多相關R語言大型Excel為dta內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet!

推薦閱讀: