R語言對數據庫進行操作的實例詳解

數據是關系數據庫系統以規范化格式存儲。 因此,要進行統計計算,我們將需要非常先進和復雜的Sql查詢。 但R語言可以輕松地連接到許多關系數據庫,如MySql,Oracle,Sql服務器等,並從它們獲取記錄作為數據框。 一旦數據在R語言環境中可用,它就變成正常的R語言數據集,並且可以使用所有強大的包和函數來操作或分析。
在本教程中,我們將使用MySql作為連接到R語言的參考數據庫。

RMySQL包

R語言有一個名為“RMySQL”的內置包,它提供與MySql數據庫之間的本地連接。 您可以使用以下命令在R語言環境中安裝此軟件包。

install.packages("RMySQL")

將R連接到MySql

一旦安裝瞭包,我們在R中創建一個連接對象以連接到數據庫。 它使用用戶名,密碼,數據庫名稱和主機名作為輸入。

# Create a connection Object to MySQL database.
# We will connect to the sampel database named "sakila" that comes with MySql installation.
mysqlconnection = dbConnect(MySQL(), user = 'root', password = '', dbname = 'sakila',
   host = 'localhost')

# List the tables available in this database.
 dbListTables(mysqlconnection)

當我們執行上面的代碼,它產生以下結果

 [1] "actor"                      "actor_info"                
 [3] "address"                    "category"                  
 [5] "city"                       "country"                   
 [7] "customer"                   "customer_list"             
 [9] "film"                       "film_actor"                
[11] "film_category"              "film_list"                 
[13] "film_text"                  "inventory"                 
[15] "language"                   "nicer_but_slower_film_list"
[17] "payment"                    "rental"                    
[19] "sales_by_film_category"     "sales_by_store"            
[21] "staff"                      "staff_list"                
[23] "store"                     

查詢表

我們可以使用函數dbSendQuery()查詢MySql中的數據庫表。 查詢在MySql中執行,並使用R語言fetch()函數返回結果集。 最後,它被存儲為R語言中的數據幀。

# Query the "actor" tables to get all the rows.
result = dbSendQuery(mysqlconnection, "select * from actor")

# Store the result in a R data frame object. n = 5 is used to fetch first 5 rows.
data.frame = fetch(result, n = 5)
print(data.frame)

當我們執行上面的代碼,它產生以下結果

        actor_id   first_name    last_name         last_update
1        1         PENELOPE      GUINESS           2006-02-15 04:34:33
2        2         NICK          WAHLBERG          2006-02-15 04:34:33
3        3         ED            CHASE             2006-02-15 04:34:33
4        4         JENNIFER      DAVIS             2006-02-15 04:34:33
5        5         JOHNNY        LOLLOBRIGIDA      2006-02-15 04:34:33

帶過濾條件的查詢

我們可以傳遞任何有效的select查詢來獲取結果。

result = dbSendQuery(mysqlconnection, "select * from actor where last_name = 'TORN'")

# Fetch all the records(with n = -1) and store it as a data frame.
data.frame = fetch(result, n = -1)
print(data)

當我們執行上面的代碼,它產生以下結果

        actor_id    first_name     last_name         last_update
1        18         DAN            TORN              2006-02-15 04:34:33
2        94         KENNETH        TORN              2006-02-15 04:34:33
3       102         WALTER         TORN              2006-02-15 04:34:33

更新表中的行

我們可以通過將更新查詢傳遞給dbSendQuery()函數來更新Mysql表中的行。

dbSendQuery(mysqlconnection, "update mtcars set disp = 168.5 where hp = 110")

在執行上面的代碼後,我們可以看到在MySql環境中更新的表。

將數據插入表中

dbSendQuery(mysqlconnection,
   "insert into mtcars(row_names, mpg, cyl, disp, hp, drat, wt, qsec, vs, am, gear, carb)
   values('New Mazda RX4 Wag', 21, 6, 168.5, 110, 3.9, 2.875, 17.02, 0, 1, 4, 4)"
)

在執行上面的代碼後,我們可以看到插入到MySql環境中的表中的行。

在MySql中創建表

我們可以在MySql中使用函數dbWriteTable()創建表。 如果表已經存在,它將覆蓋該表,並將數據幀用作輸入。

# Create the connection object to the database where we want to create the table.
mysqlconnection = dbConnect(MySQL(), user = 'root', password = '', dbname = 'sakila', 
   host = 'localhost')

# Use the R data frame "mtcars" to create the table in MySql.
# All the rows of mtcars are taken inot MySql.
dbWriteTable(mysqlconnection, "mtcars", mtcars[, ], overwrite = TRUE)

執行上面的代碼後,我們可以看到在MySql環境中創建的表。

刪除MySql中的表

我們可以刪除MySql數據庫中的表,將drop table語句傳遞到dbSendQuery()中,就像我們使用它查詢表中的數據一樣。

dbSendQuery(mysqlconnection, 'drop table if exists mtcars')

執行上面的代碼後,我們可以看到表在MySql環境中被刪除。

到此這篇關於R語言對數據庫進行操作的實例詳解的文章就介紹到這瞭,更多相關R語言數據庫操作方法內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet!