教你用Python讀取CSV文件的5種方式

在python裡面,讀取或寫入csv文件時,首先要import csv這個庫,然後利用這個庫提供的方法進行對文件的讀寫。

典型的數據集stocks.csv:

在這裡插入圖片描述

一個股票的數據集,其實就是常見的表格數據。有股票代碼,價格,日期,時間,價格變動和成交量。這個數據集其實就是一個表格數據,有自己的頭部和身體。

第一招:簡單的讀取

我們先來看一種簡單讀取方法,先用csv.reader()函數讀取文件的句柄f生成一個csv的句柄,其實就是一個迭代器,我們看一下這個reader的源碼:

在這裡插入圖片描述

喂給reader一個可迭代對象或者是文件的object,然後返回一個可迭代對象。

在這裡插入圖片描述

  • 首先讀取csv 文件,然後用csv.reader生成一個csv迭代器f_csv
  • 然後利用迭代器的特性,next(f_csv)獲取csv文件的頭,也就是表格數據的頭
  • 接著利用for循環,一行一行打印row的內容,也就是表格數據的身體

在這裡插入圖片描述 

第二招:用nametuple

上面的第一招其實是最簡單的,下面我們用nametuple 來包裹一下這個生成的row數據。

在這裡插入圖片描述

  • nametuple其實是一個非常有用的類,這個類屬於collections模塊,而這個模塊簡直就是一個百寶箱裡面有非常多的牛逼的庫;
  • 這裡我們用next(f_csv)其實就是獲取表格的頭部來初始化這個Row;
  • 然後循環來構造這個Row的數據,把我們表格裡面的每一行的數據都喂成nametuple格式的row_info;
  • 這樣做的好處就是你可以隨心所欲的訪問這個row_info裡面的數據,就想訪問類數據一樣,比如row_info.price

第三招:用tuple類型轉換

如果我們對csv數據每一行的類型都非常清楚的話,嘿嘿可以用一個設定好的數據格式轉換頭來對數據進行轉換。

在這裡插入圖片描述

操作的步驟其實跟上面差不多,就是對數據結果的清洗處理稍微不一樣。這裡非常巧妙的zip來構造一個嵌套的數據列表,然後用convert(data)把csv文件裡面每一行的數據進行類型轉換,這招真的不錯!
看一下結果:

在這裡插入圖片描述

第四招:用DictReader

上面用的nametuple其實也是一個數據的映射,有沒有什麼方法可以直接把csv 的內容用映射的方法讀取,直接出來一個字典,還真有的,來看一下代碼:

在這裡插入圖片描述

是不是非常簡捷,原來csv模塊直接內置瞭DictReader(),按照字典的方法進行讀取,然後生成一個有序的字典,看一下結果:

在這裡插入圖片描述

有興趣的可以看一下這個DictReader()的源碼,它其實一個內部構造的迭代器類,在內部的__next__其實也是用的OrderedDict(zip(self.fieldnames, row))來生成的。

第五招:用字典轉換

如果我們需要對這個csv裡面的數據進行清洗,因為讀出來的時候都是字符串,我們需要更新為特定的數據類型,這個時候也可以用字典轉換這一招,也是非常巧妙的,我們看一下源碼:

在這裡插入圖片描述

原來的數據價格Price和成交量,我希望最後讀取生成的是一個浮點型數據和整形的數據,這麼搞呢,用一個字典來巧妙的更新key即可。

  • 首先我們聲明一個自定義的類型轉換器field_types;
  • 然後循環生成一個可迭代的對象(key,conversion(row[key]);
  • 最後更新一下字典裡面相同的key,比如row[‘price’]的內容就會被更新瞭

參考鏈接 :

用Python讀取CSV文件的5種方式https://mp.weixin.qq.com/s/cs4buSULva1FgCctp_fB6g

到此這篇關於教你用Python讀取CSV文件的5種方式的文章就介紹到這瞭,更多相關Python讀取CSV文件內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet!

推薦閱讀: