一些讓Python代碼簡潔的實用技巧總結

前言

眾所周知,編寫Python代碼在開始時十分容易,但隨著你在工具包中添加更多的庫,你的腳本可能會有不必要的代碼行,變得冗長而混亂。可能短期內能夠應付工作,但長期來看,麻煩不小。

在這篇文章中,我將與你分享7個技巧,使你在使用Python進行數據科學時更加簡潔。這涵蓋瞭我們日常所做的事情,例如修改Pandas數據框中的值,連接字符串,讀取文件等操作!

1. 使用Lambda來修改Pandas數據框中的值

假設我們有以下df數據框:

data = [[1,2,3], [4,5,6], [7,8,9]]
df = pd.DataFrame(data, columns=[0,1,2])
IN[1]: print (df)
OUT[1]:    0  1  2
        0  1  2  3
        1  4  5  6
        2  7  8  9

現在由於某種原因,你需要在第0列的數字上添加01的值。一個常見的方法是定義一個函數來完成這個任務,然後用 apply 函數來修改一列的值。

def add_numbers(x):
    return f'{x}01'
df[0] = df[0].apply(add_numbers)
IN[1]: print (df)
OUT[1]:     0   1   2
        0  101  2   3
        1  401  5   6
        2  701  8   9

這並不復雜,但是在數據框中對每一個改變創建一個函數是不切實際的。這時lambda就派上瞭用場。

lambda函數類似於普通的Python函數,但它可以不使用名稱來定義,這使得它成為一個漂亮的單行代碼。之前使用的代碼可以用以下方式來減少。

df[0] = df[0].apply(lambda x:f'{x}01')

當你不知道是否可以訪問一個系列的屬性來修改數據時,Lambda變得非常有用。

例如,列0包含字母,我們想把它們大寫。

# 如果你知道.str的存在,你可以這樣做
df[0] = df[0].str.title()
# 如果你不知道.str,你仍然可以用lambda大寫
df[0] = df[0].apply(lambda x: x.title())

2. 使用f-string來連接字符串

字符串連接是Python中非常常見的操作,它可以用不同的方法來完成。最常見的方法是使用+運算符;然而,這個運算符的一個問題是我們不能在字符串之間添加任何分隔符。

當然,如果你想把 “Hello “和 “World “連接起來,一個典型的變通方法是添加一個空白分隔符(” “)。

print("Hello" + " " + "World")

這就完成瞭工作,但為瞭寫出更可讀的代碼,我們可以用一個f-string來代替它。

IN[2]: print(f'{Hello} {World}')
OUT[2]: "Hello World"

在一個基本的例子中,這似乎是不必要的,但是當涉及到連接多個值時(正如你將在提示#3中看到的),f-string將使你免於書寫多次+ ” ” +。我不知道過去有多少次不得不寫+運算符,但現在不會瞭!

其他連接字符串的方法是使用join()方法或format()函數,然而f-string在字符串連接方面做得更好。

3. 用Zip()函數對多個列表進行迭代

你是否曾經想在 Python 中循環遍歷一個以上的列表?當你有兩個列表時,你可以用 enumerate 來實現。

teams = ['Barcelona', 'Bayern Munich', 'Chelsea']
leagues = ['La Liga', 'Bundesliga', 'Premiere League']
for i, team in enumerate(teams):
    league = leagues[i]
    print(f'{team} plays in {league}')

然而,當你有兩個或更多的列表時,這變得不切實際。一個更好的方法是使用zip()函數。zip()函數接收迭代數據,將它們聚集在一個元組中,並返回之。

讓我們再增加一個列表,看看zip()的威力!

teams = ['Barcelona', 'Bayern Munich', 'Chelsea']
leagues = ['La Liga', 'Bundesliga', 'Premiere League']
countries = ['Spain', 'Germany', 'UK']
for team, league, country in zip(teams, leagues, countries):
    print(f'{team} plays in {league}. Country: {country}')

上述代碼的輸出結果為:

Barcelona plays in La Liga. Country: Spain
Bayern Munich plays in Bundesliga. Country: Germany
Chelsea plays in Premiere League. Country: UK

此處你註意到我們在這個例子中使用瞭f-string嗎?代碼變得更有可讀性,不是嗎?

4. 使用列表理解法

清洗和處理數據的一個常見步驟是修改現有的列表。比如,我們有以下需要大寫的列表:

words = ['california', 'florida', 'texas']

將words列表的每個元素大寫的典型方法是創建一個新的大寫列表,執行一次 for 循環,使用.title(),然後將每個修改的值附加到新的列表中。

capitalized = []
for word in words:
    capitalized.append(word.title())

然而,Pythonic的方法是使用列表理解來做到這一點。列表理解有一種優雅的方法來制作列表。

你可以用一行代碼重寫上面的for循環:

capitalized = [word.title() for word in words]

由此我們可以跳過第一個例子中的一些步驟,結果是一樣的。

5. 對文件對象使用with語句

當在一個項目上工作時,我們經常會對文件進行讀寫操作。最常見的方法是使用open()函數打開一個文件,它會創建一個我們可以操作的文件對象,然後作為一個習慣的做法,我們應該使用close()關閉該文件對象。

f = open('dataset.txt', 'w')
f.write('new_data')
f.close()

這很容易記住,但有時寫瞭幾個小時的代碼,我們可能會忘記用f.close()關閉f文件。這時,with語句就派上瞭用場。with語句將自動關閉文件對象f,形式如下:

with open('dataset.txt', 'w') as f:
    f.write('new_data')

有瞭這個,我們可以保持代碼的簡短。

你不需要用它來讀取CSV文件,因為你可以用pandas的 pd.read_csv()輕松地讀取,但在讀取其他類型的文件時,這仍然很有用。例如,從pickle文件中讀取數據時經常使用它。

import pickle 
# 從pickle文件中讀取數據集
with open(‘test', ‘rb') as input:
    data = pickle.load(input)

6. 停止使用方括號來獲取字典項, 利用.get()代替

比如,有以下一個字典:

person = {'name': 'John', 'age': 20}

我們可以通過person[name]和person[age]分別獲得姓名和年齡。但是,由於某種原因,我們想獲得一個不存在的鍵,如 “工資”,運行person[salary]會引發一個`KeyError’。

這時,get()方法就有用瞭。如果鍵在字典中,get()方法返回指定鍵的值,但是如果沒有找到鍵,Python 將返回None。得益於此,你的代碼不會中斷。

person = {'name': 'John', 'age': 20}
print('Name: ', person.get('name'))
print('Age: ', person.get('age'))
print('Salary: ', person.get('salary'))

輸出結果如下:

Name:  John
Age:  20
Salary:  None

7. 多重賦值

你是否曾想減少用於創建多個變量、列表或字典的代碼行數?那麼,你可以用多重賦值輕松做到這一點。

# 原始操作
a = 1
b = 2
c = 3
# 替代操作
a, b, c = 1, 2, 3
# 代替在不同行中創建多個列表
data_1 = []
data_2 = []
data_3 = []
data_4 = []
# 可以在一行中創建它們的多重賦值
data_1, data_2, data_3, data_4 = [], [], [], []
# 或者使用列表理解法
data_1, data_2, data_3, data_4 = [[] for i in range(4)]

原文鏈接:

https://towardsdatascience.com/7-tips-to-level-up-your-python-code-for-data-science-4a64dbccd86d

總結

到此這篇關於讓Python代碼簡潔的實用技巧的文章就介紹到這瞭,更多相關Python代碼簡潔技巧內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet!

推薦閱讀: