Python 把兩層列表展開平鋪成一層(5種實現方式)

Posted on 2021-04-07 by WalkonNet

這幾天和同事在討論，如何用 Python 寫出優雅的讓列表中的列表展開，變成扁平化的列表。

例如

# 期望輸入
input = [[('A', 1), ('B', 2)], [('C', 3), ('D', 4)]]
 
# 期望輸出
output = [('A', 1), ('B', 2), ('C', 3), ('D', 4)]

map 函數合並

>>> new = []; map(new.extend, input); new
[None, None]
[('A', 1), ('B', 2), ('C', 3), ('D', 4)]

這個方法看上去還可以，但是有個致命的缺點，就是map函數會返回值，並且這個返回值是沒有用的。另外還需要提前聲明一個變量，從代碼的簡潔性上，不夠簡潔優雅。

sum 函數合並

>>> sum(input, [])
[('A', 1), ('B', 2), ('C', 3), ('D', 4)]

這個看上去很簡潔，不過有類似字符串累加的性能陷阱。後面有性能對比。

reduce 函數

>>> reduce(list.__add__, input)
[('A', 1), ('B', 2), ('C', 3), ('D', 4)]

做序列的累加操作。也是有累加的性能陷阱。

列表推導式

>>> [item for sublist in input for item in sublist]
[('A', 1), ('B', 2), ('C', 3), ('D', 4)]

列表推導式，看著有些長，而且還要for循環兩次，變成一行理解需要費勁一些，沒有那麼直觀。

itertools 類庫

>>> list(itertools.chain(*input))
[('A', 1), ('B', 2), ('C', 3), ('D', 4)]

通過第三方類庫類實現的，相比其他的幾個實現，看著還算比較優雅。最後的性能發現居然還很高。

性能大對比

python -mtimeit -s'l=[[1,2,3],[4,5,6], [7], [8,9]]*99' 'reduce(list.__add__,l)'
1000 loops, best of 3: 547 usec per loop
python -mtimeit -s'l=[[1,2,3],[4,5,6], [7], [8,9]]*99' 'sum(l, [])'
1000 loops, best of 3: 509 usec per loop
python -mtimeit -s'l=[[1,2,3],[4,5,6], [7], [8,9]]*99' '[item for sublist in l for item in sublist]'
10000 loops, best of 3: 52.8 usec per loop
python -mtimeit -s'l=[[1,2,3],[4,5,6], [7], [8,9]]*99; import itertools;' 'list(itertools.chain(*l))'
10000 loops, best of 3: 35.9 usec per loop
python -mtimeit -s'l=[[1,2,3],[4,5,6], [7], [8,9]]*99' 'new = []; map(new.extend, l); new'
10000 loops, best of 3: 34.1 usec per loop

歡迎大傢共同探討優雅的的實現和性能的優化。

補充：python 將(含嵌套的)dict平鋪展開

話不多說，直接上代碼：

def prefix_dict(di_, prefix_s=''):
  """
  把字典的每個key都帶上前綴prefix_s
  :param di_:
  :param prefix_s:
  :return:
  """
  return {prefix_s + k: v for k, v in di_.items()} 
 
def spear_dict(di_, con_s='.'):
  """
  展開dict(如果下層還是dict)，需要遞歸，展開到下層的數據類型不是字典為止
  可能實用的地方：將文檔類的數據格式化成更加關系化的樣子可能有用
  :param di_: 輸入字典
  :param con_s: 層級間的連接符號
  :return: 深度不大於1的字典，嵌套的其他數據類型照舊
  """
  ret_di = {}
  for k, v in di_.items():
    if type(v) is dict:
      v = spear_dict(v)
      # 這裡或許有不寫到這一層的更好寫法
      # for k_, v_ in v.items():
      #   ret_di.update({con_s.join([k, k_]): v_})
      ret_di.update(prefix_dict(v, prefix_s=k + con_s))
    else:
      ret_di.update({k: v})
  return ret_di

>>> di_
{'title': '新田商業街', 'reliability': 7, 'addressComponents': {'streetNumber': '', 'city': '深圳市', 'street': '', 'province': '廣東省', 'district': '龍華區'}, 'location': {'lng': 114.09127044677734, 'lat': 22.700519561767578}, 'adInfo': {'adcode': '440309'}, 'level': 11, 'more_deep': {'loca': {'lng': 114.09127044677734, 'lat': 22.700519561767578}}}
>>> spear_dict(di_)
{'title': '新田商業街', 'reliability': 7, 'addressComponents.streetNumber': '', 'addressComponents.city': '深圳市', 'addressComponents.street': '', 'addressComponents.province': '廣東省', 'addressComponents.district': '龍華區', 'location.lng': 114.09127044677734, 'location.lat': 22.700519561767578, 'adInfo.adcode': '440309', 'level': 11, 'more_deep.loca.lng': 114.09127044677734, 'more_deep.loca.lat': 22.700519561767578}
spear_dict(di_, '_')
{'title': '新田商業街', 'reliability': 7, 'addressComponents_streetNumber': '', 'addressComponents_city': '深圳市', 'addressComponents_street': '', 'addressComponents_province': '廣東省', 'addressComponents_district': '龍華區', 'location_lng': 114.09127044677734, 'location_lat': 22.700519561767578, 'adInfo_adcode': '440309', 'level': 11, 'more_deep_loca.lng': 114.09127044677734, 'more_deep_loca.lat': 22.700519561767578}

以上為個人經驗，希望能給大傢一個參考，也希望大傢多多支持WalkonNet。如有錯誤或未考慮完全的地方，望不吝賜教。

Python 把兩層列表展開平鋪成一層(5種實現方式)

map 函數合並

sum 函數合並

reduce 函數

列表推導式

itertools 類庫

性能大對比

推薦閱讀：

發佈留言取消回覆

近期文章

map 函數合並

sum 函數合並

reduce 函數

列表推導式

itertools 類庫

性能大對比

推薦閱讀：

發佈留言 取消回覆

近期文章

標籤

發佈留言取消回覆