Python 语法糖之「列表推导式」

有时候一些普遍的设计模式应用得非常广泛,慢慢的就形成了一种语法,或者叫 语法糖,Python 中的列表推导式 就是其中的典型代表。列表推导式是一种可以让代码更简洁,并且可以增加可读性和执行效率的方法,但是要掌握好这个语法则有些难。

下面就带你好好认识下 列表推导式,学完之后你就知道这个语法糖有多「甜」。

1 从一个例子开始

事情的起因是这样的,在交流群里,一个小伙伴问如何把下面这种数据:

1
2
[{'city': '北京北京', 'max_temp': '35', 'min_temp': '23'}, 
{'city': '北京海淀', 'max_temp': '36', 'min_temp': '23'}]

转换成这种:

1
[('北京北京', '35'), ('北京海淀', '36')]

即把一个 dict 组成的 list,从中抽取目标数据,转换成另外一个 list。

部分人的第一想法就是用 for 循环遍历 list,对每个元素进行处理:

1
2
3
4
old_list = [{'city': '北京北京', 'max_temp': '35', 'min_temp': '23'}, {'city': '北京海淀', 'max_temp': '36', 'min_temp': '23'}]
new_list = []
for item in old_list:
new_list.append((item['city'], item['max_temp']))

其实,这种时候就可以用列表推导式:

1
new_list = [(item['city'], item['max_temp']) for item in old_list]

是不是更加优雅,简洁?

2 到底什么是列表推导式

通过上面的例子,我们可以看出列表解析式是将一个列表(实际上适用于任何可迭代对象)转换成另一个列表的工具。

并且在转换过程中,可以指定元素必须符合一定的条件,才能添加至新的列表中,这样每个元素都可以按需要进行转换。

可迭代对象:
以直接作用于 for 循环的数据类型有以下几种:

  • 集合数据类型,如 list、 tuple、 dict、 set、 str 等;
  • generator,包括生成器和带 yield 的 generator function。

这些可以直接作用于 for 循环的对象统称为可迭代对象: Iterable。
可以使用 isinstance() 判断一个对象是否是 Iterable 对象,如:isinstance([1,2,3], Iterable)

3 基本语法

1
new_list = [expression(i) for i in old_list if condition(i)]

翻译成 for 循环就是:

1
2
3
4
new_list = []
for i in old_list:
if (condition):
new_list.append(expression(i))

4 使用示例

4.1 list 元素的简单处理

1
2
3
4
5
6
7
8
9
10
11
12
>>> x = [i for i in range(10)]
# 对每个元素求平方
>>> print([i**2 for i in x])
[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]

# 每个元素乘以 3
>>> print([i*3 for i in x])
[0, 3, 6, 9, 12, 15, 18, 21, 24, 27]

# 获取其中的偶数
>>> print([i for i in x if i%2==0])
[0, 2, 4, 6, 8]

4.2 for 的嵌套

语法如下:

1
2
3
4
[ expression for x in X [if condition1 if condition2]
for y in Y [if condition]
...
for n in N [if condition] ]
1
2
3
4
5
>>> print([ (x, y) for x in range(10) if x % 2 if x > 3 for y in range(10) if y > 7 if y != 8 ])
[(5, 9), (7, 9), (9, 9)]

>>> [(x,y) for x in range(3) for y in range(3)]
[(0, 0), (0, 1), (0, 2), (1, 0), (1, 1), (1, 2), (2, 0), (2, 1), (2, 2)]

理论上可以嵌套多层,不过一般两层,不会超过三层。

4.3 对字符串操作

1
2
3
4
5
6
7
8
9
>>> words = ["this","is","a","list","of","words"]

# 取每个单词的首字母
>>> print( [word[0] for word in words])
['t', 'i', 'a', 'l', 'o', 'w']

# 对字符串列表中的单词取小写
>>> [x.lower() for x in ["A","b","Ca"]]
['a', 'b', 'ca']

4.4 对 dict 操作

1
2
3
4
5
6
7
8
9
10
11
12
13
>>> d = {'a':1,'b':2,'c':3}

# 筛选 value 值
>>> print([i for i in d.values() if i >1])
[2, 3]

# 获取 key 值列表,并且可以加 if 判断
>>> print([i for i in d.keys()])
['b', 'a', 'c']

# 在 value 不重复的情况下,交换 key 和 value
>>> print({(j,i) for (i,j) in d.items() })
{(1, 'a'), (3, 'c'), (2, 'b')}

列表推导式讲到这里,相信大家应该都能理解个差不多了。从实际使用经验来看,列表推导式使用的频率是非常高的,也是相当好用的。掌握列表推导式使用时机的关键,在于不断练习识别那些看上去像列表推导式的问题。

而对于列表推导式的多层 for 循环,尤其是 3 层以上的或带复杂筛选条件的,会牺牲较多的可读性,还是建议用 for 循环实现,多几行代码就多几行吧。

hoxis wechat
一个脱离了高级趣味的程序员,关注回复1024有惊喜~
赞赏一杯咖啡
0%