【Python 秘籍】让字典的键对应的值可以随时添加

问题

我们想要一个能让键(key)对应的值可以随时进行添加(即所谓的一键多值字典 [multidict])

解决方案

字典是一种关联容器,每个键都映射到一个单独的值上。如果想让键对应的值可以随时添加,需要将这些值保存到另一个容器如列表或集合中。例如,可能会像这样创建字典:

d = {
    'a' : [1, 2, 3],
    'b' : [4, 5]
}

e = {
    'a' : {1, 2, 3},
    'b' : {4, 5}
}

要使用列表还是集合完全取决于应用的意图。如果希望保留元素插入的顺序,就用列表。如果希望消除重复元素(且不在意它们的顺序),就用集合。

为了能方便地创建这样的字典,可以利用 collections 模块中的 defaultdict 类。defaultdict 的一个特点就是它会自动初始化第一个值,这样只需关注添加元素即可。例如:

from collections import defaultdict

d = defaultdict(list)
d['a'].append(1)
d['a'].append(2)
d['b'].append(4)
...

d = defaultdict(set)
d['a'].add(1)
d['a'].add(2)
d['b'].add(4)
...

关于 defaultdict,需要注意的一个地方是,它会自动创建字典表项以待稍后的访问(即使这些表项当前在字典中还没有找到)。如果不想要这个功能,可以在普通的字典上调用 setdefault() 方法来取代。例如:

d = {}  # 一个普通字典
d.setdefault('a', []).append(1)
d.setdefault('a', []).append(2)
d.setdefault('b', []).append(4)
...

然而,许多程序员觉得使用 setdefault()有点不自然——更别提每次调用它时都会创建一个初始值的新实例了(例子中的空列表 [])。

原则上,构建一个一键多值字典是很容易的。但是如果试着自己对第一个值做初始化操作,这就会变得很杂乱。例如,可能会写下这样的代码:

d = {}
for key, value in pairs:
    if key not in d:
        d[key] = []
    d[key].append(value)

使用 defaultdict 后代码会清晰得多:

d = defaultdict(list)
for key, value in pairs:
    d[key].append(value)