【Python 秘籍】让字典保持有序

问题

我们想创建一个字典,同时当对字典做迭代或系列化操作时,也能控制其中元素的顺序。

解决方案

要控制字典中元素的顺序,可以使用 collections 模块中的 OrderedDict 类。当对字典做迭代时,它会严格按照元素初始添加的顺序进行。例如:

from collections import OrderedDict

d = OrderedDict()
d['foo'] = 1
d['bar'] = 2
d['spam'] = 3
d['grok'] = 4

# 依次输出foo 1,bar 2,spam 3,grok 4
for key in d:
    print(key, d[key])

当想构建一个映射结构以便稍后对其做序列化或编码成另一种格式时,OrderedDict 就显得特别有用。例如,如果想在进行 JSON 编码时精确控制各字段的顺序,那么只要首先在 OrderedDict 中构建数据就可以了。

>>> import json
>>> json.dumps(d)
'{"foo": 1, "bar": 2, "spam": 3, "grok": 4}'
>>>

高级用法

OrderedDict 内部维护了一个双向链表,它会根据元素加入的顺序来排列键的位置。第一个新加入的元素被放置在链表的末尾。接下来对已存在的键做重新赋值不会改变键的顺序。

请注意 OrderedDict 的大小是普通字典的 2 倍多,这是由于它额外创建的链表所致。因此,如果打算构建一个涉及大量 OrderedDict 实例的数据结构(例如从 CSV 文件中读取 100000 行内容到 OrderedDict 列表中),那么需要认真对应用做需求分析,从而判断使用 OrderedDict 所带来的好处是否能超越因额外的内存开销所带来的缺点。