[Python]zip 和 izip , izip_longest 比较

zip 是 build-in 方法

而 izip 是 itertools 中的一个方法




This function returns a list of tuples, where the i-th tuple contains the i-th element from each of the argument sequences or iterables. The returned list is truncated in length to the length of the shortest argument sequence.


In [27]: a = [‘a’, ‘b’, ‘c’, ‘d’, ‘e’]

In [28]: b = range(10)

In [29]: zip(a,b)
Out[29]: [(‘a’, 0), (‘b’, 1), (‘c’, 2), (‘d’, 3), (‘e’, 4)]

组合之后的元组长度是依照两个输入序列中最短的 a 为准的。

如果输入的两个序列都是特别大的情况,zip 就会很慢了。使用 izip 比较下。

In [30]: a = range(10000000)

In [31]: b = range(10000000)

In [32]: tim
%%timeit %time %timeit

In [32]: %timeit(zip(a,b))
1 loops, best of 3: 811 ms per loop

In [33]: import itertools

In [34]: %timeit(itertools.izip(a,b))
1000000 loops, best of 3: 349 ns per loop

这样看 izip 会快的多。



Make an iterator that aggregates elements from each of the iterables. Like zip() except that it returns an iterator instead of a list. Used for lock-step iteration over several iterables at a time.

把不同的迭代器的元素聚合到一个迭代器中。类似 zip()方法,但是返回的是一个迭代器而不是一个 list。用于同步迭代一次几个 iterables

orangleliu: 因为返回的是一个迭代器,并且同步迭代,所以速度比较快。


Make an iterator that aggregates elements from each of the iterables. If the iterables are of uneven length, missing values are filled-in with fillvalue. Iteration continues until the longest iterable is exhausted

也就是说这个 zip 方法使用 izip 一样的原理,但是会使用最长的迭代器来作为返回值的长度,并且可以使用 fillvalue 来制定那些缺失值的默认值

In [35]: a = [‘a’,‘b’,‘c’]

In [36]: b = range(10)

In [37]: itertools.izip_longest(a,b,fillvalue=-1)
Out[37]: <itertools.izip_longest at 0x250e540>

In [38]: c = itertools.izip_longest(a,b,fillvalue=-1)

In [42]: for i in c:
….: print i
(‘a’, 0)
(‘b’, 1)
(‘c’, 2)
(-1, 3)
(-1, 4)
(-1, 5)
(-1, 6)
(-1, 7)
(-1, 8)
(-1, 9)
