2013年5月4日 星期六

generator 和 list 簡單比較

這篇文章我第一次發表在 ptt.cc。之後在把它複製過來。下次應該先寫在網誌,在貼 ptt.cc 的 XD

python 的 list comprehension 有分兩種,

一種是[i for i in xrange(5)],這種形式產生出來的是 list

另外一種形式是 (i for i in xrange(5)),這種形式產生出來的是 generator




通常 generator 會拿來和 list 做比較

generator 某種程度上算是 Lazy Computation。

他不會一次產生所有的物件,而是需要該物件時才會產生。

舉個例子:

data = [0, 1, 2, 3, 4, 5, 6]

a = [i for i in data]: # 這種寫法他會把 data 裡的資料先複製一份出來
print a[3] # 可以印出 3
for i in [i for i in data]:
        if  i > 3:
                break
# 上面這個情形,因為他會先把資料複製一份出來
# 所以 5, 6 你有複製,實際上卻沒被使用

# 做白工

b = (i for i in data): # 這種寫法他只會產生一個 generator,
# 而非建立一個list
for i in (i for i in data):
        if i > 3:
                break
# 上面這種情形,5, 6 並不會被複製
# 因此效能較高


註1: 因為 python 有對小整數(-5~256)做快取的動作,因此上面說的複製未必
是真的複製。簡單的例子如下


a = 5
b = 4
print id(a), id(b + 1)

a = -8

b = -9

print id(a), id(b + 1)

註2: cpython 中的 id 函數回傳值為記憶體位址

沒有留言:

張貼留言