前部分转自:
https://www.cnblogs.com/Tsukasa/p/6613934.html
通过列表list生成器,我们可以直接创建一个列表
1
2
3
|
>>> x = list ( range ( 1 , 11 )) >>> x [ 1 , 2 , 3 , 4 , 5 , 6 , 7 , 8 , 9 , 10 ] |
但是,受到内存的限制,列表的容量是有限的,而且创建一个包含100万1个亿的列表时候,不仅会占用很大的储存空间,如果有事我们只要访问前面几个元素,那后面大多数元素都白白浪费了。而且运作效率低下。
如果列表元素可以按某种算法推算出来,那我们是否可以在循环的过程中不断推算出后面的元素呢?这样就不必要创建一个完整的list列表了,从而提升程序的效率。在python中,这种一边循环一边计算的机制,称为生成器generator
要创建一个generator,有很多方法:
第一种方法很简单,就是只要把一个列表生成试的 [ ] 改成 ( ) 就可以创建一个generator:
1
2
3
4
5
6
|
>>> l = [x * x for x in range ( 10 )] >>> l [ 0 , 1 , 4 , 9 , 16 , 25 , 36 , 49 , 64 , 81 ] >>> g = (x * x for x in range ( 10 )) >>> g <generator object <genexpr> at 0x00000000035BC410 > |
L 是一个list, 而 G 是一个generator:它们在创建时候最基本的不同就list是 [ ] ,而generator是 ( ) 。
我们可以直接打印出list的全部元素,但是怎么打印出generator的全部元素呢?
1
2
|
>>> g <generator object <genexpr> at 0x00000000035BC410 > |
如果要一个个打印出来,可以通过next()函数来获得generator的下一个返回值。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
|
>>> next (g) 0 >>> next (g) 1 >>> next (g) 4 >>> next (g) 9 >>> next (g) 16 >>> next (g) 25 >>> next (g) 36 >>> next (g) 49 >>> next (g) 64 >>> next (g) 81 >>> next (g) Traceback (most recent call last): File "<pyshell#18>" , line 1 , in <module> next (g) StopIteration |
generator保存的是算法,每次调用 next(g)的时候才会计算 g 的下一个元素值,直到计算到最后一个元素,没有下一个元素时,会返回stopIteration的错误。
当然,上面这种不停调用next (g)这种方法实在是太繁琐了,正确的方法是使用for循环,因为generator也是一个可迭代对象:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
|
>>> g = (x * x for x in range ( 10 )) >>> for n in g: ... print (n) ... 0 1 4 9 16 25 36 49 64 81 |
jieba的cut_for_search输出可以按:
seg_list = jieba.cut_for_search("你好明天")
print(",".join(seg_list)) seglist 为generator
原文:https://www.cnblogs.com/NPC-assange/p/10528287.html