迭代器

迭代就是重复的一个过程,但是不是单纯的重复,每一次的重复都是基于上一次的结果产生的。不过只记住迭代他就是重复的执行过程就是了。

  1. #单纯的重复不是迭代,例如:
  2. count = 0
  3. while count < 3:
  4. print(count)
  5. count += 1
  6. #每一次的重复都是基于上一次的结果产生的,随着count的改变输出不同的结果
  7. count = 0
  8. list = ["a", "b", "c"]
  9. while count < 3:
  10. print(list[count])
  11. count += 1

 

迭代器就是迭代取数的一个工具,关键是我们为什么要用迭代器呢?我们都知道python中主要的一些数据类型有整型,字符串,元祖,列表,字典,集合,文件等。对于整型而言只要一个数没有什么迭代器的概念,对于字符串,元祖和列表我们可以通过索引去取值,但是对于字典,集合以及文件而言,我们怎么去像列表一样进行取值呢?这就是迭代器引入的原因,主要就是为了不依赖与索引进行迭代取值。在python中两个概念,一个就是可迭代对象(只要有__iter__方法的我们就称之为可迭代对象,字符串,元祖,列表,字典,集合都是可迭代对象),二是迭代器对象(不仅要有__iter__方法而且还要有__next__方法,文件是迭代器对象),从上面的描述我们就可以看出来,迭代器对象都是可迭代的对象,但是可迭代对象却不一定是迭代器对象。

迭代器的使用方法

  1. dic = {'name': 'hu', 'age': 12}
  2. iter_dic = dic.__iter__() # 可迭代对象要变成迭代器才能够进行使用
  3. res = iter_dic.__next__() # 变成迭代器之后通过__next__方法进行迭代取值
  4. print(res) # 对于dic迭代的值是key

当迭代器把迭代对象循环完毕之后会报错

  1. dic = {'name': 'hu', 'age': 12}
  2. count = 0
  3. iter_dic = dic.__iter__() # 可迭代对象要变成迭代器才能够进行使用
  4. while count < len(dic):
  5. try: # 当最后一个迭代完了之后会报错,因此我们需要捕捉异常
  6. res = iter_dic.__next__() # 变成迭代器之后通过__next__方法进行迭代取值
  7. print(res) # 对于dic迭代的值是key
  8. except StopIteration:
  9. break

从上面的代码我们就可以看出来,对于迭代器的使用太过于麻烦,因此python给我们专门的设计了一个循环for循环来解决这样的事情,for循环可以专门的去解决可迭代对象的问题,当然迭代器对象的问题也可以,for循环处理的步骤1. 把可迭代对象转换成迭代器,(迭代器的话也会执行__iter__的方法,效果是一样的)2. 循环的去调用__next__方法进行迭代取值。3. 通过try去捕捉异常,捕捉到异常之后停止循环。

  1. # 和上面的代码显示的效果是一样的
  2. dic = {'name': 'hu', 'age': 12}
  3. for i in dic:
  4. print(i)

  

生成器

  生成器本质上就是迭代器,只不过这个生成器是我们自己通过yield关键字自己创建的迭代器而已。迭代器有两个优点 1. 可以不依赖与索引迭代取值   2.节省内存。而我们创建生成器为了解决最大的问题其实就是节省内存。

生成器创建的规则, 通过yield关键字进行创建迭代器。yield和return返回的是一样的,只是yield可以中断函数,当我需要的时候可以重新再进行创建

  1. def foo()
  2. print(1)
  3. yield "第一"
  4. print(2)
  5. yield "第二"
  6. iter_foo = foo()
  7. print(iter_foo)
  8. next(iter_foo)

 

三元表达式

  1. def max2(a, b):
  2. if a > b:
  3. return a
  4. else:
  5. return b
  6. a = 1
  7. b = 2
  8. c = a if a > b else b # 这一行数据就是上面那一个函数的简洁的表达方式
  9. print(c)
  10. c = max2(a, b)
  11. print(c)

 

列表生成式

  1. l = []
  2. for i in range(10):
  3. if i > 5:
  4. s = "egg%s" % i
  5. l.append(s)
  6. print(l)
  7. l = ["egg%s" % i for i in range(10) if i > 5] # 这一句话和前面的几句话都是性质是一样的,只是简写了而已
  8. print(l)

 

生成字典表达式

  1. d = {}
  2. s = [("hu", 12), ("zhou", 14)]
  3. for k, v in s:
  4. d[k] = v
  5. print(d)
  6. d = {k : v for k, v in s} # 这个是上面几行代码的缩写
  7. print(d)

生成器表达式

  1. res = (i ** 2 for i in range(5))
  2. print(res)
  3. print(next(res))
  4. print(next(res))
  5. print(next(res))

 

练习题:

1. 编写一个range的生成器

  1. def my_range(start, end , step=1):
  2. while start < end:
  3. yield start
  4. start += step
  5. for i in my_range(0, 10):
  6. print(i)

View Code

2. 求一个文件中所包含的字符的个数,以及左右行中最大的个数

  1. with open(r'04_多层装饰器的联系.py', 'rt', encoding='utf-8') as f:
  2. # count = 0
  3. # for line in f:
  4. # count += 1
  5. # data = f.read()
  6. # print(len(data)) 649
  7. # count = 0
  8. # for line in f:
  9. # count += len(line)
  10. # print(count)
  11. # print(sum(len(line) for line in f))
  12. print(max(len(line) for line in f)) # 通过生成器表达式一行写出

View Code

3. 模拟管道,实现功能:tail -f access.log | grep ‘404’

  1. # 2、模拟管道,实现功能:tail -f access.log | grep '404'
  2.  
  3. import time
  4. def tail(file_path):
  5. with open(file_path, 'rb') as f:
  6. f.seek(0, 2)
  7. while True:
  8. # 查看是否有新的一行加入
  9. line = f.readline()
  10. if line:
  11. yield line
  12. else:
  13. time.sleep(0.2)
  14. def grep(pattern, iter_tail):
  15. for line in iter_tail:
  16. line = line.decode('utf-8')
  17. if pattern in line:
  18. yield line
  19. for line in grep('404', tail('access.log')):
  20. print(line)

View Code

 

版权声明:本文为huwentao原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://www.cnblogs.com/huwentao/p/9720509.html