Python 迭代器和生成器概念及场景分析

2025-04-13 04:50

本文主要是介绍Python 迭代器和生成器概念及场景分析,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

《Python迭代器和生成器概念及场景分析》yield是Python中实现惰性计算和协程的核心工具,结合send()、throw()、close()等方法,能够构建高效、灵活的数据流和控制流模型,这...

迭代器的介绍

迭代器的定义:迭代器(Iterator)是 python 中用于遍历数据集合的核心机制。它提供了一种统一的方式来访问容器(如列表、字典、文件等)中的元素,而无需关心底层数据结构的具体实现。迭代器的核心特点是按需生成数据,避免一次性加载所有数据到内存。

迭代器适合处理大型数据、无限序列或需要惰性计算的场景。

迭代器的核心概念:

  • 迭代器协议

    • 一个对象要成为迭代器,必须实现以下两个方法:
      • __iter__():返回迭代器对象本身(通常直接 return self)。
      • __next__():返回下一个元素,若没有更多元素则抛出 StopIteration 异常。
    • Python 的 for 循环、next() 函数等底层都依赖这一协议。
  • 可迭代对象(Iterable) VS 迭代器(Iterator)

    差异体现在遍历机制:

    • 可迭代对象:实现了 __itChina编程er__() 方法,可以返回一个迭代器的对象(如列表、元组、字典)。
    • 迭代器:实现了 __iter__() 和 __next__() 方法的对象。
    • 所有迭代器都是可迭代对象,但可迭代对象本身不一定是迭代器。

可迭代对象
每次调用 iter() 会生成新的迭代器,因此可被多次遍历:

my_list = [1, 2, 3]
for x in my_list: print(x)  # 输出 1,2,3
for x in my_list: print(x)  # 再次输出 1,2,3

迭代器
遍历是一次性的,遍历完成后无法重置:

iterator = iter(my_list)
for x in iterator: print(x)  # 输出 1,2,3
for x in iterator: print(x)  # 无输出(迭代器已耗尽)

自定义迭代器

示例 1: 通过类实现迭代器

class CountUpTo:
    def __init__(self, max_num):
        self.max_num = max_num
        self.current = 0
    def __iter__(self):
        return self  # 返回迭代器本身
    def __next__(self):
        if self.current < self.max_num:
            self.current += 1
            return self.current
        else:
            raise StopIteration  # 终止迭代
# 使用自定义迭代器
counter = CountUpTo(3)
for num in counter:
    print(num)  # 输出 1, 2, 3

示例 2: 通过生成器函数实现(简化版)
生成器函数(使用 yield)是创建迭代器的快捷方式:

def count_up_to(max_num):
    current = 0
    while current < max_num:
        current += 1
        yield current
# 生成器返回的也是迭代器
forphp num in count_up_to(3):
    print(num)  # 输出 1, 2, 3

省略的迭代器

写过for循环的都知道,我没用迭代器呀!
用了!只不过是编译器帮你用了。

以下两段代码完全等价:

# 直接遍历列表
my_list = [1, 2, 3, 4, 5]
for x in my_list:
    print(x)
# 等价的手动迭代器操作
iterator = iter(my_list)  # 自动China编程调用 __iter__() 获取迭代器
while True:
    try:
        x = next(iterator)  # 自动调用 __next__()
        print(x)
    except StopIteration:
        break  # 自动处理终止

为什么不需要显式写迭代器?

  • 语法糖(Syntactic Sugar):for 循环是 Python 提供的一种简化语法,隐藏了迭代器的创建和异常处理细节。

  • 统一接口:所有可迭代对象(如列表、元组、字典、集合、字符串等)都可以通过 for 循环统一处理,无需关心底层是列表还是其他数据结构。

生产器的介绍

yield是个英文动词,也是名词,含义是生产的意思。

Python 迭代器和生成器概念及场景分析

yield 在 Python里就是生成器。

yield的定义:Python 的 yield 关键字用于定义生成器函数(Generator Function),生成器是一种特殊的迭代器,能够按需生成值并暂停/恢复执行状态。它的核心特性是惰性求值(Lazy EvaLuation),适用于处理大数据流、无限序列或需要节省内存的场景。

核心概念:

  • 生成器函数

    • 使用 yield 代替 return 的函数。
    • 调用生成器函数时,返回一个生成器对象(迭代器),而非直接执行函数体。
    • 生成器通过 next() 或 for 循环逐步执行,每次遇到 yield 时暂停,返回 yield 后的值,并在下次调用时从暂停处继续执行。
  • 与普通函数的区别

    • 普通函数一次执行完毕,返回一个结果。
    • 生成器函数逐步产生多个值,并在 yield 处保持状态。

与 return 的区别:

特性yieldreturn
返回值数量可多次返回值仅返回一次
函数状态暂停并保留状态终止函数执行
返回类型生成器对象(迭代器)直接返回值
内存占用低(按需生成)高(一次性生成所有数据)

yield的普通用法

示例 1: 简单生成器

def simple_generator():
    yield 1
    yield 2
    yield 3
gen = simple_generator()
print(next(gen))  # 输出 1
print(next(gen))  # 输出 2
print(next(gen))  # 输出 3
# 继续调用 next(gen) 会抛出 StopIteration 异常

示例 2: 用 for 循环遍历生成器

def count_up_to(n):
    i = 0
    while i < n:
        yield i
        i += 1
for num in count_up_to(5):
    print(num)  # 输出 0, 1, 2, 3, 4

yield的高级用法

通过 send() 传递值生成器可以通过 send(value) 接收外部传入的值,赋值给 yield 表达式:

def androidgenerator_with_send():
	value = yield "Ready to receive"
	yield f"Received: {value}"
gen = generator_with_send()
print(next(gen))         # 输出 "Ready to receive"
print(gen.send("Hello")) # 输出 "Received: Hello"

yield from 委托生Python 3.3+ 引入 yield from,用于简化嵌套生成器的操作:

def sub_generator():
	yield "A"
	yield "B"
def main_generator():
	yield from sub_generator()
	yield "C"
for item in main_generator():
	print(item)  # 输出 A, B, C

异常处理生成器可以通过 throw() 方法接收异常:

def generator_with_exception(value):
	try:
		yield 10 / value
	except ZeroDivisionError as e:
		yield "Caught ValueError"
gen = generator_with_exception(2)
print(next(gen))
gen = generator_with_exception(0)
print(next(gen))

out:

5.0
Caught ValueError

yidle的实际应用案例

大数据处理

def read_large_file(file_path):
    with open(file_path, "r") as file:
        for line in file:
            yield line.strip()  # 逐行生成,避免一次性加载到内存
for line in read_large_file("data.txt"):
    process(line)

生成无限序列

def fibonacci():
    a, b = 0, 1
    while True:
        yield a
        a, b = b, a + b
fib = fibonacci()
print([next(fib) for _ in range(10)])  # 前10个斐波那契数

协程(Coroutine)

def coroutine():
    while True:
        task = yield
        print(f"Processing: {task}")
worker = coroutine()
next(worker)       # 启动协程
worker.send("Task1")  # 输出 "Processing: Task1"
worker.send("Task2")  # 输出 "Processing: Task2"

在 Python 中,协程(Coroutine) 是一种可以暂停和恢复执行的函数,它能与调用方进行双向通信(接收和发送数据),常用于实现协作式多任务(非抢占式任务切换)。

上文提供的代码是一个典型的基于生成器的协程(Generator-based Coroutine)。

总结

yield 是 Python 中实现惰性计算协程的核心工具,结合 send()throw()close() 等方法,能够构建高效、灵活的数据流和控制流模型。

到此这篇关于Python 迭代器和生成器概念的编程文章就介绍到这了,更多相关Python 迭代器和生成器内容请搜索China编程(www.chinasem.cn)以前的文章或继续浏览下面的相关文章希望大家以后多多支持编程China编程(www.chinasem.cn)!

这篇关于Python 迭代器和生成器概念及场景分析的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!


原文地址:http://www.cppcns.com/jiaoben/python/707355.html
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.chinasem.cn/article/1154194

相关文章

Python中OpenCV与Matplotlib的图像操作入门指南

《Python中OpenCV与Matplotlib的图像操作入门指南》:本文主要介绍Python中OpenCV与Matplotlib的图像操作指南,本文通过实例代码给大家介绍的非常详细,对大家的学... 目录一、环境准备二、图像的基本操作1. 图像读取、显示与保存 使用OpenCV操作2. 像素级操作3.

Python使用FFmpeg实现高效音频格式转换工具

《Python使用FFmpeg实现高效音频格式转换工具》在数字音频处理领域,音频格式转换是一项基础但至关重要的功能,本文主要为大家介绍了Python如何使用FFmpeg实现强大功能的图形化音频转换工具... 目录概述功能详解软件效果展示主界面布局转换过程截图完成提示开发步骤详解1. 环境准备2. 项目功能结

Apache 高级配置实战之从连接保持到日志分析的完整指南

《Apache高级配置实战之从连接保持到日志分析的完整指南》本文带你从连接保持优化开始,一路走到访问控制和日志管理,最后用AWStats来分析网站数据,对Apache配置日志分析相关知识感兴趣的朋友... 目录Apache 高级配置实战:从连接保持到日志分析的完整指南前言 一、Apache 连接保持 - 性

使用Python实现Windows系统垃圾清理

《使用Python实现Windows系统垃圾清理》Windows自带的磁盘清理工具功能有限,无法深度清理各类垃圾文件,所以本文为大家介绍了如何使用Python+PyQt5开发一个Windows系统垃圾... 目录一、开发背景与工具概述1.1 为什么需要专业清理工具1.2 工具设计理念二、工具核心功能解析2.

Python实现一键PDF转Word(附完整代码及详细步骤)

《Python实现一键PDF转Word(附完整代码及详细步骤)》pdf2docx是一个基于Python的第三方库,专门用于将PDF文件转换为可编辑的Word文档,下面我们就来看看如何通过pdf2doc... 目录引言:为什么需要PDF转Word一、pdf2docx介绍1. pdf2docx 是什么2. by

Python函数返回多个值的多种方法小结

《Python函数返回多个值的多种方法小结》在Python中,函数通常用于封装一段代码,使其可以重复调用,有时,我们希望一个函数能够返回多个值,Python提供了几种不同的方法来实现这一点,需要的朋友... 目录一、使用元组(Tuple):二、使用列表(list)三、使用字典(Dictionary)四、 使

Python程序的文件头部声明小结

《Python程序的文件头部声明小结》在Python文件的顶部声明编码通常是必须的,尤其是在处理非ASCII字符时,下面就来介绍一下两种头部文件声明,具有一定的参考价值,感兴趣的可以了解一下... 目录一、# coding=utf-8二、#!/usr/bin/env python三、运行Python程序四、

MySQL 事务的概念及ACID属性和使用详解

《MySQL事务的概念及ACID属性和使用详解》MySQL通过多线程实现存储工作,因此在并发访问场景中,事务确保了数据操作的一致性和可靠性,下面通过本文给大家介绍MySQL事务的概念及ACID属性和... 目录一、什么是事务二、事务的属性及使用2.1 事务的 ACID 属性2.2 为什么存在事务2.3 事务

python web 开发之Flask中间件与请求处理钩子的最佳实践

《pythonweb开发之Flask中间件与请求处理钩子的最佳实践》Flask作为轻量级Web框架,提供了灵活的请求处理机制,中间件和请求钩子允许开发者在请求处理的不同阶段插入自定义逻辑,实现诸如... 目录Flask中间件与请求处理钩子完全指南1. 引言2. 请求处理生命周期概述3. 请求钩子详解3.1

Linux中的more 和 less区别对比分析

《Linux中的more和less区别对比分析》在Linux/Unix系统中,more和less都是用于分页查看文本文件的命令,但less是more的增强版,功能更强大,:本文主要介绍Linu... 目录1. 基础功能对比2. 常用操作对比less 的操作3. 实际使用示例4. 为什么推荐 less?5.