Python并发编程之深入理解yield from语法(八)

大家好,并发编程 进入第八篇。 直到上一篇,我们终于迎来了Python并发编程中,最高级、最重要、当然也是最难的知识点–协程。 当你看到这一篇的时候,请确保你对生成器的知识,有一定的了解。当然不了解,也没有关系,你只要花个几分钟的时间,来看下我上一篇文章,就能够让你认识生成器,入门协程了。 再次提醒: 本系列所有的代码均在Python3下编写,也建议大家尽快投入到Python3的怀抱中来。 本文目录 为什么要使用协程 yield from的用法详解 为什么要使用yield from . 为什么要使用协程 在上一篇中,我们从生成器的基本认识与使用,成功过渡到了协程。 但一定有许多人,只知道协程是个什么东西,但并不知道为什么要用协程?换句话来说,并不知道在什么情况下用协程? 它相比多线程来说,有哪些过人之处呢? 在开始讲yield from 之前,我想先解决一下这个给很多人带来困惑的问题。 举个例子。 假如我们做一个爬虫。我们要爬取多个网页,这里简单举例两个网页(两个spider函数),获取HTML(耗IO耗时),然后再对HTML对行解析取得我们感兴趣的数据。 我们的代码结构精简如下: def spider_01(url): html = get_html(url) … data = parse_html(html) def spider_02(url): html = get_html(url) … data = parse_html(html) 我们都知道,get_html()等待返回网页是非常耗IO的,一个网页还好,如果我们爬取的网页数据极其庞大,这个等待时间就非常惊人,是极大的浪费。 聪明的程序员,当然会想如果能在get_html()这里暂停一下,不用傻乎乎地去等待网页返回,而是去做别的事。等过段时间再回过头来到刚刚暂停的地方,接收返回的html内容,然后还可以接下去解析parse_html(html)。 利用常规的方法,几乎是没办法实现如上我们想要的效果的。所以Python想得很周到,从语言本身给我们实现了这样的功能,这就是yield语法。可以实现在某一函数中暂停的效果。 试着思考一下,假如没有协程,我们要写一个并发程序。可能有以下问题 1)使用最常规的同步编程要实现异步并发效果并不理想,或者难度极高。 2)由于GIL锁的存在,多线程的运行需要频繁的加锁解锁,切换线程,这极大地降低了并发性能; 而协程的出现,刚好可以解决以上的问题。它的特点有 协程是在单线程里实现任务的切换的 利用同步的方式去实现异步 不再需要锁,提高了并发性能 . yield from的用法详解 yield […]