匠心精神 - 良心品质腾讯认可的专业机构-IT人的高薪实战学院

咨询电话:4000806560

Python中的异步编程,让你的代码运行更快更高效

Python中的异步编程,让你的代码运行更快更高效

随着计算机应用的广泛普及,人们对计算机程序的运行效率要求也越来越高。为了满足这些需求,开发人员开始尝试异步编程,这种编程方式可以让程序在同一个线程内异步地执行多个任务,以提高程序的运行效率。在Python中,异步编程的实现依靠的是`asyncio`模块。本文将为大家介绍Python中的异步编程,让你的代码运行更快更高效。

1.异步编程的优势

传统的编程方式是基于多线程或多进程的并发,但是这种方式存在许多问题。比如,线程和进程切换时会有一定的开销,而且线程之间如果共享数据,需要使用锁来控制并发,从而导致程序变得复杂难以维护。因此,开发人员开始尝试使用异步编程来解决这些问题。

异步编程的优势在于可以让程序在同一个线程内异步地执行多个任务,从而避免了线程切换的开销。此外,由于异步编程避免了锁的使用,因此程序会更加简单易懂。最重要的是,异步编程可以大大提高程序的执行效率。

2.异步编程的基本原理

在Python中,异步编程的实现依靠的是`asyncio`模块。`asyncio`模块提供了异步编程所需的基本工具,包括协程、事件循环、任务等。

协程是异步编程的基本单位,它代表一个可以暂停执行并在稍后继续执行的函数。在Python中,可以使用`async def`关键字定义一个协程函数。例如:

```
async def coroutine():
    # do something here...
```

在协程函数中,可以使用`await`关键字暂停执行当前协程,并等待另一个协程完成。例如:

```
async def coroutine1():
    print('coroutine1 started')
    await coroutine2()
    print('coroutine1 resumed')

async def coroutine2():
    print('coroutine2 started')
    print('coroutine2 resumed')
```

在上面的代码中,`coroutine1`和`coroutine2`都是协程函数。当调用`coroutine1`时,它会打印出`coroutine1 started`,然后暂停执行,并调用`coroutine2`。当`coroutine2`执行完毕后,`coroutine1`会恢复执行,并打印出`coroutine1 resumed`。注意到,在`coroutine1`中,使用了`await`关键字来暂停执行,并等待`coroutine2`完成。这样,程序就可以在同一个线程内异步地执行多个协程。

事件循环是异步编程中的另一个关键概念,它负责调度协程的执行。在`asyncio`模块中,可以使用`asyncio.get_event_loop`函数来获取事件循环对象。例如:

```
import asyncio

async def coroutine1():
    print('coroutine1 started')
    await coroutine2()
    print('coroutine1 resumed')

async def coroutine2():
    print('coroutine2 started')
    print('coroutine2 resumed')

loop = asyncio.get_event_loop()
loop.run_until_complete(coroutine1())
```

在上面的代码中,先定义了`coroutine1`和`coroutine2`,然后使用`asyncio.get_event_loop`函数获取事件循环对象。最后,调用`loop.run_until_complete(coroutine1())`启动事件循环,并等待`coroutine1`协程执行完毕。

任务是异步编程中的另一个重要概念,它代表一个可以被调度的协程。在`asyncio`模块中,可以使用`asyncio.create_task`函数来创建一个任务,例如:

```
import asyncio

async def coroutine1():
    print('coroutine1 started')
    await coroutine2()
    print('coroutine1 resumed')

async def coroutine2():
    print('coroutine2 started')
    print('coroutine2 resumed')

loop = asyncio.get_event_loop()
task = loop.create_task(coroutine1())
loop.run_until_complete(task)
```

在上面的代码中,先定义了`coroutine1`和`coroutine2`,然后使用`loop.create_task(coroutine1())`函数创建了一个任务。最后,调用`loop.run_until_complete(task)`启动事件循环,并等待任务执行完毕。

3.异步编程的实例

下面是一个利用异步编程实现的例子,实现了对多个网站的并发访问和数据解析。具体代码如下:

```
import asyncio
import aiohttp
from bs4 import BeautifulSoup

async def fetch_html(url, session):
    async with session.get(url) as response:
        return await response.text()

async def parse_html(html):
    soup = BeautifulSoup(html, 'html.parser')
    title = soup.find('title').string.strip() if soup.title else 'No title'
    return title

async def main():
    urls = [
        'https://www.python.org',
        'https://www.baidu.com',
        'https://www.github.com',
        'https://www.zhihu.com',
        'https://www.google.com',
    ]

    async with aiohttp.ClientSession() as session:
        tasks = []
        for url in urls:
            task = asyncio.ensure_future(fetch_html(url, session))
            tasks.append(task)

        done, pending = await asyncio.wait(tasks)

        for task in done:
            html = await task
            title = await parse_html(html)
            print(f'Title: {title}')

if __name__ == '__main__':
    loop = asyncio.get_event_loop()
    loop.run_until_complete(main())
```

在上面的代码中,先定义了三个协程函数:`fetch_html`、`parse_html`和`main`。其中,`fetch_html`用于异步获取网页内容,`parse_html`用于异步解析网页内容,`main`用于控制整个异步流程。在`main`函数中,首先定义了多个网站的URL,然后使用`aiohttp.ClientSession`创建一个异步HTTP客户端,以异步地获取每个网站的内容。在获取网站内容的过程中,使用`asyncio.wait`函数等待每个任务的完成。最后,解析每个网站的内容,并输出每个网站的标题。

4.总结

本文介绍了Python中的异步编程,让你的代码运行更快更高效。异步编程在Python中的实现依靠的是`asyncio`模块,包括协程、事件循环、任务等基本概念。异步编程的优势在于可以让程序在同一个线程内异步地执行多个任务,从而避免了线程切换的开销,减少了锁的使用,使程序更加简单易懂,最重要的是可以大大提高程序的执行效率。