Python并发编程：多线程与多进程应用实战

Python并发编程：多线程与多进程应用实战

Python是一种高级编程语言，被广泛应用于不同领域，如Web开发、数据分析、机器学习等。Python提供了丰富的库和模块，使得开发人员能够快速构建应用程序。Python也是一种支持并发编程的语言，允许开发人员在同一时间执行多个任务。本文将介绍Python并发编程中的两个重要概念：多线程和多进程，并且通过实例来展示如何使用它们应用实战。

多线程

多线程是指在一个运行程序中，同时执行多个线程（线程是操作系统能够进行运算调度的最小单位），每个线程都是独立的执行流程。Python提供了多个模块支持多线程编程，其中最常使用的是threading和queue。

threading模块

threading模块是Python中用于创建多线程的模块。在使用此模块前，我们需要先理解线程的概念。在Python中，所有线程都是从主线程派生而来的。当程序启动时，主线程会创建并且运行在一个单一的进程中。通过创建新的线程，就能让程序同时运行多个线程。

下面是如何使用threading模块创建一个简单的多线程程序：

```python
import threading

def print_numbers():
    for i in range(10):
        print(i)

def print_letters():
    for i in ['a', 'b', 'c', 'd', 'e']:
        print(i)

if __name__ == '__main__':
    t1 = threading.Thread(target=print_numbers)
    t2 = threading.Thread(target=print_letters)

    t1.start()
    t2.start()

    t1.join()
    t2.join()

```

上面的代码定义了两个函数，分别用于在两个线程中打印数字和字母。在main函数中，创建了两个线程，并且分别调用了它们的start()方法来启动线程。同时，还调用了join()方法，等待线程执行完毕后再继续执行主线程。运行上面代码，输出结果如下：

```
0
a
1
b
2
c
3
d
4
e
5
6
7
8
9
```

队列模块

在多线程编程中，线程之间通常需要共享数据。为了防止出现线程竞争和不一致性的问题，Python提供了queue模块，用于创建线程安全的数据结构。queue模块提供了多个类，其中最常用的是Queue和LifoQueue。

Queue是一种FIFO（先进先出）数据结构，通常用于线程之间的通信。下面是如何使用Queue来实现线程安全的共享数据：

```python
import threading
import queue

data = [1, 2, 3, 4, 5]
q = queue.Queue()

def worker():
    while True:
        value = q.get()
        if value is None:
            break
        print(value)

if __name__ == '__main__':
    threads = []
    for i in range(2):
        t = threading.Thread(target=worker)
        t.start()
        threads.append(t)

    for value in data:
        q.put(value)

    for i in range(2):
        q.put(None)

    for t in threads:
        t.join()

```

上面代码中，定义了一个数据列表和一个队列q。在worker函数中，通过q.get()方法从队列中取出一个数据并且打印出来。在main函数中，创建了两个线程，并且分别调用了它们的start()方法来启动线程。然后，将数据添加到队列中。最后，向队列中添加None值，表示所有任务都已经完成。运行上面代码，输出结果如下：

```
1
2
3
4
5
1
2
3
4
5
```

多进程

多进程是指在同一时间内，运行多个进程（进程是操作系统分配资源和调度任务的最小单位）。与多线程类似，多进程可以让程序同时执行多个任务。Python也提供了多个模块支持多进程编程，其中最常使用的是multiprocessing和queue。

multiprocessing模块

multiprocessing模块是Python中用于创建多进程的模块。和threading模块非常相似。下面是如何使用multiprocessing模块创建一个简单的多进程程序：

```python
import multiprocessing

def print_numbers():
    for i in range(10):
        print(i)

def print_letters():
    for i in ['a', 'b', 'c', 'd', 'e']:
        print(i)

if __name__ == '__main__':
    p1 = multiprocessing.Process(target=print_numbers)
    p2 = multiprocessing.Process(target=print_letters)

    p1.start()
    p2.start()

    p1.join()
    p2.join()

```

上面代码和多线程程序非常相似，区别在于使用了multiprocessing.Process()来创建进程对象。运行上面代码，输出结果如下：

```
0
a
1
b
2
c
3
d
4
e
5
6
7
8
9
```

队列模块

在Python多进程编程中，进程之间通常需要共享数据。为了防止出现进程竞争和不一致性的问题，Python提供了multiprocessing.Queue类，用于创建进程内安全的队列数据结构。下面是如何使用multiprocessing.Queue来实现多进程共享数据：

```python
import multiprocessing

def worker(q):
    while True:
        value = q.get()
        if value is None:
            break
        print(value)

if __name__ == '__main__':
    data = [1, 2, 3, 4, 5]
    q = multiprocessing.Queue()
    p1 = multiprocessing.Process(target=worker, args=(q,))
    p2 = multiprocessing.Process(target=worker, args=(q,))

    p1.start()
    p2.start()

    for value in data:
        q.put(value)

    q.put(None)
    q.put(None)

    p1.join()
    p2.join()

```

上面代码中，定义了一个数据列表和一个进程内安全的队列q。在worker函数中，通过q.get()方法从队列中取出一个数据并且打印出来。在main函数中，创建了两个进程。然后，将数据添加到队列中。最后，向队列中添加两个None值，表示所有任务都已经完成。运行上面代码，输出结果如下：

```
1
2
3
4
5
1
2
3
4
5
```

结论

本文介绍了Python并发编程中的两个重要概念：多线程和多进程，并且通过实例来展示如何使用它们应用实战。需要注意的是，多线程和多进程在实际应用中有各自的优劣。多线程适用于I/O密集型任务，而多进程适用于CPU密集型任务。在实际应用中，应该根据任务特点选择合适的并发方式。
首页

课程中心

免费公开课

技术干货

就业动态

马哥动态

Python并发编程：多线程与多进程应用实战