首页 > 编程语言 > 详细

python多进程处理数据

时间:2018-10-10 16:55:29      阅读:160      评论:0      收藏:0      [点我收藏+]

  当我们处理大规模数据如ImageNet的时候,单进程显得很吃力耗时,且不能充分利用多核CPU计算机的资源。因此需要使用多进程对数据进行并行处理,然后将结果合并即可。以下给出的是多进程处理的demo代码,如需要应用到实际应用中,则需要自己实现target_function函数,并且传args即可。

#coding=utf-8
from multiprocessing import Process

def
target_function(index,sublist): print index,sublist if __name__=="__main__": TXT_FILE = "path/to/imagelist.txt" n_processes = 50 #number of processes f = open(TXT_FILE,r) image_list = f.readlines() f.close() n_total = len(image_list) length = float(n_total) / float(n_processes) indices = [int(round(i* length)) for i in range(n_processes)] sublists = [image_list[indices[i]:indices[i+1]] for i in range(n_processes)] processes = [Process(target=target_function,args=(i,x)) for i,x in enumerate(sublists)] for p in processes: p.start() for p in processes: p.join()

 

python多进程处理数据

原文:https://www.cnblogs.com/houjun/p/9767106.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!