import warnings
warnings.filterwarnings('ignore') # 警告扰人,手动封存
from multiprocessing import cpu_count, Pool
# 计算当前服务器CPU数量
cores = cpu_count()
# 将分块个数设置为CPU的数量
partitions = cores
def parallelize(df, func):
# 数据切分
data_split = np.array_split(df, partitions)
# 初始化线程池
pool = Pool(cores)
# 数据分发,处理,再合并
data = pd.concat(pool.map(func, data_split))
# 关闭线程池
pool.close()
# 执行完close后不会有新的进程加入到pool,join函数等待所有子进程结束
pool.join()
# 返回处理后的数据
return data
如何用多核并行处理数据
最新推荐文章于 2026-05-01 09:53:49 发布
Python3.8
Python 是一种高级、解释型、通用的编程语言,以其简洁易读的语法而闻名,适用于广泛的应用,包括Web开发、数据分析、人工智能和自动化脚本
您可能感兴趣的与本文相关的镜像
Python3.8
Conda
Python
Python 是一种高级、解释型、通用的编程语言,以其简洁易读的语法而闻名,适用于广泛的应用,包括Web开发、数据分析、人工智能和自动化脚本
3万+

被折叠的 条评论
为什么被折叠?



