教你如何将Pandas迭代速度加快150倍?
发布时间:2020-02-29 04:46:14 所属栏目:资源 来源:站长网
导读:面对现实吧, Python 的速度在与C语言或Go语言相比时,的确引发了不少口水战。 这让笔者一段时间以来,一直对Python快速处理任务的能力有所怀疑。 目前,笔者尝试在Go语言中进行数据科学研究——这是有可能的——但操作起来根本不像在Python中那样令人愉快
面对现实吧,Python的速度在与C语言或Go语言相比时,的确引发了不少口水战。 这让笔者一段时间以来,一直对Python快速处理任务的能力有所怀疑。 目前,笔者尝试在Go语言中进行数据科学研究——这是有可能的——但操作起来根本不像在Python中那样令人愉快,多半是由于语言的静态特性和数据科学大多是探索性领域。 并不是说用Go语言重写完成的解决方案不能提高性能,但这是另一篇文章的主题。 迄今为止,笔者至少忽略了Python可以更快地处理任务这一能力。笔者一直饱受目光短浅之苦——这是一种表现为当你只看到一种解决方案时,完全忽视其他方案的存在的综合征。相信出现这种情况的不只笔者自己。 这就是笔者今天想简要介绍如何令Pandas每日工作速度更快且更为愉悦的原因。更准确地说,该示例将关注行之间的迭代,并在过程中执行一些数据操作。因此,事不宜迟,一起进入正题。 做一个数据集 把观点论述清楚最简单的方法是声明一个单列数据框对象,其整数值范围为1到100000: ![]() ![]() ![]() ![]() (编辑:滁州站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |