python dataframe 在merge时产生笛卡尔积

Allen-rg 2021-08-05 原文

在pandas中，concat, merge, join的使用方法可以参考以下资料：
http://blog.csdn.net/stevenkwong/article/details/52528616
主要讲下笛卡尔积：

import pandas as pd
from pandas import DataFrame
df1=DataFrame({\'a\':[1,2,3], \'b\':[4,5,6], \'key\':[0,0,0]})
df2=DataFrame({\'c\':[3,2,1], \'d\':[6,5,4], \'key\':[0,0,0]})
data = pd.merge(df1, df2, on=\'key\')

这里merge默认为内连接。

df1:

   a  b  key
0  1  4    0
1  2  5    0
2  3  6    0

　　

df2:

   c  d  key
0  3  6    0
1  2  5    0
2  1  4    0

　　

data:

   a  b  key  c  d
0  1  4    0  3  6
1  1  4    0  2  5
2  1  4    0  1  4
3  2  5    0  3  6
4  2  5    0  2  5
5  2  5    0  1  4
6  3  6    0  3  6
7  3  6    0  2  5
8  3  6    0  1  4

　　

由此可知，当两个表连接时，有相同的key值就产生积。

如果，需要进行merge的次数过多时，每次都产生笛卡尔积，最终就会产生内存爆炸的现象。

所以，在merge时，一定要避免相同的key值，可以分批次merge，最后再concat。
———————

原文：https://blog.csdn.net/yj1556492839/article/details/79529186

版权声明：本文为Allen-rg原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://www.cnblogs.com/Allen-rg/p/9848270.html

python dataframe 在merge时产生笛卡尔积的更多相关文章

基于python语言的经典排序法（冒泡法和选择排序法）
前每逢周末就遇雨期，闲暇之余，捣鼓了下python，心心念想学习，今天就在电脑上装了个2.7，学习了下经典算 […]...
python多线程之threading模块
threading模块中的对象其中除了Thread对象以外，还有许多跟同步相关的对象 threading模 […]...
python 建站教程
主端：安装nginx uwsgi django pymysql mysql安装mysql到http://rep […]...
python基础知识测试
前言学习是一个循序渐进的过程，不在于你学了多少，而在于你学会了多少。(装个b好吧，hhhh) 知识总结 1 […]...
Python 语言学习第一篇：数据类型（数字，集合，布尔类型，操作符）
Python语言最常用的对象是变量和常量，常量的值是字面意思，变量的值是可变的，例如，123，”上 […]...
Python 爬基金数据
爬科学基金共享服务网中基金数据 #coding=utf-8 import json import reques […]...
用列表写一个登陆小程序
需求如下： # 1、写一个登陆的程序，最多登陆失败3次# 2、账号和密码分别存到一个list里面# 3、要校验 […]...
正则表达式的应用
1.获取所有的div标签　　 2.获取包含某个属性的标签　　 3.获取所有id=” […]...

随机推荐

关于破解邮箱的一点心得 – yangzailu
关于破解邮箱的一点心得最近开始想更换一个好点的邮箱域名，因为本人名字可能比较火，163 126 foxmai […]...
怎么把网页保存为pdf文件
不就是用chrome浏览器打印功能，然后保存为pdf就可以了吗？对于一些结构简单的比如，RFC文档这样操作 […]...
python从excel取值
import xlrd import os import json data = xlrd.open_work […]...
抽象工厂–设计模式
前面工厂方法模式中考虑的是一类产品的生产, 如畜牧场只管动物、电视机厂只产电视机等. 同种类称为同等级, 也就 […]...
面试官：了解二叉树吗，平衡二叉树，红黑树？
前言面试过程中，多多少少会问一点数据结构（二叉树）的问题，今天我们来复习一下二叉树的相关问题，文末总结。 1 […]...
jQuery delay() 方法
定义和用法 delay() 方法对队列中的下一项的执行设置延迟。语法 $(selector).delay(s […]...
【Kindle】pdf转mobi适合kindle查看格式
pdf转mobi适合kindle查看格式 1、用到软件:福昕风腾PDF套件,切白边，PDF-Viewer,导出 […]...
使用wsgiref库diy简单web架构
1. 了解CGI和WSGI （1）CGI 　　CGI（Common Gateway Interface）通用网 […]...

展开目录

目录导航