（数据科学学习手札124）pandas 1.3版本主要更新内容一览动态规划_备忘录法_矩阵链乘问题最新的.NET 热重载介绍基于uni-app全端弹框组件uaPopup「兼容h5+小程序+app端|nvue」 Innodb中有哪些锁？『无为则无心』Python序列 — 24、Python序列的推导式【Azure 应用服务】Azure Function App 执行PowerShell指令[Get-Azsubscription -TenantId $tenantID -DefaultProfile

feffery 2021-07-10 原文

本文示例代码及文件已上传至我的Github仓库https://github.com/CNFeffery/DataScienceStudyNotes

1 简介

　　就在几天前，pandas发布了其1.3版本，在这次新的版本中添加了诸多实用的新特性，今天的文章我们就一起来get其中主要的一些内容更新~

2 pandas 1.3主要更新内容一览

　　使用pip install pandas==1.3.0 -U -i https://pypi.douban.com/simple/安装1.3版本后，下面我们来看看新的版本给我们带来了哪些新特性：

2.1 新增对xml文件的读写操作

　　在这次新版本中新增了对xml格式数据进行解析读写的功能，对此有特殊需求的朋友可以前往https://pandas.pydata.org/docs/user_guide/io.html#xml详细了解：

2.2 Styler可使用原生css语法

　　很多朋友都知道pandas中可以配合Styler对数据框进行自定义样式输出，其中最自由的是通过Styler.set_table_styles()来自定义css样式，以前的方式需要将一条css属性写到二元组中传入，在1.3版本中可以直接传入css字符串，比如下面我们通过设置hover伪类样式，来修改每一行鼠标悬停时的样式：

2.3 center参数在时间日期index的数据框rolling操作中可用

　　在先前的版本中，如果针对行索引为时间日期型的数据框进行rolling滑窗操作使用center参数将每行记录作为窗口中心时会报错：

　　而在1.3中这个问题终于得到解决~方便了许多时序数据分析时的操作：

2.4 sample()随机抽样新增ignore_index参数

　　我们都知道在pandas中可以使用sample()方法对数据框进行各种放回/不放回抽样，但以前版本中抽完样的数据框每行记录还保持着先前的行索引，使得我们还得多一步reset_index()操作，而在1.3中，新增类似sort_values()和drop_duplicates()中的同名参数ignore_index：

2.5 explode()新增多列操作支持

　　当数据框中某些字段某些位置元素为列表、元组等数据结构时，我们可以使用explode()方法来基于这些序列型元素进行展开扩充，但在以前的版本中每次explode()操作只支持对单个字段的展开，如果数据中多个字段之间同一行对应序列型元素位置是一一对应的，需要展开后也是一一对应的，操作起来就比较棘手。

　　而1.3版本中直接对多字段同步explode()进行了支持：

2.6 append模式下写出多工作表excel文件的新策略

　　在1.3版本中，针对mode='a'模式下向外写出多工作表excel文件，新增了参数if_sheet_exists来设定新工作表与已存在工作表重名时的处理策略，默认为'error'即直接抛出错误，'new'则会自动修改工作表名，'replace'则会覆盖原同名工作表：

2.7 结合SQL读取数据库表时可直接设置类型转换

　　在1.3版本中，我们在使用read_sql_query()结合SQL查询数据库时，新增了参数dtype可以像在其他API中那样一步到位转换查询到的数据：

　　以上就是本文的全部内容，欢迎在评论区与我进行讨论~

版权声明：本文为feffery原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://www.cnblogs.com/feffery/p/14993399.html

（数据科学学习手札124）pandas 1.3版本主要更新内容一览动态规划_备忘录法_矩阵链乘问题最新的.NET 热重载介绍基于uni-app全端弹框组件uaPopup「兼容h5+小程序+app端|nvue」 Innodb中有哪些锁？『无为则无心』Python序列 — 24、Python序列的推导式【Azure 应用服务】Azure Function App 执行PowerShell指令[Get-Azsubscription -TenantId $tenantID -DefaultProfile的更多相关文章

Python爬虫入门教程 33-100 《海王》评论数据抓取 scrapy
1. 海王评论数据爬取前分析海王上映了，然后口碑炸了，对咱来说，多了一个可爬可分析的电影，美哉~ 摘录一个评 […]...
Python 与 Javascript 之比较 (1) – derezzed
Python 与 Javascript 之比较 (1) 基本概念 Python和Javascript都是脚本语 […]...
使用有限状态机原理实现英文分词
提出问题使用Python开发一个英文句子分词程序，把一段英文句子切分为每一个单词。不能导入任何官方的或者第三 […]...
python open()方法和文件读写
open()方法 open(file, mode=\’r\’, buffering=- […]...
matplotlib 显示中文
matplotlib 显示中文 Method_1: # 添上: plt.rcParams['font.sans […]...
pycharm安装svn插件
弄了svn的服务端和客户端，为了方便我python代码的使用，我又在pycharm里进行了配置，要用到subv […]...
Python pandas学习总结
　　本来打算学习pandas模块，并写一个博客记录一下自己的学习，但是不知道怎么了，最近好像有点急功近利，就想 […]...
《Python编程快速上手让繁琐工作自动化》PDF高清完整版_零基础应当如何开始学习 Python
《Python编程快速上手让繁琐工作自动化》PDF高清完整版点击下载零基础应当如何开始学习 Python […]...

随机推荐

机器学习算法工程师实习面试总结 – limingqi
机器学习算法工程师实习面试总结我是2020届毕业生，所以2019年3月中旬答辩结束就开始投入到找实习 […]...
web项目中js加载慢问题解决思路
web项目中js加载慢问题解决思路最近使用Echarts地图(版本为echarts2,echarts3目前无 […]...
Java获取X509证书里的指纹（SHA-1）从pxf文件里面
直接通过流去获取pxf后缀文件的内容，指纹通过X509才能获取。String keyStorefile = " […]...
微服务部署之蓝绿发布、滚动发布、灰度发布区别与特点
本文主要梳理了服务发布(蓝绿发布、滚动发布、灰度发布)的几种策略的特点以及注意事项,最后阐述了AB测试的含义。 […]...
pycharm配置运行django项目步骤
1：在django项目的跟目录下执行：这是直接在Linux系统中直接运行　　python manage.p […]...
Javascript数组的5种迭代方法
#Javascript数组的5种迭代方法数组当中定义了5个迭代方法，传入这些方法中的函数会接受三个参数，数组 […]...
【swupdate文档一】嵌入式系统的软件管理
嵌入式系统的软件管理嵌入式系统变得越来越复杂，它们的软件也反映了这种复杂性的增加。为了支持新的特性和修复 […]...
SQL server 2000 在Windows 2003系统下 SQL SERVER AGENT自动启动服务。
其实很简单。在管理工具->服务中的那项，叫SQL SERVER AGENT,我设为自动。但重启W […]...

展开目录

目录导航