使用Python的pandas模块、mplfinance模块、matplotlib模块绘制K线图
pandas模块、mplfinance模块和matplotlib模块介绍
pandas模块
pandas为解决数据分析任务而创建,纳入了大量的库和一些标准的数据模型,简而言之,它提供了很多数据处理的方法,此文就是借用它来生成DataFrame格式的数据。
mplfinance模块和matplotlib模块
mplfinance是专用于金融数据的可视化分析模块,是基于matplotlib的实用模块程序,而matplotlib模块是python绘图领域使用最广泛的套件。简而言之,python想使用可视化,就可以使用matplotlib,想在可视化里面绘制金融方面的图标,就可以使用mplfinance。
安装mplfinance模块、pandas模块和matplotlib模块
可以使用Python包管理也就是pip来进行安装,在cmd命令行中输入 pip install mplfinance
后,系统将自动安装完成。如下图:
然后依次安装Pandas模块和matplotlib模块, pip install Pandas
pip install matplotlib
当然,在模块安装过程中会因为网络问题导致失败,多次尝试后仍然失败,可以更换pip源为国内镜像。
处理股票数据
该文处理的数据为一个包含股票数据的json格式文件。由于我们要使用mplfinance.plot()
函数绘制K线图,而该函数就只接收pandas.DataFrame格式的数据,所以需要将json格式文件数据转换为pandas.DataFrame格式数据。
# k线图数据处理
# 读取json文件,获取数据
df = pd.read_json('AAPL.json', orient='index')
# 删除无效数据数据
for index, row in df.iterrows():
if(isnot_float(row['Open'])):
df.drop(index, inplace=True)
# 调整数据顺序
df = df.iloc[::-1]
# 设置索引
df.set_index(['Date'], inplace=True)
# 将数据列转换为float,因为json字符串存在坏数据,所以读取的时候,所有列默认为字符串了。
df = df.apply(pd.to_numeric, errors='ignore')
处理前的json数据格式如下图:
处理后的DataFrame数据格式:
设置图像大小
# 绘图
# 自定义一个10*8的画布
fig = plt.figure(figsize=(12, 8))
# 对画布划分,显示在1行*1列的第一块区域,其实也仅有一块区域
ax = fig.add_subplot(1, 1, 1)
加载K线图并设置格式
# 加载K线图
mpf.plot(df, type='candle', ax=ax, style='binance', datetime_format='%Y-%m-%d')
# 设置横轴值为时间格式
ax.xaxis_date()
# 通过tight_layout(),实现子图集铺满
plt.tight_layout()
# 显示
plt.show()
完整代码
import matplotlib.pyplot as plt
import mplfinance as mpf
import pandas as pd
# 用来判断str能否转换为float,用于剔除无效数据
def isnot_float(str):
try:
float(str)
return False
except ValueError:
print(str)
return True
# k线图数据处理
# 读取json文件,获取数据
df = pd.read_json('AAPL.json', orient='index')
# 删除无效数据数据
for index, row in df.iterrows():
if(isnot_float(row['Open'])):
df.drop(index, inplace=True)
# 调整数据顺序
df = df.iloc[::-1]
# 设置索引
df.set_index(['Date'], inplace=True)
# 将数据列转换为float,因为json字符串存在坏数据,所以读取的时候,所有列默认为字符串了。
df = df.apply(pd.to_numeric, errors='ignore')
# 绘图
# 自定义一个10*8的画布
fig = plt.figure(figsize=(12, 8))
# 对画布划分,显示在1行*1列的第一个子图集,其实也仅有一个子图集
ax = fig.add_subplot(1, 1, 1)
# 加载K线图
mpf.plot(df, type='candle', ax=ax, style='binance', datetime_format='%Y-%m-%d')
# 设置横轴值为时间格式
ax.xaxis_date()
# 通过tight_layout(),实现子图集铺满
plt.tight_layout()
# 显示
plt.show()