如何在子图中绘制多个数据框

2024-12-13 08:36:00
admin
原创
157
摘要:问题描述:我有几个 Pandas DataFrames 共享相同的值标度,但具有不同的列和索引。调用时df.plot(),我得到单独的绘图图像。我真正想要的是将它们全部放在同一个绘图中作为子图,但不幸的是,我无法想出解决方案,非常感谢您的帮助。解决方案 1:您可以使用 matplotlib 手动创建子图,然后...

问题描述:

我有几个 Pandas DataFrames 共享相同的值标度,但具有不同的列和索引。调用时df.plot(),我得到单独的绘图图像。我真正想要的是将它们全部放在同一个绘图中作为子图,但不幸的是,我无法想出解决方案,非常感谢您的帮助。


解决方案 1:

您可以使用 matplotlib 手动创建子图,然后使用关键字在特定子图上绘制数据框ax。例如,对于 4 个子图(2x2):

import matplotlib.pyplot as plt

fig, axes = plt.subplots(nrows=2, ncols=2)

df1.plot(ax=axes[0,0])
df2.plot(ax=axes[0,1])
...

axes是一个包含不同子图轴的数组,您只需索引 即可访问其中一个axes

如果您想要一个共享的 x 轴,则可以提供sharex=Trueplt.subplots

解决方案 2:

您可以在文档中看到例如演示 joris 答案的内容。同样从文档中,您还可以在 pandas函数中设置subplots=True和: layout=(,)`plot`

df.plot(subplots=True, layout=(1,2))

您还可以使用fig.add_subplot()采用子图网格参数(例如 221、222、223、224 等)的函数,如此处的帖子所述。在此 ipython 笔记本中可以看到在 pandas 数据框上绘图的很好示例(包括子图)。

解决方案 3:

您可以使用 matplotlib 绘制多个 pandas 数据框的多个子图,只需简单列出所有数据框即可。然后使用 for 循环绘制子图。

工作代码:

import matplotlib.pyplot as plt
import pandas as pd
import numpy as np
# dataframe sample data
df1 = pd.DataFrame(np.random.rand(10,2)*100, columns=['A', 'B'])
df2 = pd.DataFrame(np.random.rand(10,2)*100, columns=['A', 'B'])
df3 = pd.DataFrame(np.random.rand(10,2)*100, columns=['A', 'B'])
df4 = pd.DataFrame(np.random.rand(10,2)*100, columns=['A', 'B'])
df5 = pd.DataFrame(np.random.rand(10,2)*100, columns=['A', 'B'])
df6 = pd.DataFrame(np.random.rand(10,2)*100, columns=['A', 'B'])

#define number of rows and columns for subplots
nrow=3
ncol=2

# make a list of all dataframes 
df_list = [df1 ,df2, df3, df4, df5, df6]
fig, axes = plt.subplots(nrow, ncol)

# plot counter
count=0
for r in range(nrow):
    for c in range(ncol):
        df_list[count].plot(ax=axes[r,c])
        count+=1

在此处输入图片描述

使用此代码,您可以以任何配置绘制子图。您需要定义行数nrow和列数ncol。此外,您还需要列出df_list要绘制的数据框。

解决方案 4:

您可以使用熟悉的 Matplotlib 样式调用figuresubplot,但您只需使用 指定当前轴plt.gca()。示例:

plt.figure(1)
plt.subplot(2,2,1)
df.A.plot() #no need to specify for first axis
plt.subplot(2,2,2)
df.B.plot(ax=plt.gca())
plt.subplot(2,2,3)
df.C.plot(ax=plt.gca())

ETC...

解决方案 5:

你可以使用这个:

fig = plt.figure()
ax = fig.add_subplot(221)
plt.plot(x,y)

ax = fig.add_subplot(222)
plt.plot(x,z)
...

plt.show()

解决方案 6:

你可能根本不需要使用 Pandas。以下是猫频率的 matplotlib 图:

在此处输入图片描述

x = np.linspace(0, 2*np.pi, 400)
y = np.sin(x**2)

f, axes = plt.subplots(2, 1)
for c, i in enumerate(axes):
  axes[c].plot(x, y)
  axes[c].set_title('cats')
plt.tight_layout()

解决方案 7:

import numpy as np
import pandas as pd
imoprt matplotlib.pyplot as plt

fig, ax = plt.subplots(2,2)
df = pd.DataFrame({'A':np.random.randint(1,100,10), 
                   'B': np.random.randint(100,1000,10),
                   'C':np.random.randint(100,200,10)})
for ax in ax.flatten():
    df.plot(ax =ax)  


输出

解决方案 8:

选项 1:从包含长(整洁)数据的数据框字典中创建子图

  • 假设:

    • 有一个包含多个整洁数据框的字典,这些数据框可以是:

      • 通过读取文件创建

      • 通过将单个数据框分成多个数据框来创建

    • 类别cat可能会重叠,但所有数据框不一定包含 的所有值cat

    • hue='cat'

  • 此示例使用dict数据框,但list数据框类似。

  • 如果数据框很宽,则将pandas.DataFrame.melt其转换为长格式。

  • 由于数据框正在迭代,因此无法保证每个图的颜色映射相同

    • 'cat'需要根据所有数据框的唯一值创建自定义颜色图

    • 由于颜色相同,因此将一个图例放在图表的一侧,而不是每个图表中都放置一个图例

  • 已在python 3.10, pandas 1.4.3, matplotlib 3.5.1,测试seaborn 0.11.2

导入和测试数据

import pandas as pd
import numpy as np  # used for random data
import matplotlib.pyplot as plt
from matplotlib.patches import Patch  # for custom legend - square patches
from matplotlib.lines import Line2D  # for custom legend - round markers
import seaborn as sns
import math import ceil  # determine correct number of subplot

# synthetic data
df_dict = dict()
for i in range(1, 7):
    np.random.seed(i)  # for repeatable sample data
    data_length = 100
    data = {'cat': np.random.choice(['A', 'B', 'C'], size=data_length),
            'x': np.random.rand(data_length), 'y': np.random.rand(data_length)}
    df_dict[i] = pd.DataFrame(data)

# display(df_dict[1].head())
  cat         x         y
0   B  0.944595  0.606329
1   A  0.586555  0.568851
2   A  0.903402  0.317362
3   B  0.137475  0.988616
4   B  0.139276  0.579745

# display(df_dict[6].tail())
   cat         x         y
95   B  0.881222  0.263168
96   A  0.193668  0.636758
97   A  0.824001  0.638832
98   C  0.323998  0.505060
99   C  0.693124  0.737582

创建颜色映射和绘图

# create color mapping based on all unique values of cat
unique_cat = {cat for v in df_dict.values() for cat in v.cat.unique()}  # get unique cats
colors = sns.color_palette('tab10', n_colors=len(unique_cat))  # get a number of colors
cmap = dict(zip(unique_cat, colors))  # zip values to colors

col_nums = 3  # how many plots per row
row_nums = math.ceil(len(df_dict) / col_nums)  # how many rows of plots

# create the figure and axes
fig, axes = plt.subplots(row_nums, col_nums, figsize=(9, 6), sharex=True, sharey=True, tight_layout=True)
# convert to 1D array for easy iteration
axes = axes.flat

# iterate through dictionary and plot
for ax, (k, v) in zip(axes, df_dict.items()):
    
    sns.scatterplot(data=v, x='x', y='y', hue='cat', palette=cmap, ax=ax)
    sns.despine(top=True, right=True)
    ax.legend_.remove()  # remove the individual plot legends
    ax.set_title(f'dataset = {k}', fontsize=11)

# create legend from cmap
# patches = [Patch(color=v, label=k) for k, v in cmap.items()]  # square patches
patches = [Line2D([0], [0], marker='o', color='w', markerfacecolor=v, label=k, markersize=8) for k, v in cmap.items()]  # round markers

# place legend outside of plot; change the right bbox value to move the legend up or down
plt.legend(title='cat', handles=patches, bbox_to_anchor=(1.06, 1.2), loc='center left', borderaxespad=0, frameon=False)
plt.show()

在此处输入图片描述

选项 2:从具有多个独立数据集的单个数据框创建子图

  • 数据框必须采用长格式并具有相同的列名。

  • 此选项用于pd.concat将多个数据框合并为一个数据框,并.assign添加新列。

    • 请参阅将多个 csv 文件导入 pandas 并连接成一个 DataFrame,以从文件列表创建单个数据框。

  • 这个选项比较简单,因为它不需要手动将颜色映射到'cat'

合并 DataFrames

# using df_dict, with dataframes as values, from the top
# combine all the dataframes in df_dict to a single dataframe with an identifier column
df = pd.concat((v.assign(dataset=k) for k, v in df_dict.items()), ignore_index=True)

# display(df.head())
  cat         x         y  dataset
0   B  0.944595  0.606329        1
1   A  0.586555  0.568851        1
2   A  0.903402  0.317362        1
3   B  0.137475  0.988616        1
4   B  0.139276  0.579745        1

# display(df.tail())
    cat         x         y  dataset
595   B  0.881222  0.263168        6
596   A  0.193668  0.636758        6
597   A  0.824001  0.638832        6
598   C  0.323998  0.505060        6
599   C  0.693124  0.737582        6

使用以下方法绘制 FacetGridseaborn.relplot

g = sns.relplot(kind='scatter', data=df, x='x', y='y', hue='cat', col='dataset', col_wrap=3, height=3)

在此处输入图片描述


  • 这两个选项都会产生相同的结果,但是,合并所有数据框并用绘制图形级图表不太复杂sns.relplot

解决方案 9:

基于上述 @joris 的回复,如果您已经建立了对子图的引用,那么您也可以使用该引用。例如,

ax1 = plt.subplot2grid((50,100), (0, 0), colspan=20, rowspan=10)
...

df.plot.barh(ax=ax1, stacked=True)

解决方案 10:

这是一个有效的 pandas 子图示例,其中 modes 是数据框的列名。

    dpi=200
    figure_size=(20, 10)
    fig, ax = plt.subplots(len(modes), 1, sharex="all", sharey="all", dpi=dpi)
    for i in range(len(modes)):
        ax[i] = pivot_df.loc[:, modes[i]].plot.bar(figsize=(figure_size[0], figure_size[1]*len(modes)),
                                                   ax=ax[i], title=modes[i], color=my_colors[i])
        ax[i].legend()
    fig.suptitle(name)

Pandas 子图栏示例

相关推荐
  政府信创国产化的10大政策解读一、信创国产化的背景与意义信创国产化,即信息技术应用创新国产化,是当前中国信息技术领域的一个重要发展方向。其核心在于通过自主研发和创新,实现信息技术应用的自主可控,减少对外部技术的依赖,并规避潜在的技术制裁和风险。随着全球信息技术竞争的加剧,以及某些国家对中国在科技领域的打压,信创国产化显...
工程项目管理   2545  
  为什么项目管理通常仍然耗时且低效?您是否还在反复更新电子表格、淹没在便利贴中并参加每周更新会议?这确实是耗费时间和精力。借助软件工具的帮助,您可以一目了然地全面了解您的项目。如今,国内外有足够多优秀的项目管理软件可以帮助您掌控每个项目。什么是项目管理软件?项目管理软件是广泛行业用于项目规划、资源分配和调度的软件。它使项...
项目管理软件   1551  
  建筑工程全生命周期涉及从项目规划、设计、施工到运营维护等多个复杂阶段,每个阶段都产生和依赖大量信息。PLM(产品生命周期管理)系统作为一种整合数据、流程和人员的数字化解决方案,正逐渐成为建筑行业实现高效协同与可持续发展的关键支撑。通过数字化转型,PLM系统能够优化各阶段的工作流程,提升项目整体质量和效率,为建筑工程的全...
plm是什么软件   1  
  产品生命周期管理(PLM)系统在企业资源成本率优化方面发挥着至关重要的作用。通过构建有效的数据模型,PLM系统能够整合企业各个环节的数据,为资源成本的精准分析和优化提供有力支持。这不仅有助于企业降低成本,还能提升产品质量和市场竞争力。PLM系统概述PLM系统是一种用于管理产品从概念设计到退役全生命周期过程中所有信息和流...
PLM项目管理软件   1  
  产品生命周期管理(PLM)系统在现代企业的产品研发、生产与管理过程中扮演着至关重要的角色。它整合了从产品概念设计到产品退役的全生命周期数据与流程,助力企业提升效率、降低成本并增强创新能力。随着技术的不断发展,到 2025 年,PLM 系统将具备一系列核心功能模块,这些模块将深度影响企业的运营与发展。产品数据管理模块产品...
plm是什么意思   0  
热门文章
项目管理软件有哪些?
曾咪二维码

扫码咨询,免费领取项目管理大礼包!

云禅道AD
禅道项目管理软件

云端的项目管理软件

尊享禅道项目软件收费版功能

无需维护,随时随地协同办公

内置subversion和git源码管理

每天备份,随时转为私有部署

免费试用