如何使用 append 和 pickle?

2025-03-20 08:47:00
admin
原创
59
摘要:问题描述:我需要将其附加到 pickle 文件中(因为我一次没有完整的字典)。因此,为了执行相同的操作,我编写了以下代码: import pickle p = {} p[1] = 2 q = {} q['a'] = p p = {} p[2] = 0 pickle.dump(q, open(&...

问题描述:

我需要将其附加到 pickle 文件中(因为我一次没有完整的字典)。因此,为了执行相同的操作,我编写了以下代码:

 import pickle

 p = {}
 p[1] = 2
 q = {}
 q['a'] = p
 p = {}
 p[2] = 0
 pickle.dump(q, open("save12.p", "ab"))
 f = {}
 f['b'] = p
 pickle.dump(f, open("save12.p", "ab"))

然而,当我加载 pickle 文件时,我没有f在那里找到字典的值。

我该如何将内容附加到 pickle 文件中?

此外,由于我在 Windows 上工作,因此“dbm”之类的数据库不能满足我的需要。


解决方案 1:

Pickle 流是完全独立的,因此解封一次只会解封一个对象。

因此,要解开多个流,您应该反复解开文件,直到收到 EOFError:

>>> f=open('a.p', 'wb')
>>> pickle.dump({1:2}, f)
>>> pickle.dump({3:4}, f)
>>> f.close()
>>> 
>>> f=open('a.p', 'rb')
>>> pickle.load(f)
{1: 2}
>>> pickle.load(f)
{3: 4}
>>> pickle.load(f)
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
EOFError

所以你的 unpickle 代码可能看起来像

import pickle
objs = []
while 1:
    try:
        objs.append(pickle.load(f))
    except EOFError:
        break

解决方案 2:

#To append to a pickle file
import pickle

p={1:2}
q={3:4}
filename="picklefile"
with open(filename, 'a+') as fp:
    pickle.dump(p,fp)
    pickle.dump(q,fp)


#To load from pickle file
data = []
with open(filename, 'rb') as fr:
    try:
        while True:
            data.append(pickle.load(fr))
    except EOFError:
        pass

解决方案 3:

如果每次追加时都重写整个列表,那么len(list)^2写入磁盘的总字节数就是这个数。如果只是追加到文件,那么保存所有项目所需的总时间就会减少。

如果有人好奇的话,保存加速确实存在n^2,而加载减速则很小。

naive_append:   8.387 seconds
naive_load:     0.024 seconds
smart_append:   0.042 seconds
smart_load:     0.026 seconds
import os, pickle, time, numpy as np

def naive_append(filename, obj):
    objs = []
    if os.path.exists(filename):
        with open(filename, 'rb') as f:
            objs = pickle.load(f)
    objs.append(obj)
    with open(filename, 'wb') as f:
        pickle.dump(objs, f)

def naive_load(filename):
    with open(filename, 'rb') as f:
        return pickle.load(f)

def smart_append(filename, obj):
    with open(filename, 'ab+') as f:
        pickle.dump(obj, f)

def smart_load(filename):
    with open(filename, 'rb') as f:
        while True:
            try:
                yield pickle.load(f)
            except EOFError:
                break

def bench(appender, loader):
    filename="test.log.pkl"
    if os.path.exists(filename):
        os.remove(filename)
    arrays = [np.random.randn(500, 500) for _ in range(100)]

    started = time.time()
    for arr in arrays:
        appender(filename, arr)
    print(f"{appender.__name__}:    {time.time() - started:.3f} seconds")

    started = time.time()
    got_back = list(loader(filename))
    print(f"{loader.__name__}:    {time.time() - started:.3f} seconds")

    assert len(arrays) == len(got_back)
    assert all(a.sum() == b.sum() for a, b in zip(arrays, got_back))

bench(naive_append, naive_load)
bench(smart_append, smart_load)
相关推荐
  政府信创国产化的10大政策解读一、信创国产化的背景与意义信创国产化,即信息技术应用创新国产化,是当前中国信息技术领域的一个重要发展方向。其核心在于通过自主研发和创新,实现信息技术应用的自主可控,减少对外部技术的依赖,并规避潜在的技术制裁和风险。随着全球信息技术竞争的加剧,以及某些国家对中国在科技领域的打压,信创国产化显...
工程项目管理   2482  
  为什么项目管理通常仍然耗时且低效?您是否还在反复更新电子表格、淹没在便利贴中并参加每周更新会议?这确实是耗费时间和精力。借助软件工具的帮助,您可以一目了然地全面了解您的项目。如今,国内外有足够多优秀的项目管理软件可以帮助您掌控每个项目。什么是项目管理软件?项目管理软件是广泛行业用于项目规划、资源分配和调度的软件。它使项...
项目管理软件   1533  
  PLM(产品生命周期管理)项目对于企业优化产品研发流程、提升产品质量以及增强市场竞争力具有至关重要的意义。然而,在项目推进过程中,范围蔓延是一个常见且棘手的问题,它可能导致项目进度延迟、成本超支以及质量下降等一系列不良后果。因此,有效避免PLM项目范围蔓延成为项目成功的关键因素之一。以下将详细阐述三大管控策略,助力企业...
plm系统   0  
  PLM(产品生命周期管理)项目管理在企业产品研发与管理过程中扮演着至关重要的角色。随着市场竞争的加剧和产品复杂度的提升,PLM项目面临着诸多风险。准确量化风险优先级并采取有效措施应对,是确保项目成功的关键。五维评估矩阵作为一种有效的风险评估工具,能帮助项目管理者全面、系统地评估风险,为决策提供有力支持。五维评估矩阵概述...
免费plm软件   0  
  引言PLM(产品生命周期管理)开发流程对于企业产品的全生命周期管控至关重要。它涵盖了从产品概念设计到退役的各个阶段,直接影响着产品质量、开发周期以及企业的市场竞争力。在当今快速发展的科技环境下,客户对产品质量的要求日益提高,市场竞争也愈发激烈,这就使得优化PLM开发流程成为企业的必然选择。缺陷管理工具和六西格玛方法作为...
plm产品全生命周期管理   0  
热门文章
项目管理软件有哪些?
曾咪二维码

扫码咨询,免费领取项目管理大礼包!

云禅道AD
禅道项目管理软件

云端的项目管理软件

尊享禅道项目软件收费版功能

无需维护,随时随地协同办公

内置subversion和git源码管理

每天备份,随时转为私有部署

免费试用