排除 os.walk 中的目录

2025-02-24 09:29:00
admin
原创
74
摘要:问题描述:我正在编写一个脚本,该脚本会深入目录树(使用 os.walk()),然后访问与特定文件扩展名匹配的每个文件。但是,由于我的工具将要使用的某些目录树还包含子目录,而这些子目录又包含大量无用的东西(对于此脚本的目的而言),因此我认为我应该为用户添加一个选项,以指定要从遍历中排除的目录列表。使用 os.w...

问题描述:

我正在编写一个脚本,该脚本会深入目录树(使用 os.walk()),然后访问与特定文件扩展名匹配的每个文件。但是,由于我的工具将要使用的某些目录树还包含子目录,而这些子目录又包含大量无用的东西(对于此脚本的目的而言),因此我认为我应该为用户添加一个选项,以指定要从遍历中排除的目录列表。

使用 os.walk() 很容易做到这一点。毕竟,我是否真的想访问 os.walk() 产生的相应文件/目录或只是跳过它们取决于我自己。问题是,如果我有这样的目录树:

root--
     |
     --- dirA
     |
     --- dirB
     |
     --- uselessStuff --
                       |
                       --- moreJunk
                       |
                       --- yetMoreJunk

并且我想排除uselessStuff及其所有子目录,os.walk() 仍将深入到uselessStuff的所有子目录(可能数千个),这无疑会大大降低速度。在理想情况下,我可以告诉 os.walk() 甚至不要再产生uselessStuff的任何子目录,但据我所知,没有办法做到这一点(有吗?)。

有人有想法吗?也许有第三方库提供类似的东西?


解决方案 1:

dirs 就地修改将修剪访问的(后续)文件和目录os.walk

# exclude = set(['New folder', 'Windows', 'Desktop'])
for root, dirs, files in os.walk(top, topdown=True):
    dirs[:] = [d for d in dirs if d not in exclude]

来自帮助(os.walk):

当 topdown 为真时,调用者可以就地修改 dirnames 列表(例如,通过 del 或切片分配),并且 walk 将仅递归到名称保留在 dirnames 中的子目录中;这可用于修剪搜索......

解决方案 2:

...@unutbu 的优秀答案的另一种形式,读起来更直接一些,因为其目的是排除目录,代价是 O(n**2) 与 O(n) 时间。

list(dirs)(为了正确执行,需要复制目录列表)

# exclude = set([...])
for root, dirs, files in os.walk(top, topdown=True):
    [dirs.remove(d) for d in list(dirs) if d in exclude]
相关推荐
  政府信创国产化的10大政策解读一、信创国产化的背景与意义信创国产化,即信息技术应用创新国产化,是当前中国信息技术领域的一个重要发展方向。其核心在于通过自主研发和创新,实现信息技术应用的自主可控,减少对外部技术的依赖,并规避潜在的技术制裁和风险。随着全球信息技术竞争的加剧,以及某些国家对中国在科技领域的打压,信创国产化显...
工程项目管理   2738  
  为什么项目管理通常仍然耗时且低效?您是否还在反复更新电子表格、淹没在便利贴中并参加每周更新会议?这确实是耗费时间和精力。借助软件工具的帮助,您可以一目了然地全面了解您的项目。如今,国内外有足够多优秀的项目管理软件可以帮助您掌控每个项目。什么是项目管理软件?项目管理软件是广泛行业用于项目规划、资源分配和调度的软件。它使项...
项目管理软件   1676  
  在全球化的浪潮下,企业的业务范围不断拓展,跨文化协作变得愈发普遍。不同文化背景的团队成员在合作过程中,由于语言、价值观、工作习惯等方面的差异,往往会面临诸多沟通挑战。而产品生命周期管理(PLM)系统作为企业管理产品全生命周期的重要工具,如何有效支持跨文化协作成为了关键问题。通过合理运用沟通策略,PLM系统能够在跨文化团...
plm是什么软件   5  
  PLM(产品生命周期管理)系统在企业的产品研发、生产与管理过程中扮演着至关重要的角色,其中文档版本控制是确保产品数据准确性、完整性和可追溯性的关键环节。有效的文档版本控制能够避免因版本混乱导致的错误、重复工作以及沟通不畅等问题,提升企业整体的运营效率和产品质量。接下来,我们将深入探讨 PLM 系统实现文档版本控制的 6...
plm是什么意思   6  
  PLM(产品生命周期管理)项目管理旨在通过有效整合流程、数据和人员,优化产品从概念到退役的整个生命周期。在这个过程中,敏捷测试成为确保产品质量、加速交付的关键环节。敏捷测试强调快速反馈、持续改进以及与开发的紧密协作,对传统的测试流程提出了新的挑战与机遇。通过对测试流程的优化,能够更好地适应PLM项目的动态变化,提升产品...
plm管理系统   4  
热门文章
项目管理软件有哪些?
曾咪二维码

扫码咨询,免费领取项目管理大礼包!

云禅道AD
禅道项目管理软件

云端的项目管理软件

尊享禅道项目软件收费版功能

无需维护,随时随地协同办公

内置subversion和git源码管理

每天备份,随时转为私有部署

免费试用