导入模块:__main__ vs作为模块导入


问题内容

作为序言,我想我可能已经弄清楚了如何使此代码正常工作(基于import之后更改模块变量),但是我的问题确实是关于为什么会发生以下行为,以便我将来可以做什么。

我有三个文件。第一个是mod1.py:

# mod1.py

import mod2

var1A = None

def func1A():
    global var1
    var1 = 'A'
    mod2.func2()

def func1B():
    global var1
    print var1

if __name__ == '__main__':
    func1A()

接下来我有mod2.py:

# mod2.py

import mod1

def func2():
    mod1.func1B()

最后我有driver.py:

# driver.py

import mod1

if __name__ == '__main__':
    mod1.func1A()

如果执行命令,python mod1.py则输出为None。根据我上面引用的链接,似乎在mod1.py作为导入__main__mod1.py从导入之间存在一些区别mod2.py。因此,我创建了driver.py。如果执行命令,python driver.py则将得到预期的输出:A。我看到了一些区别,但是我没有真正看到它的机制或原因。这是怎么发生的以及为什么发生的?似乎同一模块将存在两次是违反直觉的。如果我执行python mod1.py,将有可能访问的变量__main__的版本mod1.py,而不是由进口的版本中的变量mod2.py


问题答案:

__name__变量总是包含模块的名称, 除非 当该文件已被加载到解释作为脚本来代替。 然后 将该变量设置为字符串'__main__'

毕竟,脚本随后将作为整个程序的主文件运行,其他所有内容都是由该主文件直接或间接导入的模块。通过测试__name__变量,您可以因此检测文件是作为模块导入的还是直接运行的。

在内部,为模块提供了一个命名空间字典,该字典作为每个模块的元数据的一部分存储在中sys.modules。主文件(已执行的脚本)的存储结构与相同'__main__'

但是,当您将文件导入为模块时,python首先sys.modules查看该模块是否已经导入。因此,import mod1意味着我们首先寻找sys.modulesmod1模块。如果mod1还没有命名空间,它将创建一个新的模块结构。

因此,如果您都mod1.py作为主文件运行, 然后 又将其作为python模块导入,则它将在中获得 两个
名称空间条目sys.modules。一次为'__main__',然后为'mod1'。这两个名称空间是完全分开的。您的全球var1存储在sys.modules['__main__'],但func1B期待中sys.modules['mod1']var1,它在哪里None

但是,当您使用时python driver.py,它将成为程序driver.py'__main__'主文件,并且mod1只会被导入到sys.modules['mod1']结构中一次。这次,func1A将其存储var1sys.modules['mod1']结构中,这func1B将是发现的。