模塊
如果你從Python解釋器退出并再次進入,之前的定義(函數和變量)都會丟失。因此,如果你想編寫一個稍長些的程序,最好使用文本編輯器為解釋器準備輸入并將該文件作為輸入運行。這被稱作編寫 腳本 。隨著程序變得越來越長,你或許會想把它拆分成幾個文件,以方便維護。你亦或想在不同的程序中使用一個便捷的函數, 而不必把這個函數復制到每一個程序中去。
為支持這些,Python有一種方法可以把定義放在一個文件里,并在腳本或解釋器的交互式實例中使用它們。這樣的文件被稱作 模塊 ;模塊中的定義可以 導入 到其它模塊或者 主 模塊(你在頂級和計算器模式下執行的腳本中可以訪問的變量集合)。
模塊是一個包含Python定義和語句的文件。文件名就是模塊名后跟文件后綴 .py 。在一個模塊內部,模塊名(作為一個字符串)可以通過全局變量 __name__ 的值獲得。例如,使用你最喜愛的文本編輯器在當前目錄下創建一個名為 fibo.py 的文件, 文件中含有以下內容:
# Fibonacci numbers module def fib(n): # write Fibonacci series up to n a, b = 0, 1 while a < n: print(a, end=' ') a, b = b, a+b print() def fib2(n): # return Fibonacci series up to n result = [] a, b = 0, 1 while a < n: result.Append(a) a, b = b, a+b return result
現在進入Python解釋器,并用以下命令導入該模塊:
>>>
>>> import fibo
在當前的符號表中,這并不會直接進入到定義在 fibo 函數內的名稱;它只是進入到模塊名 fibo 中。你可以用模塊名訪問這些函數:
>>>
>>> fibo.fib(1000) 0 1 1 2 3 5 8 13 21 34 55 89 144 233 377 610 987 >>> fibo.fib2(100) [0, 1, 1, 2, 3, 5, 8, 13, 21, 34, 55, 89] >>> fibo.__name__ 'fibo'
如果你想經常使用某個函數,你可以把它賦值給一個局部變量:
>>>
>>> fib = fibo.fib >>> fib(500) 0 1 1 2 3 5 8 13 21 34 55 89 144 233 377
有關模塊的更多信息
模塊可以包含可執行的語句以及函數定義。這些語句用于初始化模塊。它們僅在模塊 第一次在 import 語句中被導入時才執行。 1 (當文件被當作腳本運行時,它們也會執行。)
每個模塊都有它自己的私有符號表,該表用作模塊中定義的所有函數的全局符號表。因此,模塊的作者可以在模塊內使用全局變量,而不必擔心與用戶的全局變量發生意外沖突。另一方面,如果你知道自己在做什么,則可以用跟訪問模塊內的函數的同樣標記方法,去訪問一個模塊的全局變量,modname.itemname。
模塊可以導入其它模塊。習慣上但不要求把所有 import 語句放在模塊(或腳本)的開頭。被導入的模塊名存放在調入模塊的全局符號表中。
import 語句有一個變體,它可以把名字從一個被調模塊內直接導入到現模塊的符號表里。例如:
>>>
>>> from fibo import fib, fib2 >>> fib(500) 0 1 1 2 3 5 8 13 21 34 55 89 144 233 377
這并不會把被調模塊名引入到局部變量表里(因此在這個例子里,fibo 是未被定義的)。
還有一個變體甚至可以導入模塊內定義的所有名稱:
>>>
>>> from fibo import * >>> fib(500) 0 1 1 2 3 5 8 13 21 34 55 89 144 233 377
這會調入所有非以下劃線(_)開頭的名稱。 在多數情況下,Python程序員都不會使用這個功能,因為它在解釋器中引入了一組未知的名稱,而它們很可能會覆蓋一些你已經定義過的東西。
注意通常情況下從一個模塊或者包內調入 * 的做法是不太被接受的, 因為這通常會導致代碼的可讀性很差。不過,在交互式編譯器中為了節省打字可以這么用。
如果模塊名稱之后帶有 as,則跟在 as 之后的名稱將直接綁定到所導入的模塊。
>>>
>>> import fibo as fib >>> fib.fib(500) 0 1 1 2 3 5 8 13 21 34 55 89 144 233 377
這會和 import fibo 方式一樣有效地調入模塊, 唯一的區別是它以 fib 的名稱存在的。
It can also be used when utilising from with similar effects:
>>>
>>> from fibo import fib as fibonacci >>> fibonacci(500) 0 1 1 2 3 5 8 13 21 34 55 89 144 233 377
注解
出于效率的考慮,每個模塊在每個解釋器會話中只被導入一次。因此,如果你更改了你的模塊,則必須重新啟動解釋器, 或者,如果它只是一個要交互式地測試的模塊,請使用 importlib.reload(),例如 import importlib; importlib.reload(modulename)。
以腳本的方式執行模塊
當你用下面方式運行一個Python模塊:
python fibo.py <arguments>
模塊里的代碼會被執行,就好像你導入了模塊一樣,但是 __name__ 被賦值為 "__main__"。 這意味著通過在你的模塊末尾添加這些代碼:
if __name__ == "__main__": import sys fib(int(sys.argv[1]))
你既可以把這個文件當作腳本又可當作一個可調入的模塊來使用, 因為那段解析命令行的代碼只有在當模塊是以“main”文件的方式執行的時候才會運行:
$ python fibo.py 50 0 1 1 2 3 5 8 13 21 34
如果模塊是被導入的,那些代碼是不運行的:
>>>
>>> import fibo >>>
這經常用于為模塊提供一個方便的用戶接口,或用于測試(以腳本的方式運行模塊從而執行一些測試套件)。
模塊搜索路徑
當一個名為 spam 的模塊被導入的時候,解釋器首先尋找具有該名稱的內置模塊。如果沒有找到,然后解釋器從 sys.path 變量給出的目錄列表里尋找名為 spam.py 的文件。sys.path 初始有這些目錄地址:
- 包含輸入腳本的目錄(或者未指定文件時的當前目錄)。
- PYTHONPATH (一個包含目錄名稱的列表,它和shell變量 PATH 有一樣的語法)。
- 取決于安裝的默認設置
注解
在支持符號鏈接的文件系統上,包含輸入腳本的目錄是在追加符號鏈接后才計算出來的。換句話說,包含符號鏈接的目錄并 沒有 被添加到模塊的搜索路徑上。
在初始化后,Python程序可以更改 sys.path。包含正在運行腳本的文件目錄被放在搜索路徑的開頭處, 在標準庫路徑之前。這意味著將加載此目錄里的腳本,而不是標準庫中的同名模塊。 除非有意更換,否則這是錯誤。
“編譯過的”Python文件
為了加速模塊載入,Python在 __pycache__ 目錄里緩存了每個模塊的編譯后版本,名稱為 module.version.pyc ,其中名稱中的版本字段對編譯文件的格式進行編碼; 它一般使用Python版本號。例如,在CPython版本3.3中,spam.py的編譯版本將被緩存為 __pycache__/spam.cpython-33.pyc。此命名約定允許來自不同發行版和不同版本的Python的已編譯模塊共存。
Python根據編譯版本檢查源的修改日期,以查看它是否已過期并需要重新編譯。這是一個完全自動化的過程。此外,編譯的模塊與平臺無關,因此可以在具有不同體系結構的系統之間共享相同的庫。
Python在兩種情況下不會檢查緩存。首先,對于從命令行直接載入的模塊,它從來都是重新編譯并且不存儲編譯結果;其次,如果沒有源模塊,它不會檢查緩存。為了支持無源文件(僅編譯)發行版本, 編譯模塊必須是在源目錄下,并且絕對不能有源模塊。
給專業人士的一些小建議:
- 你可以在Python命令中使用 -O 或者 -OO 開關, 以減小編譯后模塊的大小。 -O 開關去除斷言語句,-OO 開關同時去除斷言語句和 __doc__ 字符串。由于有些程序可能依賴于這些,你應當只在清楚自己在做什么時才使用這個選項。“優化過的”模塊有一個 opt- 標簽并且通常小些。將來的發行版本或許會更改優化的效果。
- 一個從 .pyc 文件讀出的程序并不會比它從 .py 讀出時運行的更快,.pyc 文件唯一快的地方在于載入速度。
- compileall 模塊可以為一個目錄下的所有模塊創建.pyc文件。
標準模塊
Python附帶了一個標準模塊庫,在單獨的文檔Python庫參考(以下稱為“庫參考”)中進行了描述。一些模塊內置于解釋器中;它們提供對不屬于語言核心但仍然內置的操作的訪問,以提高效率或提供對系統調用等操作系統原語的訪問。這些模塊的集合是一個配置選項,它也取決于底層平臺。例如,winreg 模塊只在windows操作系統上提供。一個特別值得注意的模塊 sys,它被內嵌到每一個Python解釋器中。變量 sys.ps1 和 sys.ps2 定義用作主要和輔助提示的字符串:
>>>
>>> import sys >>> sys.ps1 '>>> ' >>> sys.ps2 '... ' >>> sys.ps1 = 'C> ' C> print('Yuck!') Yuck! C>
這兩個變量只有在編譯器是交互模式下才被定義。
sys.path 變量是一個字符串列表,用于確定解釋器的模塊搜索路徑。該變量被初始化為從環境變量 PYTHONPATH 獲取的默認路徑,或者如果 PYTHONPATH 未設置,則從內置默認路徑初始化。你可以使用標準列表操作對其進行修改:
>>>
>>> import sys >>> sys.path.append('/ufs/guido/lib/python')
6.3. dir() 函數
內置函數 dir() 用于查找模塊定義的名稱。 它返回一個排序過的字符串列表。
如果沒有參數,dir() 會列出你當前定義的名稱。
注意:它列出所有類型的名稱:變量,模塊,函數,等等。