用PyTorch還是TensorFlow？斯坦福大學(xué)CS博士生帶來(lái)全面解答

本文作者：汪思穎

編輯：郭奕欣

2017-09-04 09:53

導(dǎo)語(yǔ)：PyTorch和TensorFlow各有利弊

雷鋒網(wǎng) AI 評(píng)論按：關(guān)于深度學(xué)習(xí)的框架之爭(zhēng)一直沒(méi)有停止過(guò)。PyTorch，TensorFlow，Caffe還是Keras ？近日，斯坦福大學(xué)計(jì)算機(jī)科學(xué)博士生Awni Hannun就發(fā)表了一篇文章，對(duì)比當(dāng)前兩個(gè)主流框架PyTorch和TensorFlow。

雷鋒網(wǎng) AI 科技評(píng)論編譯如下：

這篇指南是我目前發(fā)現(xiàn)的PyTorch和TensorFlow之間的主要差異。寫(xiě)這篇文章的目的是想幫助那些想要開(kāi)始新項(xiàng)目或者轉(zhuǎn)換深度學(xué)習(xí)框架的人進(jìn)行選擇。文中重點(diǎn)考慮訓(xùn)練和部署深度學(xué)習(xí)堆棧組件時(shí)框架的可編程性和靈活性。我不會(huì)權(quán)衡速度、內(nèi)存使用情況等性能。

結(jié)論

PyTorch更適合于在研究中快速進(jìn)行原型設(shè)計(jì)、業(yè)余愛(ài)好者和小型項(xiàng)目，TensorFlow則更適合大規(guī)模的調(diào)度，尤其當(dāng)考慮到跨平臺(tái)和嵌入式調(diào)度操作時(shí)。

準(zhǔn)備時(shí)間

優(yōu)勝者: PyTorch

PyTorch實(shí)際上是NumPy的替代，它支持GPU，有著更高級(jí)的功能，可以用來(lái)構(gòu)建和訓(xùn)練深度神經(jīng)網(wǎng)絡(luò)。

如果你熟悉NumPy、Python和常見(jiàn)的深度學(xué)習(xí)概念(卷積層、遞歸層、SGD等)，那么學(xué)習(xí)Python對(duì)你來(lái)說(shuō)會(huì)很容易。

而TensorFlow則可以看成是一種嵌入Python的編程語(yǔ)言。當(dāng)你在編寫(xiě)TensorFlow代碼時(shí)，它們會(huì)通過(guò)Python編譯成一張圖，然后由TensorFlow執(zhí)行引擎運(yùn)行。我看到過(guò)剛使用TensorFlow的人因?yàn)檫@個(gè)額外的間接層而苦思冥想。也因?yàn)槿绱?，想用TensorFlow還需要學(xué)一些額外的概念，比如會(huì)話(huà)、圖、變量作用域和占位符等。要運(yùn)行基本模型，還需要更多的樣板代碼。使用TensorFlow的前期準(zhǔn)備時(shí)間肯定比PyTorch要長(zhǎng)。

圖創(chuàng)建和調(diào)試

優(yōu)勝者: PyTorch

創(chuàng)建和運(yùn)行計(jì)算圖可能是這兩個(gè)框架最大的不同。在PyTorch中，圖架構(gòu)是動(dòng)態(tài)的，這意味著圖是在運(yùn)行時(shí)創(chuàng)建的。而在TensorFlow中，圖架構(gòu)是靜態(tài)的，這意味著先編譯出圖然后再運(yùn)行。

下面是一個(gè)簡(jiǎn)單的例子，在PyTorch中可以使用標(biāo)準(zhǔn)的Python語(yǔ)言編寫(xiě)for循環(huán)結(jié)構(gòu)

for _ in range(T):

h = torch.matmul(W, h) + b

你可以在這段代碼的執(zhí)行過(guò)程中改變T的值。而在TensorFlow中，需要使用控制流運(yùn)算（control flow operation）來(lái)創(chuàng)建圖，例如tf.while_loop。對(duì)于更常見(jiàn)的結(jié)構(gòu)，TensorFlow可以執(zhí)行dynamic_rnn語(yǔ)句，但是創(chuàng)建自定義的動(dòng)態(tài)計(jì)算更加困難。

PyTorch中簡(jiǎn)單的圖架構(gòu)更容易推導(dǎo)，或許更重要的一點(diǎn)是，它更容易調(diào)試。調(diào)試PyTorch代碼如同調(diào)試Python代碼，可以使用pdb并在任何地方設(shè)置斷點(diǎn)。而調(diào)試TensorFlow代碼并不那么容易，你有兩個(gè)選擇，一是請(qǐng)求會(huì)話(huà)中你想要檢查的變量，二是學(xué)習(xí)和使用TensorFlow調(diào)試器(tfdbg)。

覆蓋率

優(yōu)勝者: TensorFlow

因?yàn)镻yTorch在逐漸發(fā)展，我認(rèn)為兩者之間的差距會(huì)縮小到零。然而，目前仍有一些TensorFlow支持但PyTorch不支持的功能，如下所示:

沿著維度翻轉(zhuǎn)張量 (np.flip, np.flipud, np.fliplr)
檢查張量是空值還是無(wú)限值(np.is_nan, np.is_inf)
快速傅里葉變換(np.fft)

此外，TensorFlow的contrib包中有更多比PyTorch更高級(jí)的函數(shù)和模型。

序列化

優(yōu)勝者: TensorFlow

在這兩種框架下保存和加載模型都很簡(jiǎn)單。PyTorch有一個(gè)特別簡(jiǎn)單的API，既可以保存模型的所有權(quán)重，也可以pickle全部類(lèi)。

TensorFlow的Saver對(duì)象也很容易使用，并為檢查點(diǎn)（check-pointing）提供了更多選擇。

在序列化中TensorFlow的主要優(yōu)點(diǎn)是可以將整個(gè)圖保存為協(xié)議緩沖區(qū)。這包括參數(shù)和運(yùn)算。此外，該圖可以通過(guò)其他支持的語(yǔ)言(C++，Java)加載。這對(duì)不支持Python的調(diào)度棧來(lái)說(shuō)至關(guān)重要。理論上，在改變模型源代碼之后，你想要運(yùn)行舊模型時(shí)它也能有所幫助。

部署

優(yōu)勝者: TensorFlow

對(duì)于小規(guī)模的服務(wù)器端部署，兩個(gè)框架都很容易封裝在諸如Flask web服務(wù)器中。

不過(guò)，TensorFlow支持移動(dòng)和嵌入式部署?？梢源_定的說(shuō)，這比包括PyTorch在內(nèi)的大多數(shù)深度學(xué)習(xí)框架支持功能的都要多。將TensorFlow部署到Android或iOS上確實(shí)需要大量的工作，但至少你不必用Java或C++重寫(xiě)模型的整個(gè)推理程序。

此外，TensorFlow Serving支持高性能的服務(wù)器端部署。我沒(méi)有使用過(guò)TensorFlow Serving，因此不能很確信地寫(xiě)出它的利弊。由于機(jī)器學(xué)習(xí)服務(wù)使用的頻率很高，我猜想這是人們堅(jiān)持使用TensorFlow的充分理由。除了性能之外，TensorFlow Serving的一個(gè)明顯特點(diǎn)是，支持輕松地?fù)Q用模型而不會(huì)降低服務(wù)性能。

文檔

平手

我在兩種框架的文檔中都找到了我需要的東西。Python的 API在兩個(gè)框架中都有良好的文檔記錄，并且有足夠的例子和教程來(lái)學(xué)習(xí)這兩種框架。

一個(gè)比較邊緣的問(wèn)題是，PyTorch的 C語(yǔ)言庫(kù)大多是無(wú)文檔記錄的，不過(guò)這只影響到編寫(xiě)定制的C語(yǔ)言擴(kuò)展程序，而且這種操作是否有助于軟件還存疑。

數(shù)據(jù)加載

優(yōu)勝者: PyTorch

PyTorch中用于數(shù)據(jù)加載的API設(shè)計(jì)得很好。接口在數(shù)據(jù)集、采樣器和數(shù)據(jù)加載器中有明確規(guī)定。數(shù)據(jù)加載器接收數(shù)據(jù)集和采樣器，根據(jù)采樣器的調(diào)度，在數(shù)據(jù)集上生成迭代器。加載并行數(shù)據(jù)就像把num_workers語(yǔ)句傳遞到數(shù)據(jù)加載器一樣簡(jiǎn)單。

我在TensorFlow還沒(méi)發(fā)現(xiàn)特別有用的加載數(shù)據(jù)的工具，例如readers, queues, queue runners等，都不夠好。部分原因是因?yàn)閷⑾胍\(yùn)行的所有預(yù)處理代碼添加到TensorFlow圖中并不總是直接的，例如計(jì)算時(shí)頻譜（spectrogram）。

而且，API本身更繁瑣，更難以學(xué)習(xí)。

設(shè)備管理

優(yōu)勝者: TensorFlow

TensorFlow管理設(shè)備時(shí)的無(wú)縫性非常好。通常不需要規(guī)定任何東西，因?yàn)槟J(rèn)已經(jīng)設(shè)好了。例如，如果GPU可用，TensorFlow將默認(rèn)在GPU上運(yùn)行。在PyTorch中，即使支持CUDA，都必須明確地將所有東西移到設(shè)備上。

TensorFlow設(shè)備管理的唯一缺點(diǎn)是，即使你只使用一個(gè)GPU它也會(huì)默認(rèn)占用所有GPU的顯存。簡(jiǎn)單的解決方法是用CUDA_VISIBLE_DEVICES語(yǔ)句指定顯卡。但有時(shí)會(huì)忘了設(shè)置，所以當(dāng)GPU實(shí)際上處于空閑狀態(tài)時(shí)，會(huì)顯示內(nèi)存不足。

在PyTorch中，代碼需要更頻繁地檢查CUDA的可用性和更明確的設(shè)備管理，當(dāng)編寫(xiě)能夠同時(shí)在CPU和GPU上運(yùn)行的代碼時(shí)尤甚。另外，將GPU上的PyTorch Variable轉(zhuǎn)換為NumPy數(shù)組有點(diǎn)繁瑣。

numpy_var = variable.cpu().data.numpy()

自定義擴(kuò)展

優(yōu)勝者: PyTorch

在這兩種框架中都可以用C語(yǔ)言、C++或CUDA構(gòu)建或綁定自定義擴(kuò)展。但TensorFlow需要更多的樣板代碼，即使它支持多種類(lèi)型和設(shè)備。在PyTorch中，只需為每個(gè)CPU和GPU版本編寫(xiě)一個(gè)接口和相應(yīng)的實(shí)現(xiàn)。用這兩種框架來(lái)編譯擴(kuò)展都很直接，并且不需要下載除了pip安裝包之外的任何頭文件或源代碼。

擴(kuò)展

關(guān)于TensorBoard

TensorBoard是用于展示訓(xùn)練機(jī)器學(xué)習(xí)模型過(guò)程的可視化工具。它是TensorFlow自帶的最有用的功能之一。只需要通過(guò)訓(xùn)練腳本中的一些代碼片段，就可以查看任何模型的訓(xùn)練曲線(xiàn)和驗(yàn)證結(jié)果。TensorBoard作為web服務(wù)運(yùn)行，它可以非常方便地將存儲(chǔ)在無(wú)頭節(jié)點(diǎn)（headless node）上的結(jié)果可視化。

我在用PyTorch之前一直在用這種功能并嘗試找到能替代這種功能的選擇。值得慶幸的是，目前至少有兩個(gè)開(kāi)源項(xiàng)目支持這種功能。一個(gè)是istensorboard_logger，另一個(gè)是crayon。istensorboard_logger庫(kù)甚至比TensorFlow中的TensorBoard摘要數(shù)據(jù)更容易使用，不過(guò)需要安裝TensorBoard來(lái)使用。crayon完全能取代TensorBoard，不過(guò)需要更多的設(shè)置(支持docker是先決條件)。

關(guān)于Keras

Keras是一個(gè)更高級(jí)的API，可配置后端，支持TensorFlow、Theano和CNTK，也許在不久的將來(lái)也會(huì)支持PyTorch。Keras就像TensorFlow里的tf.contrib庫(kù)一樣。

我上面沒(méi)有討論Keras，不過(guò)它使用起來(lái)特別容易。它是調(diào)試最常用的幾種深度神經(jīng)網(wǎng)絡(luò)架構(gòu)最快的方法之一。不過(guò)它的靈活性不如PyTorch或core TensorFlow。

關(guān)于TensorFlow Fold

谷歌在2017年2月發(fā)布了TensorFlow Fold。該庫(kù)構(gòu)建在TensorFlow之上，支持更多動(dòng)態(tài)圖構(gòu)建，主要優(yōu)點(diǎn)是動(dòng)態(tài)批處理功能——可以對(duì)不同規(guī)模的輸入數(shù)據(jù)（如解析樹(shù)上的遞歸網(wǎng)絡(luò)）自動(dòng)進(jìn)行批量計(jì)算。在可編程性上，它的語(yǔ)法不如PyTorch直接，不過(guò)在某些情況下，批量處理帶來(lái)的性能改進(jìn)可以讓我們忽略語(yǔ)法上的不足。

via：kdnuggets

雷鋒網(wǎng) AI科技評(píng)論

雷峰網(wǎng)原創(chuàng)文章，未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。

6人收藏

相關(guān)文章

汪思穎

編輯

關(guān)注AI學(xué)術(shù)，例如論文

發(fā)私信

當(dāng)月熱門(mén)文章

用PyTorch還是TensorFlow？斯坦福大學(xué)CS博士生帶來(lái)全面解答

用PyTorch還是TensorFlow？斯坦福大學(xué)CS博士生帶來(lái)全面解答