0
本文作者: 三川 | 2017-04-05 18:09 |
Microsoft Cognitive Toolkit 原名 CNTK,是微軟去年開源的深度學習框架。
作為語音識別領(lǐng)域聲名卓著的開發(fā)工具,Microsoft Cognitive Toolkit 具有相當不錯的可擴展性、速度和精確性。在海量數(shù)據(jù)上開發(fā)深度學習應(yīng)用,它具備商用級別的穩(wěn)定型,以及與主流編程語言與算法的兼容。
如今,它即將迎來新一代的 2.0 版本。
自從去年十月發(fā)布 2.0 beta 版,微軟為 Microsoft Cognitive Toolkit 2.0 已陸續(xù)添加了超過 100 余個新特性、升級以及漏洞修補。而近日雷鋒網(wǎng)獲知,微軟在 GitHub 上放出了它的 RC1版,即第一個候選版本,標志著內(nèi)測階段已經(jīng)完成。
我們離 Microsoft Cognitive Toolkit 2.0 的正式發(fā)布又近了一步。
前天,微軟在博客表示:
“我們很高興地宣布,微軟已經(jīng)將 Microsoft Cognitive Toolkit 2.0 帶出內(nèi)測階段,并在今天向大家公布其第一個候選版本。該工具此前被稱為 CNTK,是一個針對深度學習的系統(tǒng),用來加速諸如語音、圖像識別以及搜索相關(guān)性(search relevance)等領(lǐng)域的技術(shù)進步。并可運行于 CPU 或英偉達 GPU。Microsoft Cognitive Toolkit 既可本地運行,也可在云端基于 Azure GPU 運行。
Microsoft Cognitive Toolkit 在一系列微軟產(chǎn)品中都有十分廣泛的應(yīng)用。全世界范圍內(nèi)有大規(guī)模深度學習部署需求的公司,對最新算法、技術(shù)感興趣的學生,都是其用戶。自從 2016 年十月,我們已發(fā)布了超過十個 beta 版本,涵蓋數(shù)百個新特性、性能提升和修補。”
在 BrainScript 之外提供了更多 binding。2.0 版本把 Cognitive Toolkit 作為一個支持以下 binding 的算法庫:
Python (versions 2.7, 3.4, and 3.5).
C++.
C#/.NET Managed.
微軟充分認識到 Python 在深度學習領(lǐng)域的重要性,準備了一系列 Python 示例與教程(后者作為 Jupyter Notebooks 來執(zhí)行)。請見:
Python Tutorials (Jupyter Notebooks).
雷鋒網(wǎng)了解到,你也可以用 Cognitive Toolkit Docker Containers 來運行 Jupyter Notebooks 教程。
Layers 算法庫得到了大幅升級。大量的通用“l(fā)ayers”已預定義,使編寫包含標準層級的簡單網(wǎng)絡(luò)變得十分容易。
雷鋒網(wǎng)獲知,新的 Cognitive Toolkit 評估算法庫在易用性和性能上被大幅升級。該算法庫可被用于 Windows 和 Linux,使用 C++、Python、C# 其它 .NET 語言。
新特性列表
The ability to extend Cognitive Toolkit functions, learners, trainers and optimizers with your own algorithms in Python, C++.
Enhanced, built-in distributed readers for speech, image, and text deep learning tasks.
The ability to use TensorBoard visualizations from Cognitive toolkit! Read more here.
Pretrained models available for use.
Performance improvements.
Support of distributed scenarios in Python API. See more in the sections on distributed scenarios in the ConvNet and ResNet examples.
Support of Asynchronous Stochastic Gradient Descent (ASGD)/Hogwild! training parallelization support using Microsoft’s Parameter Server (Project Multiverso).
Support for training on one-hot and sparse arrays via NumPy.
Support of object recognition using Fast R-CNN algorithm.
Integration with NVIDIA NCCL, a stand-alone library of standard collective communication routines, such as all-gather, reduce, broadcast, etc., that have been optimized to achieve high bandwidth over PCIe. See how to enable NCCL in the Cognitive Toolkit Wiki.
Lambda rank and NDCG at 1 are accessible from Python for real this time.
Performance Profiler for BrainScript and Python.
Support in training session for cross validation and preservation of all checkpoints.
Github 地址:https://github.com/Microsoft/CNTK
相關(guān)文章:
谷歌、微軟、OpenAI 等巨頭的七大機器學習開源項目 看這篇就夠了
雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。