丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預(yù)覽,將在時失效
人工智能學(xué)術(shù) 正文
發(fā)私信給我在思考中
發(fā)送

0

從引力波探測到RNA測序,AI如何加速科學(xué)發(fā)現(xiàn)

本文作者: 我在思考中 2021-11-03 14:45
導(dǎo)語:機器學(xué)習(xí)方法集成到實驗數(shù)據(jù)處理過程有助于加速科學(xué)發(fā)現(xiàn)。
從引力波探測到RNA測序,AI如何加速科學(xué)發(fā)現(xiàn)
本篇綜述報告主要討論了機器學(xué)習(xí)在科學(xué)研究中的技術(shù)與應(yīng)用——將強大的機器學(xué)習(xí)方法集成到實驗數(shù)據(jù)處理過程有助于加速科學(xué)發(fā)現(xiàn)。內(nèi)容涵蓋三個方面:機器學(xué)習(xí)在多個科學(xué)領(lǐng)域的應(yīng)用;高效訓(xùn)練、高資源利用率算法;用于部署這些算法的計算架構(gòu)和平臺。本文還展示了多科學(xué)領(lǐng)域共同面臨的挑戰(zhàn)和應(yīng)對策略,希望通過集成和加速的機器學(xué)習(xí)解決方案為科學(xué)發(fā)現(xiàn)提供更多示例和靈感。
編譯 | 眉釘

編輯 | 琰琰

越來越復(fù)雜的實驗和日益增長的數(shù)據(jù)為科學(xué)探索帶來了新的挑戰(zhàn),而實驗表明,機器學(xué)習(xí),尤其是深度神經(jīng)網(wǎng)絡(luò)架構(gòu)的通用性能夠解決廣泛且復(fù)雜的問題, ImageNet 等大型數(shù)據(jù)集的激增,引導(dǎo)了許多不同深度學(xué)習(xí)方法的深入探索。

這篇綜述論文重點關(guān)注機器學(xué)習(xí)和實驗設(shè)計的融合,以及如何通過加速數(shù)據(jù)處理、實時決策來解決關(guān)鍵的科學(xué)問題。

在過去幾年,許多機器學(xué)習(xí)的進步源于異構(gòu)計算硬件的使用,特別是圖形處理器(GPUs)使大型機器學(xué)習(xí)算法得以快速進步。經(jīng)過大數(shù)據(jù)集訓(xùn)練的AI模型已經(jīng)能夠執(zhí)行復(fù)雜的任務(wù),同時,以減少計算量而實現(xiàn)快速和高效訓(xùn)練的新型深度學(xué)習(xí)算法也開始越來越多的出現(xiàn)。

強大的機器學(xué)習(xí)技術(shù)與實驗設(shè)計的結(jié)合,可以縮短科學(xué)發(fā)現(xiàn)的時間,從嵌入實時特征到跨分布式網(wǎng)絡(luò),計算數(shù)據(jù)中心的大規(guī)模機器學(xué)習(xí)在許多不同的科學(xué)應(yīng)用實驗上取得大的跨越。不過,高效的解決方案依然需要領(lǐng)域?qū)<?、機器學(xué)習(xí)研究人員和計算機架構(gòu)設(shè)計師之間的共同合作。

隨著機器學(xué)習(xí)工具變得越來越復(fù)雜,如何構(gòu)建大模型來解決復(fù)雜的問題成為了新得關(guān)注點,例如語言翻譯和語音識別,它們的出現(xiàn)使得科學(xué)應(yīng)用在快速發(fā)展中廣泛收益。目前這些應(yīng)用已經(jīng)出現(xiàn)多樣化,因為人們不得不意識到如何調(diào)整他們的科學(xué)方法從而更好地利用人工智能的好處,包括人工智能對事件的實時分類能力,如識別粒子碰撞或引力波合并;包括系統(tǒng)控制,如來自等離子體和粒子加速器的反饋機制的響應(yīng)控制。在這些所有情況下,機器學(xué)習(xí)都是以設(shè)計目標為驅(qū)動因素的。

考慮到文章篇幅,我們將從三個部分對整篇綜述報告進行呈現(xiàn),第一,機器學(xué)習(xí)如何探索廣泛的科學(xué)問題;第二,快速機器學(xué)習(xí)作為一種顛覆性技術(shù),如何改變我們處理數(shù)據(jù)的方式,通用的數(shù)據(jù)表示法和實驗程序有哪些。第三,從算法設(shè)計到系統(tǒng)架構(gòu)的硬件對機器學(xué)習(xí)進行整體設(shè)計。



1

機器學(xué)習(xí)應(yīng)用:從基礎(chǔ)物理,醫(yī)學(xué)工程到邊緣計算

隨著科學(xué)生態(tài)系統(tǒng)規(guī)模的快速增長,數(shù)據(jù)處理和新范式需要集成到系統(tǒng)設(shè)計層面來完成。通過復(fù)雜數(shù)據(jù)處理過程的研究,作者發(fā)現(xiàn),不同領(lǐng)域和架構(gòu)之間實現(xiàn)機器學(xué)習(xí)可能會有很大差異,但仍然具有相似的底層數(shù)據(jù)表示和集成機器學(xué)習(xí)的需求。報告中列舉了大量科學(xué)領(lǐng)域的應(yīng)用案例,涵蓋現(xiàn)有技術(shù)和未來需求。接下來,我們將重點介紹機器學(xué)習(xí)在物理學(xué)、生物醫(yī)學(xué)工程學(xué)以及無線網(wǎng)絡(luò)和邊緣計算三個領(lǐng)域的應(yīng)用現(xiàn)狀和挑戰(zhàn)。

基礎(chǔ)物理學(xué)

正如愛因斯坦在 1916 年預(yù)測的那樣,引力波在廣義相對論中表現(xiàn)為時空度量的變化,并在時空結(jié)構(gòu)中以光速進行傳播。例如,美國激光干涉引力波天文臺(LIGO)、歐洲“處女座”(Virgo)引力波探測器和日本神岡引力波探測器(KAGRA)均采用公里級激光干涉儀網(wǎng)絡(luò)探測引力波。

引力波為基礎(chǔ)物理研究提供了一種獨特的方法,包括在強場域測試廣義相對論、引力波的傳播速度和極化、物質(zhì)在核密度下的狀態(tài)、黑洞的形成、量子引力效應(yīng)等,它以一種與電磁和中微子天文學(xué)相輔相成的方式,打開了全新觀察宇宙的窗口。在未來的觀察中,LIGO、Virgo 和 KAGRA 將探測到越來越多的引力波后備,但這對當(dāng)前的檢測框架提出了計算挑戰(zhàn),該框架依賴于匹配濾波技術(shù),需要將來自模擬的參數(shù)化波形(模板)與引力波時間序列數(shù)據(jù)相匹配 。

隨著儀器低頻靈敏度的提高,以及引力波搜索參數(shù)空間擴展到自旋效應(yīng)和低質(zhì)量致密物體,匹配濾波尺度將變差。為了估測引力波的物理特性,迄今為止一直使用隨機貝葉斯后驗采樣器(比如馬爾可夫鏈蒙特卡羅法和嵌套采樣法)。這些分析方法可能需要數(shù)小時到數(shù)天才能完成,搜索和參數(shù)估計也產(chǎn)生了不可避免的延遲,進而可能阻礙時間敏感源(如雙星、超新星和其他未知系統(tǒng))的電磁跟蹤。

此外,引力波瞬態(tài)的觀測也容易受到環(huán)境和儀器噪聲的影響。瞬態(tài)噪聲偽影可能被誤識為潛在來源,特別是當(dāng)引力波瞬態(tài)具有未知的形態(tài)時(例如超新星、中子星故障)。儀器噪聲譜中的線路噪聲會影響對連續(xù)引力波(如自旋中子星)和隨機引力波(例如未解的致密雙星系統(tǒng)引力波的天體物理背景)的搜索。這些噪聲源很難模擬,目前的噪聲減除技術(shù)不足以去除更復(fù)雜的噪聲源,如線路噪聲和非平穩(wěn)噪聲源。

近年來,機器學(xué)習(xí)算法在引力波物理學(xué)的不同領(lǐng)域進行了探索。卷積神經(jīng)網(wǎng)絡(luò)已被應(yīng)用于探測和分類二元結(jié)的引力波、 超新星核坍塌的爆發(fā)引力波以及連續(xù)引力波;遞歸神經(jīng)網(wǎng)絡(luò)(RNNs)的自動編碼器使用無監(jiān)督策略檢測引力波;FPGA遞歸神經(jīng)網(wǎng)絡(luò)在引力波低延遲檢測方面發(fā)揮著潛力。

此外,概率生成機器學(xué)習(xí)模型用于引力波參數(shù)估計的后驗采樣,在模擬數(shù)據(jù)上取得與貝葉斯采樣器相當(dāng)?shù)男阅埽蟠罂s短了完成時間。機器學(xué)習(xí)算法也被用于提高引力波數(shù)據(jù)質(zhì)量,減少噪聲。瞬態(tài)噪聲偽影可以通過時頻變換和恒Q變換或檢查LIGO的輔助通道來進行識別和分類。

盡管機器學(xué)習(xí)算法在引力波數(shù)據(jù)分析中顯示出了很大的潛力,但其中許多算法仍處于概念驗證階段,尚未成功應(yīng)用于實時分析。目前需要努力的方向是,為了降低低延遲分析創(chuàng)建計算基礎(chǔ)設(shè)施,提高訓(xùn)練數(shù)據(jù)的質(zhì)量(例如擴展參數(shù)空間,使用更真實的噪聲模型),并更好地量化這些算法在較長的數(shù)據(jù)延伸上的性能。

生物醫(yī)學(xué)工程

由于高分辨率和高通量生物醫(yī)學(xué)設(shè)備的進步,我們已經(jīng)看到生物醫(yī)學(xué)數(shù)據(jù)的爆炸式增長,如生物醫(yī)學(xué)圖像、基因組序列和蛋白質(zhì)結(jié)構(gòu)。各種機器學(xué)習(xí)算法已經(jīng)被廣泛應(yīng)用于醫(yī)療場景中,如AI增強現(xiàn)實顯微鏡能夠自動分析細胞圖像和實時表征細胞。機器學(xué)習(xí)用硅片預(yù)測熒光標記、無標記罕見細胞分類、形態(tài)表征和RNA測序。對于原位細胞分選、實時治療反應(yīng)預(yù)測和增強現(xiàn)實顯微鏡輔助診斷,深度學(xué)習(xí)模型的數(shù)據(jù)結(jié)構(gòu)也能夠大幅提高速度和效率。

現(xiàn)階段,機器學(xué)習(xí)臨床應(yīng)用面臨的主要挑戰(zhàn)是訓(xùn)練和測試數(shù)據(jù)不足。對于需要專家知識的超大圖像和視頻數(shù)據(jù)集,醫(yī)學(xué)數(shù)據(jù)標注過程既耗時又昂貴。訓(xùn)練模型推理的延遲也給實時診斷和手術(shù)操作帶來了計算困難,而時間關(guān)鍵型醫(yī)療保健的服務(wù)質(zhì)量要求小于300毫秒,就像實時視頻通信一樣。為了達到每秒60幀(FPS)的高質(zhì)量醫(yī)療視頻,深度學(xué)習(xí)模型的效率和性能變得至關(guān)重要。

推理精度和速度是機器學(xué)習(xí)算法需要改進的主要方面。一些先進的機器學(xué)習(xí)模型可以達到很高的推理速度。如常用于醫(yī)學(xué)成像的對象檢測模型YOLOv3-tiny,可以在標準數(shù)據(jù)集上以超過200 FPS的速度處理圖像;基于GPU和FPGA的分布式無線傳感器網(wǎng)絡(luò)和基于5G高速Wi-Fi的機器學(xué)習(xí)模型都部署在醫(yī)療AI應(yīng)用中。用于腦卒中、血栓形成、結(jié)腸息肉、癌癥和癲癇快速診斷的機器學(xué)習(xí)模型顯著減少了病灶檢測和臨床決策的時間。實時人工智能輔助手術(shù)可以改進圍手術(shù)期工作流程,實現(xiàn)視頻分割、手術(shù)器械檢測、組織變形可視化。高速機器學(xué)習(xí)在遠程診斷、手術(shù)和監(jiān)測等數(shù)字健康領(lǐng)域發(fā)揮著至關(guān)重要的作用。

無線網(wǎng)絡(luò)和邊緣計算

在許多科學(xué)研究中,無線設(shè)備和服務(wù)已經(jīng)成為收集和傳遞大數(shù)據(jù)的關(guān)鍵工具。此外,移動信息已被證明在了解人類活動及其對環(huán)境和公共健康的影響方面十分有用。數(shù)據(jù)流量的指數(shù)級增長給無線基礎(chǔ)設(shè)施帶來了巨大的壓力。特別是,小區(qū)間干擾大大影響了可靠性和延遲性。為了滿足用戶對數(shù)據(jù)通信和增值A(chǔ)I/機器學(xué)習(xí)業(yè)務(wù)的需求,無線提供商必須:1) 開發(fā)更智能的無線電資源管理學(xué)習(xí)算法,以適應(yīng)復(fù)雜多變的通信量和干擾條件; 2)在邊緣設(shè)備上實現(xiàn)大量機器學(xué)習(xí)/AI計算和功能,以達到更低的延遲和更高的通信效率。

機器學(xué)習(xí)模型的常規(guī)實現(xiàn),尤其是深度學(xué)習(xí)算法,遠遠落后于實用程序的數(shù)據(jù)包級動態(tài)。為了提高效率,現(xiàn)有的機器學(xué)習(xí)/AI服務(wù)通常在云中執(zhí)行,但代價是通信開銷大和延遲高。無線網(wǎng)絡(luò)和邊緣計算面臨的主要挑戰(zhàn)是如何構(gòu)建可以在小型蜂窩接入點內(nèi)以低于10毫秒的低延遲執(zhí)行復(fù)雜任務(wù)的計算平臺。

研究人員提出了許多種學(xué)習(xí)算法,希望通過神經(jīng)網(wǎng)絡(luò)完成特定的無線電資源管理任務(wù)。最初訓(xùn)練神經(jīng)網(wǎng)絡(luò)控制電力傳輸采用的是監(jiān)督學(xué)習(xí)。最近,有人提議采用深度強化學(xué)習(xí)可以更好地改善通路和網(wǎng)絡(luò)的不確定性問題,而且只需要少量先驗訓(xùn)練數(shù)據(jù)。

后來許多工作開始集中在邊緣計算和深度學(xué)習(xí)間的融合。有研究人員使用聯(lián)邦學(xué)習(xí)的方式訓(xùn)練AI模型,而不是將所有數(shù)據(jù)發(fā)送給中央控制器進行訓(xùn)練。由于缺乏既快速又高效的實用型ML/AI解決方案,上述工作基本上停留在仿真階段。更具體地說,開發(fā)一種計算平臺,使得該平臺能夠以小于10ms的速度執(zhí)行復(fù)雜ML模型,且可以配置在小型小區(qū)接入點是現(xiàn)階段的主要目標。



2

數(shù)據(jù)處理的三種主要形式

實時、加速的人工智能推理有望在當(dāng)前和未來的科學(xué)儀器領(lǐng)域提高探測能力。為設(shè)計高性能的AI系統(tǒng),我們需要重點關(guān)注目標域機器學(xué)習(xí)算法的性能系數(shù),它可能受到推理延遲、計算成本、可靠性、安全性和極端環(huán)境下運行能力的影響。例如,機器學(xué)習(xí)在大型強子對撞機上觸發(fā)需要延遲100 ns的稀有事件采集系統(tǒng)。

此外,先進科學(xué)儀器的實時分析必須不間斷地分配計算資源,無線醫(yī)療設(shè)備處理患者敏感信息必須保密。上述特征和特性為人們分辨出域和應(yīng)用程序之間的差異和共性提供了可量化的準則。這些準則可以解決不同科學(xué)領(lǐng)域的不同需求。合適的數(shù)據(jù)表達是設(shè)計過程中重要一步,也是第一步,因為它能夠決定模型的應(yīng)用場景。

數(shù)據(jù)表示

在特定領(lǐng)域使用的數(shù)據(jù)表達方式對計算系統(tǒng)和數(shù)據(jù)存儲均有影響。國際上,跨域數(shù)據(jù)表達可以分為原始數(shù)據(jù)和重構(gòu)數(shù)據(jù)。數(shù)據(jù)表達方式通常因重建階段和數(shù)據(jù)處理管道中的上游步驟而異。當(dāng)數(shù)據(jù)具有圖像性質(zhì)時,現(xiàn)有的應(yīng)用程序包括完全連接的CNN模型在內(nèi),通常將預(yù)處理的熟練特征變量作為輸入值或 CNN模型。現(xiàn)有的CNN算法發(fā)展成果得益于變量的精準性和高效性。

為了充分挖掘CNN模型的力量,使其信息損失降到最低水平,需要采用一種合適的原始數(shù)據(jù)表達方式,例如點云,它根據(jù)不同實驗和測量系統(tǒng)的原始數(shù)據(jù)可以明顯得出:

  • 空間數(shù)據(jù):用于描述幾何空間中的物理對象。主要有兩種類型:矢量和柵格數(shù)據(jù)。矢量數(shù)據(jù)可以由點、線或多邊形組成;柵格數(shù)據(jù)是指由像素組成的網(wǎng)格,像素相依表示為圖像或其他的值,如強度、電荷、場強等。

  • 點云:一種空間數(shù)據(jù)類型。這種數(shù)據(jù)表達是通過整理一組空間數(shù)據(jù)(即三維空間中的點)創(chuàng)建的,這些數(shù)據(jù)通常在空間中共同構(gòu)成一個對象。

  • 時序數(shù)據(jù):用于表示系統(tǒng)/實驗在特定時間的狀態(tài)??鐣r段收集而來的數(shù)據(jù)會按照特定的順序進行分類。時間序列數(shù)據(jù)是上述表達方式中的一個子集,其中的數(shù)據(jù)以固定的時間間隔進行采樣。

  • 時空數(shù)據(jù):可在空間和時間兩個維度上測量和觀測某個系統(tǒng)。在這種情況下,數(shù)據(jù)可以被認為是時空的。

  • 多光譜數(shù)據(jù):用于表達多個傳感器中的輸出值,上述傳感器能夠從電磁光譜的多個頻段捕獲測量值。多光譜表達通常用于成像,與能夠識別波長各異的光的傳感器有關(guān)。通常會涉及幾個到幾十個光譜的量級。

  • 高光譜數(shù)據(jù):用于表示從大量光譜(如100s)中得到的測量值。這些從各異的窄帶光譜中采集到的圖像被合并成一個高光譜立方體,該立方體具有三個主要維度,前兩個維度參考了二維空間位置(例如,地球表面),第三個維度代表了每個“像素”位置的完整頻譜內(nèi)容。

點云

點云數(shù)據(jù)表達是高能粒子領(lǐng)域中一個常見的概念。在高能粒子領(lǐng)域里,經(jīng)大量探測器收集而來的測量數(shù)據(jù)被合并成一個數(shù)據(jù)集。在眾多高能粒子應(yīng)用中,點云通常用于表示數(shù)據(jù)尺寸超過1Pb/s的粒子射流。通俗地說,點云可以用來捕捉任何三維空間事件和空間中運動部件的相互作用。

質(zhì)子之間發(fā)生碰撞后的殘余物在定制化和優(yōu)化后的探測器中產(chǎn)生信號,在空間中以點的形式顯示。掃描后的各類圖像數(shù)據(jù)可以按照點云的方式呈現(xiàn),生物醫(yī)學(xué)工程和虛擬實境中的CT和PET掃描也是利用點云進行成像,還有用于產(chǎn)品設(shè)計、實體對象建模、體系結(jié)構(gòu)和基礎(chǔ)設(shè)施設(shè)計的三維掃描儀。

上述成像任務(wù)中,大部分都是按照從GB到TB的順序生成相應(yīng)大小的點云。域共享點云表達(例如高能粒子和生物醫(yī)學(xué)成像)也會涉及到空間特性。

從引力波探測到RNA測序,AI如何加速科學(xué)發(fā)現(xiàn)
圖注:Kaggle數(shù)據(jù)集中,Track機器學(xué)習(xí)在三維空間中將粒子跟蹤命中進行可視化

多/高光譜數(shù)據(jù)

多光譜數(shù)據(jù)在無線醫(yī)療監(jiān)測和無線通信系統(tǒng)之間普遍存在。一組生理傳感器通常代表不同的模式,被合并成一個多光譜數(shù)據(jù)集,用于醫(yī)療監(jiān)測和干預(yù)系統(tǒng)。對于無線通信而言,通過多光譜數(shù)據(jù)捕獲信號干擾情況和網(wǎng)絡(luò)流量狀況,兩個領(lǐng)域都會跨時間捕獲數(shù)據(jù),因此也會顯示出時間特性。

與其他領(lǐng)域相比,這兩個領(lǐng)域中生成的數(shù)據(jù)大小可以被認為相對較小(從100s Mb/s到10s Gb/s)。高光譜數(shù)據(jù)被用于許多天文學(xué)應(yīng)用、醫(yī)學(xué)成像和電子顯微鏡領(lǐng)域,用于實現(xiàn)更多的材料科學(xué)設(shè)計和發(fā)現(xiàn)應(yīng)用。

如圖7所示,電子顯微鏡中顯示的是高光譜數(shù)據(jù)。將電子探針柵格化在所研究的樣品上,并在像素探測器上捕獲衍射圖。當(dāng)電子探針在樣品上掃描時,像素探測器進行圖像捕捉。新興的多信使天文學(xué)應(yīng)用進一步提升了高光譜數(shù)據(jù)表達的效用,這些數(shù)據(jù)表達是結(jié)合了大量探測器和望遠鏡的觀測結(jié)果匯總而成。

從引力波探測到RNA測序,AI如何加速科學(xué)發(fā)現(xiàn)

圖7 .二硫化物二維材料的4D - STEM實驗測量。


3

實現(xiàn)低延時、高效率的ML算法

作者重點對如何構(gòu)建高效機器學(xué)習(xí)算法的技術(shù)和技巧進行了簡要概述。在考慮硬件的情況下,構(gòu)建算法實現(xiàn)協(xié)同設(shè)計,需要為硬件編程提供高效的平臺。為實現(xiàn)這這一點將從三個部分進行介紹:重點討論神經(jīng)網(wǎng)絡(luò)設(shè)計和訓(xùn)練,以便實現(xiàn)硬件的有效應(yīng)用;將機器學(xué)習(xí)硬件計算平臺分為“常規(guī)CMOS硬件”和“新興的超CMOS硬件”兩部分進行介紹。前者將解決近期的硬件方案,后者專注于頻譜的投機端。

同時,由于編程新硬件領(lǐng)域發(fā)展迅速,作者以一個具體示例闡明設(shè)備家族面臨的選擇和挑戰(zhàn):即現(xiàn)場可編程門陣列(FPGA),希望從FPGA的細節(jié)中,為讀者了解軟件設(shè)計的基本方法提供幫助。本文將以用于高效部署機器學(xué)習(xí)模型的系統(tǒng)方法為例進行簡單介紹。

科學(xué)領(lǐng)域中的許多機器學(xué)習(xí)問題要求延遲時間短,資源較為有限。然而,大多數(shù)現(xiàn)有的先進CNN模型延遲度非常高,且占用內(nèi)存大,消耗量高。出于上述原因,實踐者被迫使用非理想精度的次優(yōu)模型(例如淺層CNN)來避免這一延遲問題。大量的文獻致力于通過解決上述延遲問題,以提升CNN模型有效性,大致歸納如下:

1、設(shè)計全新的高效NN架構(gòu);2、 NN架構(gòu)與硬件的協(xié)同設(shè)計;3、量化(低精度推斷);4、剪枝和稀疏推斷;5、知識蒸餾。

作者在文中闡述了需要在高吞吐量和低延遲環(huán)境下的機器學(xué)習(xí)算法,既包括系統(tǒng)設(shè)計和培訓(xùn),也包括機器學(xué)習(xí)模型的高效部署和應(yīng)用。在硬件應(yīng)用方面主要討論了兩類內(nèi)容:現(xiàn)有的傳統(tǒng)CMOS技術(shù)和超CMOS技術(shù)。在常規(guī)的CMOS案例中,在摩爾定律的基礎(chǔ)上,人們重點研究機器學(xué)習(xí)設(shè)計的先進硬件架構(gòu)。對于眾多硬件來說,機器學(xué)習(xí)算法的協(xié)同設(shè)計是特定科學(xué)領(lǐng)域?qū)τ布òㄆ潴w系結(jié)構(gòu)和可編程性)要求的關(guān)鍵,一個高度相關(guān)和極其重要的硬件平臺的示例就是FPGA,作者認為,這些技術(shù)提供了令人興奮和超級高效的技術(shù),雖然它們可能具有投機性,但相對于常規(guī)技術(shù),已經(jīng)大幅提升了現(xiàn)有的技術(shù)水平。



4

總結(jié)與展望

這篇綜述報告主要闡述了高效的機器學(xué)習(xí)算法的應(yīng)用,如何使跨領(lǐng)域的科學(xué)發(fā)現(xiàn)成為現(xiàn)實。這個過程中,科學(xué)探索時常產(chǎn)生令人激動的新研究和新發(fā)現(xiàn)。然而,這是一個相對嶄新的領(lǐng)域,蘊藏著豐富的潛力,也面臨著跨領(lǐng)域的開放性挑戰(zhàn)。除了報告中闡述的內(nèi)容之外,我們希望通過這篇文章對科學(xué)用例及其交疊的呈現(xiàn)能夠給讀者提供在其他研究中展開應(yīng)用的靈感。

機器學(xué)習(xí)的訓(xùn)練和部署手段以及計算機體系結(jié)構(gòu)都是一個非常迅速發(fā)展的領(lǐng)域,新的任務(wù)接踵而至。在機器學(xué)習(xí)和科學(xué)領(lǐng)域中不斷引入新方法,同時理解不同硬件下新算法的協(xié)同設(shè)計以及部署這些算法的工具流的易用性就顯得尤為重要。這里的創(chuàng)新之處將快速和廣泛采用強大的新機器學(xué)習(xí)硬件得以實現(xiàn)。在超CMOS技術(shù)的情況下,這些應(yīng)用性設(shè)計是很重要的,同時也要考慮到技術(shù)的成熟程度、融入計算體系結(jié)構(gòu)以及如何編程這類器件。

我們期待著在不久的將來能夠重溫這些話題,看看在應(yīng)用程序、機器學(xué)習(xí)技術(shù)和硬件平臺領(lǐng)域的發(fā)展速度——最重要的是它們的融合,在科學(xué)上領(lǐng)域上取得的顛覆性突破。

注:這篇綜述報告是第二屆年度Fast Machine Learning大會的概述,匯集了從粒子物理學(xué)家、材料學(xué)家到健康監(jiān)測研究人員,以及機器學(xué)習(xí)學(xué)者和計算機系統(tǒng)架構(gòu)師等多個科學(xué)專家的內(nèi)容,希望通過專家觀點和概念找到特定領(lǐng)域應(yīng)用、機器學(xué)習(xí)、實驗和計算機系統(tǒng)架構(gòu)之間匯合點,以加快科學(xué)發(fā)現(xiàn)。以下是整篇報告的具體章節(jié):

從引力波探測到RNA測序,AI如何加速科學(xué)發(fā)現(xiàn)
原文鏈接:https://arxiv.org/pdf/2110.13041v1.pdf

從引力波探測到RNA測序,AI如何加速科學(xué)發(fā)現(xiàn)

雷鋒網(wǎng)


雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

從引力波探測到RNA測序,AI如何加速科學(xué)發(fā)現(xiàn)

分享:
相關(guān)文章
當(dāng)月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說