丁香五月亚洲,欧美孕妇XXX高清在线,国产中文资源,精品r视频在线

<dfn id="qxmik"><dd id="qxmik"><big id="qxmik"></big></dd></dfn><label id="qxmik"></label>

<span id="qxmik"><noframes id="qxmik"><rt id="qxmik"></rt>

<label id="qxmik"></label>

面向長代碼序列的 Transformer 模型優(yōu)化方法，提升長代碼場(chǎng)景性能

投稿用戶 ? 2024年7月9日上午8:29 ? 科研百科 ? 閱讀 32

阿里云機(jī)器學(xué)習(xí)平臺(tái)PAI與華東師范大學(xué)高明教授團(tuán)隊(duì)合作在SIGIR2022上發(fā)表了結(jié)構(gòu)感知的稀疏注意力Transformer模型SASA，這是面向長代碼序列的Transformer模型優(yōu)化方法，致力于提升長代碼場(chǎng)景下的效果和性能。由于self-attention模塊的復(fù)雜度隨序列長度呈次方增長，多數(shù)編程預(yù)訓(xùn)練語言模型（Programming-based Pretrained Language Models, PPLM）采用序列截?cái)嗟姆绞教幚泶a序列。SASA方法將self-attention的計(jì)算稀疏化，同時(shí)結(jié)合了代碼的結(jié)構(gòu)特性，從而提升了長序列任務(wù)的性能，也降低了內(nèi)存和計(jì)算復(fù)雜度。

論文：Tingting Liu, Chengyu Wang, Cen Chen, Ming Gao, and Aoying Zhou. Understanding Long Programming Languages with Structure-Aware sparse Attention. SIGIR 2022

模型框架

下圖展示了SASA的整體框架：

面向長代碼序列的 Transformer 模型優(yōu)化方法，提升長代碼場(chǎng)景性能

其中，SASA主要包含兩個(gè)階段：預(yù)處理階段和Sparse Transformer訓(xùn)練階段。在預(yù)處理階段得到兩個(gè)token之間的交互矩陣，一個(gè)是top-k frequency矩陣，一個(gè)是AST pattern矩陣。Top-k frequency矩陣是利用代碼預(yù)訓(xùn)練語言模型在CodeSearchNet語料上學(xué)習(xí)token之間的attention交互頻率，AST pattern矩陣是解析代碼的抽象語法樹（Abstract Syntax Tree，AST ），根據(jù)語法樹的連接關(guān)系得到token之間的交互信息。Sparse Transformer訓(xùn)練階段以Transformer Encoder作為基礎(chǔ)框架，將full self-attention替換為structure-aware sparse self-attention，在符合特定模式的token pair之間進(jìn)行attention計(jì)算，從而降低計(jì)算復(fù)雜度。

SASA稀疏注意力一共包括如下四個(gè)模塊：

Sliding window attention：僅在滑動(dòng)窗口內(nèi)的token之間計(jì)算self-attention，保留局部上下文的特征，計(jì)算復(fù)雜度為，為序列長度，是滑動(dòng)窗口大小。
Global attention：設(shè)置一定的global token，這些token將與序列中所有token進(jìn)行attention計(jì)算，從而獲取序列的全局信息，計(jì)算復(fù)雜度為，為global token個(gè)數(shù)。
Top-k sparse attention：Transformer模型中的attention交互是稀疏且長尾的，對(duì)于每個(gè)token，僅與其attention交互最高的top-k個(gè)token計(jì)算attention，復(fù)雜度為。
AST-aware structure attention：代碼不同于自然語言序列，有更強(qiáng)的結(jié)構(gòu)特性，通過將代碼解析成抽象語法樹（AST），然后根據(jù)語法樹中的連接關(guān)系確定attention計(jì)算的范圍。

為了適應(yīng)現(xiàn)代硬件的并行計(jì)算特性，我們將序列劃分為若干block，而非以token為單位進(jìn)行計(jì)算，每個(gè)query block與

面向長代碼序列的 Transformer 模型優(yōu)化方法，提升長代碼場(chǎng)景性能

個(gè)滑動(dòng)窗口blocks和

面向長代碼序列的 Transformer 模型優(yōu)化方法，提升長代碼場(chǎng)景性能

個(gè)global blocks以及

面向長代碼序列的 Transformer 模型優(yōu)化方法，提升長代碼場(chǎng)景性能

個(gè)top-k和AST blocks計(jì)算attention，總體的計(jì)算復(fù)雜度為

面向長代碼序列的 Transformer 模型優(yōu)化方法，提升長代碼場(chǎng)景性能

，

b為block size。

每個(gè)sparse attention pattern 對(duì)應(yīng)一個(gè)attention矩陣，以sliding window attention為例，其attention矩陣的計(jì)算為：

面向長代碼序列的 Transformer 模型優(yōu)化方法，提升長代碼場(chǎng)景性能

ASA偽代碼：

面向長代碼序列的 Transformer 模型優(yōu)化方法，提升長代碼場(chǎng)景性能

實(shí)驗(yàn)結(jié)果

我們采用CodeXGLUE[1]提供的四個(gè)任務(wù)數(shù)據(jù)集進(jìn)行評(píng)測(cè)，分別為code clone detection，defect detection，code search，code summarization。我們提取其中的序列長度大于512的數(shù)據(jù)組成長序列數(shù)據(jù)集，實(shí)驗(yàn)結(jié)果如下：

面向長代碼序列的 Transformer 模型優(yōu)化方法，提升長代碼場(chǎng)景性能

從實(shí)驗(yàn)結(jié)果可以看出，SASA在三個(gè)數(shù)據(jù)集上的性能明顯超過所有Baseline。其中Roberta-base[2]，CodeBERT[3]，GraphCodeBERT[4]是采用截?cái)嗟姆绞教幚黹L序列，這將損失一部分的上下文信息。Longformer[5]和BigBird[6]是在自然語言處理中用于處理長序列的方法，但未考慮代碼的結(jié)構(gòu)特性，直接遷移到代碼任務(wù)上效果不佳。

為了驗(yàn)證top-k sparse attention和AST-aware sparse attention模塊的效果，我們?cè)贐igCloneBench和Defect Detection數(shù)據(jù)集上做了消融實(shí)驗(yàn)，結(jié)果如下：

面向長代碼序列的 Transformer 模型優(yōu)化方法，提升長代碼場(chǎng)景性能

sparse attention模塊不僅對(duì)于長代碼的任務(wù)性能有提升，還可以大幅減少顯存使用，在同樣的設(shè)備下，SASA可以設(shè)置更大的batch size，而full self-attention的模型則面臨out of memory的問題，具體顯存使用情況如下圖：

面向長代碼序列的 Transformer 模型優(yōu)化方法，提升長代碼場(chǎng)景性能

SASA作為一個(gè)sparse attention的模塊，可以遷移到基于Transformer的其他預(yù)訓(xùn)練模型上，用于處理長序列的自然語言處理任務(wù)，后續(xù)將集成到開源框架EasyNLP（https://github.com/alibaba/EasyNLP）中，貢獻(xiàn)給開源社區(qū)。

論文鏈接：https://arxiv.org/abs/2205.13730

參考文獻(xiàn)

[1] Shuai Lu, Daya Guo, Shuo Ren, Junjie Huang, Alexey Svyatkovskiy, Ambrosio Blanco, Colin B. Clement, Dawn Drain, Daxin Jiang, Duyu Tang, Ge Li, Lidong Zhou, Linjun Shou, Long Zhou, Michele Tufano, Ming Gong, Ming Zhou, Nan Duan, Neel Sundaresan, Shao Kun Deng, Shengyu Fu, Shujie Liu. CodeXGLUE: A Machine Learning Benchmark Dataset for Code Understanding and Generation. NeurIPS Datasets and Benchmarks 2021

[2] Yinhan Liu, Myle Ott, Naman Goyal, Jingfei Du, Mandar Joshi, Danqi Chen, Omer Levy, Mike Lewis, Luke Zettlemoyer, Veselin Stoyanov. RoBERTa: A Robustly Optimized BERT Pretraining Approach. CoRR abs/1907.11692 (2019)

[3] Zhangyin Feng, Daya Guo, Duyu Tang, Nan Duan, Xiaocheng Feng, Ming Gong, Linjun Shou, Bing Qin, Ting Liu, Daxin Jiang, Ming Zhou. CodeBERT: A Pre-Trained Model for Programming and Natural Languages. EMNLP 2020

[4] Daya Guo, Shuo Ren, Shuai Lu, Zhangyin Feng, Duyu Tang, Shujie Liu, Long Zhou, Nan Duan, Alexey Svyatkovskiy, Shengyu Fu, Michele Tufano, Shao Kun Deng, Colin B. Clement, Dawn Drain, Neel Sundaresan, Jian Yin, Daxin Jiang, Ming Zhou. GraphCodeBERT: Pre-training Code Representations with Data Flow. ICLR 2021

[5] Iz Beltagy, Matthew E. Peters, Arman Cohan. Longformer: The Long-Document Transformer. CoRR abs/2004.05150 (2020)

[6] Manzil Zaheer, Guru Guruganesh, Kumar Avinava Dubey, Joshua Ainslie, Chris Alberti, Santiago Onta?ón, Philip Pham, Anirudh Ravula, Qifan Wang, Li Yang, Amr Ahmed. Big Bird: Transformers for Longer Sequences. NeurIPS 2020

原文鏈接：http://click.aliyun.com/m/1000348767/

本文為阿里云原創(chuàng)內(nèi)容，未經(jīng)允許不得轉(zhuǎn)載。

版權(quán)聲明：本文內(nèi)容由互聯(lián)網(wǎng)用戶自發(fā)貢獻(xiàn)，該文觀點(diǎn)僅代表作者本人。本站僅提供信息存儲(chǔ)空間服務(wù)，不擁有所有權(quán)，不承擔(dān)相關(guān)法律責(zé)任。如發(fā)現(xiàn)本站有涉嫌抄襲侵權(quán)/違法違規(guī)的內(nèi)容，請(qǐng)發(fā)送郵件至舉報(bào)，一經(jīng)查實(shí)，本站將立刻刪除。

贊 (0)

0

關(guān)于彩票分析工具的便捷性對(duì)比

上一篇 2024年7月9日上午8:23

如何進(jìn)行高效的代碼審查？（如何進(jìn)行高效的代碼審查）

下一篇 2024年7月9日上午8:35

黨建臺(tái)賬模板大全（黨建臺(tái)賬模板大全2021）

（臺(tái)賬內(nèi)容）建議根據(jù)每一項(xiàng)工作內(nèi)容在目錄中的編號(hào)，在整本臺(tái)賬中加上書簽，在相關(guān)內(nèi)容首頁的頁邊貼上書簽，寫上編號(hào)“1”，相關(guān)材料歸入其后，無需再加書簽；在下一項(xiàng)相關(guān)內(nèi)容首頁的頁邊貼…

投稿用戶
科研百科 2023年2月26日
4310
項(xiàng)目管理幾大工具

項(xiàng)目管理是許多組織中至關(guān)重要的一部分。有效的項(xiàng)目管理可以幫助組織實(shí)現(xiàn)目標(biāo)，并提高效率。本文將介紹項(xiàng)目管理中的幾個(gè)重要工具。 1. Project Management Softwa…

投稿用戶
科研百科 2024年9月27日
20
互聯(lián)網(wǎng)項(xiàng)目管理最佳實(shí)踐及工具薈萃（互聯(lián)網(wǎng)項(xiàng)目管理最佳實(shí)踐及工具薈萃論文）

親們，咱們前沿社區(qū)第二本書出版啦！想要知道互聯(lián)網(wǎng)行業(yè)的項(xiàng)目管理是如何運(yùn)作的？想要學(xué)習(xí)和了解互聯(lián)網(wǎng)項(xiàng)目管理看這本書就夠啦—《互聯(lián)網(wǎng)項(xiàng)目管理實(shí)戰(zhàn)指南》（內(nèi)附精美知識(shí)地圖）目…

投稿用戶
科研百科 2024年4月24日
690
麻醉科研項(xiàng)目書撰寫要求

麻醉科研項(xiàng)目書撰寫要求隨著醫(yī)療技術(shù)的不斷發(fā)展，麻醉科在醫(yī)療機(jī)構(gòu)中的地位越來越重要。一篇好的麻醉科研項(xiàng)目書不僅能夠展示研究者對(duì)麻醉領(lǐng)域的了解和興趣，還能夠?yàn)獒t(yī)療機(jī)構(gòu)和科研團(tuán)隊(duì)提供有…

投稿用戶
科研百科 2025年2月6日
90
c#開發(fā)安卓優(yōu)缺點(diǎn)

C#是一種通用的、面向?qū)ο蟮木幊陶Z言，由微軟公司開發(fā)。C#是一種強(qiáng)類型、面向?qū)ο蟮木幊陶Z言，具有簡單易學(xué)、高效穩(wěn)定等特點(diǎn)，因此被廣泛應(yīng)用于游戲開發(fā)、Web開發(fā)、桌面應(yīng)用開發(fā)等領(lǐng)域。…

投稿用戶
科研百科 2024年10月13日
70
堅(jiān)持“五化協(xié)同”推進(jìn)機(jī)關(guān)黨建高質(zhì)量發(fā)展（機(jī)關(guān)黨建五化建設(shè)）

治國安邦，重在基礎(chǔ)；管黨治黨，重在基層。機(jī)關(guān)黨的建設(shè)是機(jī)關(guān)建設(shè)的根本保證，是新時(shí)代黨的建設(shè)的重要組成部分。機(jī)關(guān)黨組織要堅(jiān)持黨要管黨、全面從嚴(yán)治黨，以“五化協(xié)同”為抓手，創(chuàng)新工作方法…

投稿用戶
科研百科 2023年9月23日
2540
獲美團(tuán)、小紅書、滴滴等offer！陜西學(xué)霸開發(fā)多個(gè)軟件，簽約大疆

名字里有“長安”，求學(xué)地也在長安，這是屬于陜西科技大學(xué)本科生周長安的“奇妙緣分”。在這片鐘靈毓秀的沃土之上，他斬獲了國家級(jí)榮譽(yù)9項(xiàng)、省級(jí)獎(jiǎng)勵(lì)5項(xiàng)以及校獎(jiǎng)10余項(xiàng)，并且接連斬獲美團(tuán)、…

投稿用戶
科研百科 2024年5月2日
450
實(shí)驗(yàn)室管理系統(tǒng)項(xiàng)目報(bào)告

實(shí)驗(yàn)室管理系統(tǒng)項(xiàng)目報(bào)告實(shí)驗(yàn)室是科學(xué)研究和技術(shù)開發(fā)的重要場(chǎng)所，也是保證實(shí)驗(yàn)安全和數(shù)據(jù)質(zhì)量的關(guān)鍵。隨著實(shí)驗(yàn)室規(guī)模的擴(kuò)大和實(shí)驗(yàn)工作的日益復(fù)雜，傳統(tǒng)的實(shí)驗(yàn)室管理方法已經(jīng)無法滿足現(xiàn)代實(shí)驗(yàn)室…

投稿用戶
科研百科 2025年1月17日
40
不要任何軟件，只需一條命令，就可以找到windows10產(chǎn)品密鑰

如果你打算重新安裝Windows，那么就需要激活密鑰來再次激活它，在本文中，將向你展示如何使用cmd或powershell命令查找Windows產(chǎn)品密鑰的方法。一般情況下，我們可…

投稿用戶
科研百科 2024年5月6日
620
合同管理流程和辦法2323703284

合同管理流程和辦法隨著市場(chǎng)經(jīng)濟(jì)的發(fā)展和企業(yè)競(jìng)爭(zhēng)的加劇，合同管理已經(jīng)成為企業(yè)管理中不可或缺的一部分。合同管理不僅可以保證合同的有效性和合法性，還可以幫助企業(yè)避免合同陷阱和風(fēng)險(xiǎn)，提高…

投稿用戶
科研百科 2025年1月7日
20

成年入口无限观看免费完整大片| 2021国产微拍精品1区2区| 特黄特色三级在线看国产| 麻豆艾秋无码播放| 欧美淫秽视频一区二区o| 天堂网av毛片| 亚洲在人线播放午夜免费| 微拍福利视频一区| 精品第12页国产| 国产一区二区三精品久久久无广告 | 亚洲老熟女欧洲| 日本一本免费一二三区图片| 2021亚洲综合在线| 日韩一级大片欧美| 亚洲国产AV无码久久| AA级免费黄片| 色五月宝贝开心网| 天天干天天拍天天操| 一进一出好爽| 大肉大捧一进一出免费三分钟| 五月天婷婷狠操综合网| 一级a一做a爱片免费视频| 成人爆乳视频在线免费观看| 国产福利片在线| 91娇喘视频| 亚洲一区二区三区97| 美女av不卡网| 欧美熟妇高潮熟妇| 久久嫩草| 成人网99| 欧美成人做亚洲| 国产老熟女导航| 夜夜嗨刺激精品| 国产一区二区免费视频| 免费人成视频黄片| 长岭县| 天天操伊人网| 亚洲伦乱视频| 鸥美黄片一区二区三区| 亚洲a∨日韩a∨永久无码久久 | 黄片欧美日韩大片|

<li id="qyjpw"><big id="qyjpw"><tbody id="qyjpw"></tbody></big></li>

<span id="qyjpw"><small id="qyjpw"><rt id="qyjpw"></rt></small></span>

<span id="qyjpw"><small id="qyjpw"></small></span><li id="qyjpw"><dl id="qyjpw"></dl></li>

<label id="qyjpw"><dl id="qyjpw"></dl></label>

<label id="qyjpw"><samp id="qyjpw"></samp></label>

<rt id="qyjpw"></rt>