中文字幕亚洲欧美日韩在线不卡,亚洲欧美日产综合在线网性色,思思久久精品6一本打道,综合视频中文字幕

    <sub id="dxmnt"><ol id="dxmnt"></ol></sub>

      1. ChatGPT修bug橫掃全場(chǎng),準(zhǔn)確率達(dá)78%!網(wǎng)友:程序員要開心了

        更新時(shí)間:2023-02-03 16:05:49作者:智慧百科

        ChatGPT修bug橫掃全場(chǎng),準(zhǔn)確率達(dá)78%!網(wǎng)友:程序員要開心了

        金磊 衡宇 發(fā)自 凹非寺
        量子位 | 公眾號(hào) QbitAI

        ChatGPT到底有多會(huì)修bug?

        這事終于有人正兒八經(jīng)地搞研究了——

        來自德國(guó)、英國(guó)的研究人員,專門搭了個(gè)“擂臺(tái)”來檢驗(yàn)ChatGPT的這項(xiàng)本領(lǐng)。



        除了ChatGPT之外,研究人員還找來了其它三位修bug的“AI猛將”,分別讓它們修復(fù)40個(gè)錯(cuò)誤代碼。

        結(jié)果真是不比不知道,一比嚇一跳。

        ChatGPT準(zhǔn)確修復(fù)了其中31個(gè)bug,遙遙領(lǐng)先第二名(21個(gè)),直接拿下“AI修bug界”的SOTA成績(jī)!



        于是乎,這項(xiàng)研究引來了眾多網(wǎng)友的圍觀和討論,Reddit上發(fā)布此帖的標(biāo)題更是用上了“小心”“注意”這樣的字眼:



        但事實(shí)上,這真的會(huì)讓程序員“?!眴??

        我們不妨先來看下這項(xiàng)研究。

        很會(huì)修bug的ChatGPT

        雖然ChatGPT并非是為了專門修改bug而生,但自打它問世以來,不少網(wǎng)友們都發(fā)現(xiàn)它是具備這項(xiàng)能力的。

        因此研究人員為了摸清ChatGPT到底能修改bug到什么程度,便引入了標(biāo)準(zhǔn)的錯(cuò)誤修復(fù)基準(zhǔn)集QuixBugs來進(jìn)行評(píng)估。

        以及與它同臺(tái)競(jìng)技的AI選手,分別是CodeX、CoCoNutStandard APR。

        研究人員從QuixBugs中挑了40個(gè)問題,分別讓它們來修復(fù)bug。

        讓ChatGPT來修bug的方法,就是在對(duì)話框里向它提問:

        這個(gè)代碼有什么錯(cuò)誤嗎?

        在第一輪較量過后,結(jié)果如下:



        從第一輪battle結(jié)果來看,ChatGPT修復(fù)了19個(gè),CodeX修復(fù)了21個(gè),CoCoNut修復(fù)了19個(gè),Standard APR則是7個(gè)。

        而且研究人員還發(fā)現(xiàn),ChatGPT的答案與CodeX最為相似;這是因?yàn)樗鼈z是來自同一個(gè)語(yǔ)言模型家族。

        這時(shí)候就會(huì)有小伙伴要問了,“ChatGPT不是還沒有CodeX厲害嗎”。

        別急,不要忘了,ChatGPT的一個(gè)特點(diǎn)就是越問越“上道”。

        例如在這個(gè)基準(zhǔn)集中,有一個(gè)叫bitcount的問題,ChatGPT在剛才第一輪修復(fù)過程中是給了錯(cuò)誤的答案:



        原本ChatGPT應(yīng)該將第7行的 n ^ = n - 1 改為 n & = n - 1。

        但在第一輪中它的回答是:

        如果沒有更多關(guān)于預(yù)期行為和導(dǎo)致問題的輸入信息,我無法判斷程序是否存在錯(cuò)誤。

        于是在給予它更多信息之后,ChatGPT便答對(duì)了這個(gè)問題。

        以此類推,在對(duì)第一輪沒答對(duì)的問題進(jìn)行更多信息提示之后,ChatGPT的修bug能力有了大幅提高:



        最終,ChatGPT在QuixBugs的40個(gè)問題里答對(duì)了31個(gè)。

        網(wǎng)友憂喜參半

        對(duì)于這樣的實(shí)驗(yàn)結(jié)果,網(wǎng)友們對(duì)ChatGPT修bug拿下SOTA這事產(chǎn)生的態(tài)度卻不太一樣。

        有網(wǎng)友認(rèn)為這事不應(yīng)該讓程序員感到危機(jī),而是會(huì)讓他們覺得開心才對(duì)。

        言外之意,便是程序員們有了這么好用的工具,干活兒就會(huì)變得事半功倍。



        不過也有人對(duì)此給出了不一樣的看法:

        工作變得簡(jiǎn)單,不也就意味著需要的人力更少了嗎?



        但還網(wǎng)友覺得,活兒是干不完的:

        即使AI能把開發(fā)時(shí)間縮短一個(gè)數(shù)量級(jí),也只是意味著程序員將更快處理下一個(gè)工作。



        整體來看,ChatGPT很會(huì)修bug,并不會(huì)給程序員帶來什么致命傷害。

        但若是把目光放到OpenAI其他的行動(dòng)中呢?

        全球招外包訓(xùn)練ChatGPT寫代碼

        在此之前,OpenAI就表示過ChatGPT的重要用途之一是幫助程序員檢查代碼。

        換言之,它被定位可用的輔助工具。

        相比“ChatGPT帶來威脅”的看法,等ChatGPT能力徹底進(jìn)化,程序員都不用再怕寫bug了。

        OpenAI布局的棋盤上,可不只有改bug偷塔程序員崗位這一件事。

        為了讓它更大更強(qiáng),OpenAI被曝在拉美和東歐等地區(qū),提供了1000個(gè)外包崗位。

        外包員工的主要工作是標(biāo)注數(shù)據(jù),以及訓(xùn)練ChatGPT寫代碼

        這1000人中,40%是程序員,他們?yōu)镺penAI的模型創(chuàng)建數(shù)據(jù),用來學(xué)習(xí)軟件工程任務(wù)。

        一直以來,OpenAI的訓(xùn)練數(shù)據(jù)是從GitHub上抓取的。

        現(xiàn)在外包程序員們新手搓的數(shù)據(jù)集,不僅包括代碼行,還包括代碼行背后的人類思考邏輯步驟。

        有位南美的軟件開發(fā)人員爆料,他為OpenAI完成了五小時(shí)的無償編碼測(cè)試。

        整個(gè)過程中,他的任務(wù)分為兩部分。

        如果發(fā)現(xiàn)bug,OpenAI會(huì)向他詳細(xì)詢問bug的具體情況,并請(qǐng)教如何修正。

        程序員需要展示思考問題的每個(gè)步驟,他據(jù)此猜測(cè)OpenAI很可能想為ChatGPT提供非常具體的訓(xùn)練數(shù)據(jù)。

        特斯拉前AI主管Andrej Karpathy在推特上調(diào)侃:

        最新的熱門編程語(yǔ)言是英語(yǔ)。



        不過話說回來,ChatGPT修bug能力強(qiáng)是好事,要真能搞進(jìn)化到可以完成代碼里死記硬背的部分,也是好事。

        畢竟OpenAI成立時(shí)對(duì)外宣稱的宗旨,就是希望“確保通用人工智能可以造福全人類”。

        雖然乍一看它這些年做的事,有點(diǎn)像在致力于用一部分人的努力,讓更多人失業(yè)。

        從Dota2賽場(chǎng)上碾壓人類,到GPT-3、DALL-E2、ChatGPT的閃耀表現(xiàn),它帶來的新產(chǎn)品總是伴隨著“快要讓xxx失業(yè)了”的議論聲。

        但無論如何,商業(yè)卻一直對(duì)它青睞有加。

        就目前而言,OpenAI的主要商業(yè)模式是API費(fèi)用、token費(fèi)用和軟件許可。

        OpenAI近期還發(fā)布了ChatGPT的付費(fèi)版ChatGPT Pro,每月費(fèi)用42美元(約合285元人民幣)。



        雖然機(jī)器人對(duì)話初創(chuàng)公司如雨后春筍般冒出,但諸多跡象表明市場(chǎng)對(duì)OpenAI的持續(xù)看好。

        微軟剛剛宣布將向OpenAI加碼投資數(shù)十億美元,并將OpenAI的模型融入微軟必應(yīng)等消費(fèi)級(jí)和企業(yè)級(jí)產(chǎn)品中。

        根據(jù)知情人士透露,此次追加投資數(shù)額約為100億美元。

        與此同時(shí),WSJ披露的消息顯示,1月初,億萬富翁Peter Thiel創(chuàng)立的風(fēng)投基金Founders Fund正在就投資OpenAI進(jìn)行談判。

        據(jù)悉,融資金額將至少達(dá)3億美元



        One More Thing

        在第一輪實(shí)驗(yàn)中,ChatGPT并沒有解決QuixBugs數(shù)據(jù)集的bitcount問題。

        但若是你現(xiàn)在再重頭問一次這個(gè)問題,就會(huì)發(fā)現(xiàn)ChatGPT可以“一遍過”:



        那么這是否意味著ChatGPT已經(jīng)從這次研究過程中學(xué)會(huì)求解了呢?

        [1] https://arxiv.org/abs/2301.08653
        [2] https://www.pcmag.com/news/watch-out-software-engineers-chatgpt-is-now-finding-fixing-bugs-in-code
        [3] https://www.reddit.com/r/technology/comments/10oaw6n/watch_out_software_engineers_chatgpt_is_now/
        [4] https://en.wi.bwl.uni-mainz.de/dominik-sobania/


        本文標(biāo)簽: 微軟  代碼  程序員  應(yīng)用程序  openai  chatgpt  

        為您推薦

        開學(xué)還要做核酸嗎?多地公布方案

        多地公布校園疫情防控方案

        2023-02-05 10:08

        795元每盒!004、010、015,這串?dāng)?shù)字有何關(guān)聯(lián)?國(guó)產(chǎn)抗新冠創(chuàng)新藥上市背后

        795元每盒!004、010、015,這串?dāng)?shù)字有何關(guān)聯(lián)?國(guó)產(chǎn)抗新冠創(chuàng)新藥上市背后,治療,抗病毒,創(chuàng)新藥,抗新冠,新藥研發(fā),新冠口服藥,2019冠狀病毒病

        2023-02-05 10:05

        基因編輯、3D生物打印將如何改變“移植器官荒”?

        基因編輯、3D生物打印將如何改變“移植器官荒”?,細(xì)胞,異種,貝內(nèi)特,器官移植,心臟移植,移植器官

        2023-02-05 10:05

        國(guó)產(chǎn)大飛機(jī)C919首次亮相四川達(dá)州金埡機(jī)場(chǎng)

        國(guó)產(chǎn)大飛機(jī)C919首次亮相四川達(dá)州金埡機(jī)場(chǎng),客機(jī),飛行,四川省,達(dá)州市,c919,金埡機(jī)場(chǎng),國(guó)產(chǎn)大飛機(jī),中國(guó)軍工企業(yè),中國(guó)商飛C919

        2023-02-05 10:05

        從財(cái)務(wù)規(guī)劃到股票交易 ChatGPT將從六個(gè)方面影響華爾街

        從財(cái)務(wù)規(guī)劃到股票交易 ChatGPT將從六個(gè)方面影響華爾街,華爾街,交易,盧茨,財(cái)務(wù),金融,chatgpt

        2023-02-05 10:05

        年薪超140萬元!千億光伏巨頭核心技術(shù)人員離職,董事長(zhǎng)身家高達(dá)73億美元

        年薪超140萬元!千億光伏巨頭核心技術(shù)人員離職,董事長(zhǎng)身家高達(dá)73億美元,離職,方斌,光伏,上市公司,天合光能,全資子公司,核心技術(shù)人員

        2023-02-05 10:05