中文字幕亚洲欧美日韩在线不卡,亚洲欧美日产综合在线网性色,思思久久精品6一本打道,综合视频中文字幕

<sub id="dxmnt"><ol id="dxmnt"></ol></sub>

<pre id="atabz"></pre>

<td id="atabz"></td>

網(wǎng)站首頁

收藏本站

首頁 > 熱點資訊

谷歌AI看不懂網(wǎng)友評論，會錯意高達30%，網(wǎng)友：你不懂我的梗

更新時間：2022-07-18 16:20:55作者：未知

谷歌AI看不懂網(wǎng)友評論，會錯意高達30%，網(wǎng)友：你不懂我的梗

Pine 發(fā)自凹非寺
量子位 | 公眾號 QbitAI

給你兩句話，來品一下它們所蘊含的情感：

“我真的會謝。”

“聽我說謝謝你，因為有你，溫暖了四季······”

或許你會說，這很簡單啊，不就是最近經(jīng)常被玩的梗嗎？

但如果問問長輩，他們可能就是一副“地鐵老人看手機”的模樣了。

不過與流行文化之間有代溝這事，可不僅限于長輩們，還有AI。

這不，一位博主最近就po出了一篇分析谷歌數(shù)據(jù)集的文章，發(fā)現(xiàn)它對Reddit評論的情緒判別中，錯誤率竟高達30%。

就比如這個例子：

谷歌數(shù)據(jù)集把它判斷為“生氣”。

還有下面這條評論：

谷歌數(shù)據(jù)集將其判別為“困惑”。

網(wǎng)友直呼：你不懂我的梗。

人工智能秒變?nèi)斯ぶ钦?，這么離譜的錯誤它是怎么犯的？

斷章取義它最“拿手”

這就得從他判別的方式入手了。

谷歌數(shù)據(jù)集在給評論貼標簽時，是把文字單拎出來判斷的。

我們可以看看下面這張圖，谷歌數(shù)據(jù)集都把文字中的情緒錯誤地判斷為憤怒。

不如我們由此來推測一下谷歌數(shù)據(jù)集判別錯誤的原因，就拿上面的例子來說，這四條評論中均有一些“臟話”。

谷歌數(shù)據(jù)集把這些“臟話”拿來作為判斷的依據(jù)，但如果仔細讀完整個評論，就會發(fā)現(xiàn)這個所謂的“依據(jù)”只是用來增強整個句子的語氣，并沒有實際的意義。

網(wǎng)友們的發(fā)表的評論往往都不是孤立存在的，它所跟的帖子、發(fā)布的平臺等因素都可能導致整個語義發(fā)生變化。

比如單看這條評論：

單單依靠這個很難判斷其中的情緒元素。但如果知道他是來自一個肌肉網(wǎng)站的評論，或許就不難猜出了，（他只是想稱贊一下這個人的肌肉）。

忽略評論的帖子本身，或者將其中某個情感色彩強烈的詞語單拎出來判斷其情緒元素都是不合理的。

一個句子并不是孤立存在的，它有其特定的語境，其含義也會隨著語境的變化而變化。

將評論放入完整的語境中去判斷其情緒色彩，或許會大大提升判別的準確率。

但造成30%這么高的失誤率可不僅僅只是“斷章取義”，其中還有更深層次的原因。

“我們的梗AI不懂”

除了語境會干擾數(shù)據(jù)集判別之外，文化背景也是一個非常重要的因素。

大到國家地區(qū)，小到網(wǎng)站社群都會有其內(nèi)部專屬的文化符號，這種文化符號圈層之外的人很難解讀，這就造成了一個棘手的問題：

若想更準確地判斷某一社區(qū)評論的情緒，就得針對性地對其社區(qū)進行一些數(shù)據(jù)訓練，深入了解整個社區(qū)的文化基因。

在Reddit網(wǎng)站上，網(wǎng)友評論指出“所有的評分者都是以英語為母語的印度人”。

這就導致會對一些很常見的習語、語氣詞及一些特定的“?！痹斐烧`解。

說了這么多，數(shù)據(jù)集判別失誤率這么高的原因也就顯而易見了。

但與此同時，提高AI判別情緒的精確度也有了清晰的方向。

例如博主也在這篇文章中就給出了幾條建議：

首先，在對評論貼標簽時，得對他所處的文化背景有深刻地理解。以Reddit為例，要判斷其評論的情緒色彩，要對美國的一些文化、政治理解透徹，并且還要能夠迅速get到專屬網(wǎng)站的“?！保?/p>

其次，要測試標簽對一些諷刺、習語、梗的判別是否正確，確保模型能夠整整理解文本的意思；

最后，核查模型判斷與我們真實判別，以做出反饋，更好地訓練模型。

One More Thing

AI大牛吳恩達曾發(fā)起過一項以數(shù)據(jù)為中心的人工智能運動。

將人工智能從業(yè)者的重點從模型/算法開發(fā)轉移到他們用于訓練模型的數(shù)據(jù)質量上。吳恩達曾說：

用于訓練數(shù)據(jù)的好壞對于一個模型也至關重要，在新興的以數(shù)據(jù)為中心的 AI 方法中，數(shù)據(jù)的一致性至關重要。為了獲得正確的結果，需要固定模型或代碼并迭代地提高數(shù)據(jù)質量。

最后，你覺得在提高語言AI判別情緒這件事上，還有什么方法呢？

歡迎在留言區(qū)討論~

參考鏈接：
[1]https://www.reddit.com/r/MachineLearning/comments/vye69k/30_of_googles_reddit_emotions_dataset_is/
[2]https://www.surgehq.ai/blog/30-percent-of-googles-reddit-emotions-dataset-is-mislabeled
[3]https://mitsloan.mit.edu/ideas-made-to-matter/why-its-time-data-centric-artificial-intelligence

本文標簽：谷歌你不懂吳恩達 ai 語境

上一篇：兩位諾獎得主給“太上老君托夢”的天價白酒當首席科學家

下一篇：華為鴻蒙HarmonyOS 3官宣：7月27日見

相關文章

為您推薦

2023成都春季開學要考試嗎

2023年春季開學后，各學?？山Y合實際對學生學習情況進行診斷分析，具體以學校要求為準。

2023-01-31 12:49

成都積分入學可以不是本人辦理嗎

成都積分入學是成都隨遷子女入學申請的方式之一，關于積分入學申請條件和要求，小編為您整理如下：

2023-01-31 12:49

2023成都積分入學什么時候開始申請

成都隨遷子女入學申請須于子女入學當年2月1日至4月30日申報積分并辦結，詳見下文：

2023-01-31 12:49

注意！2023年退役軍人高考加分政策新發(fā)布

2023年退役軍人高考加分政策發(fā)布

2023-01-31 12:30

廣東人有多愛“刮刮樂”？

廣東人有多愛“刮刮樂”？,刮刮樂,彩票,即開型,體彩,彩民

2023-01-31 12:12

建議不因錢選工作專家實控多家公司專家稱年輕時不應為錢去選擇工作

建議不因錢選工作專家實控多家公司專家稱年輕時不應為錢去選擇工作,姚寧,海寧,控制權

2023-01-31 12:12

熱門文章

馬來西亞總理發(fā)話了：高盛必須盡快與政府了結1MDB丑聞

熱門推薦

2023成都積分入學什么時候開始申請

2023-01-31

科大訊飛劉慶峰：2022年穩(wěn)住了，將開啟利潤年增30%新時代

2023-01-31

究竟是什么神仙存單，竟能位列昔日人情往來Top1

2023-01-31

場內(nèi)ETF資金動態(tài)：節(jié)后車市有望恢復常態(tài)化節(jié)奏，汽車ETF上漲

2023-01-31

規(guī)劃53萬㎡+2棟幼兒園，華富北棚改發(fā)征收提示｜深圳樓市早7條

2023-01-31

最新文章

CopyRight 2022 http://www.yzzsnet.com All Rights Reserved. 智慧百科大全版權所有

聯(lián)系郵箱：[email protected]湘ICP備2023005268號-1

中文字幕亚洲欧美日韩在线不卡,亚洲欧美日产综合在线网性色,思思久久精品6一本打道,综合视频中文字幕

<sub id="dxmnt"><ol id="dxmnt"></ol></sub>

韩国色三级伦在线观看亚洲国产日韩在线亚洲人成色7777在线观看不卡国产免费人成精品

<pre id="hvtsn"></pre>

<address id="hvtsn"></address>