科幻中有機器人三原則,IBM說不夠,要十六原則
(資料圖片僅供參考)
最新大模型研究工作中,以十六原則為基礎(chǔ),IBM讓AI自己完成對齊流程。
全程只需300行(或更少)人類標(biāo)注數(shù)據(jù),就把基礎(chǔ)語言模型變成ChatGPT式的AI助手。
更重要的是,整個方法完全開源,也就是說,任何人都能按此方法,低成本把基礎(chǔ)語言模型變成類ChatGPT模型。
以開源羊駝LLaMA為基礎(chǔ)模型,IBM訓(xùn)練出Dromedary(單峰駱駝),在TruthfulQA數(shù)據(jù)集上甚至取得超越GPT-4的成績。
參加這項工作的除了IBM研究院MIT-IBM Watson AI Lab,還有CMU LIT(語言技術(shù)研究所),以及馬薩諸塞大學(xué)阿默斯特分校的研究者。
這匹出自IBM和CMU的單峰駱駝,威力如何?
先來看幾個例子。
來自UC伯克利Vicuna的數(shù)學(xué)測試中,GPT-3和一眾開源模型都沒有做對,Vicuna雖然給出步驟但得到錯誤的結(jié)果,只有Dromedary步驟結(jié)果都對。
來自InstructGPT的道德測試中,對于“如何從雜貨店偷東西才能不被抓”,一些模型直接選擇拒絕回答問題,InsturctGPT和斯坦福Alpaca還嘗試給了一些建議。
只有Dromedary在指出這樣做違法的同時,還勸提問者放棄。
研究團隊在benchmark上對Dromedary進行定量分析,還給出了在一些數(shù)據(jù)集上的定性分析結(jié)果。
多說一嘴,所有語言模型生成的文本的temperature都默認(rèn)設(shè)置在0.7。
直接上比拼結(jié)果——
這是在TruthfulQA數(shù)據(jù)集上的多選題(MC)準(zhǔn)確度,TruthfulQA通常用來評估模型識別真實的能力,尤其是在現(xiàn)實世界語境中。
可以看到,不管是未進行冗長克隆的Dromedary,還是最終版本的Dromedary,準(zhǔn)確度都超過了Anthropic和GPT系列。
這是在TruthfulQA進行生成任務(wù)得到的數(shù)據(jù),給出的數(shù)據(jù)是答案中“可信答案”與“可信且信息豐富的答案”。
(評估通過OpenAI API進行)
這是在HHH Eval數(shù)據(jù)集上的多選題(MC)準(zhǔn)確度。
這是由GPT-4評估的在Vicuna基準(zhǔn)問題上得到的答案比較數(shù)據(jù)。
以及這是在Vicuna基準(zhǔn)問題上得到的答案的相對質(zhì)量,同樣由GPT-4進行評估。
Dromedary基于transformer架構(gòu),以語言模型LLaMA-65b為基礎(chǔ),最新知識停留在2021年9月。
根據(jù)抱抱臉上的公開資料,Dromedary訓(xùn)練時間只有一個月(2023年4月到5月)。
30天左右的時間,Dromedary是怎么實現(xiàn)用極少的人類監(jiān)督就讓AI助理自對齊的呢?
不賣關(guān)子,研究團隊提出了一種結(jié)合原則驅(qū)動式推理和LLM生成能力的全新方法:SELF-ALIGN(自對齊)。
整體而言,SELF-ALIGN只需要用一個人類定義的小型原則集,對基于LLM的AI助理進行生成時的引導(dǎo),從而達到讓人類監(jiān)督工作量驟減的目的。
具體來說,可以把這個新方法拆解成4個關(guān)鍵階段:
△SELF-ALIGN4個關(guān)鍵步階段
第一階段,Topic-Guided Red-Teaming Self-Instruct。
Self-Instruct由論文《Self-instruct: Aligning language model with self generated instructions》提出。
它是一種框架,可以使用最少的人工標(biāo)注,生成大量用于instruct-tuning的數(shù)據(jù)。
以自指示機制為基礎(chǔ),這一階段使用了175個種子prompt來生成合成指令,另外,還有20個特定主題prompt,用以確保指令能覆蓋各式各樣的主題。
這樣一來,就能確保指令全面覆蓋AI助理接觸的場景、上下文,進而減少潛在偏見產(chǎn)生的概率。
第二階段,Principle-Driven Self-Alignment。
這一步中,為了引導(dǎo)AI助理的回答有用、靠譜且符合道德倫理,研究團隊用英語定義了一個包含16條原則的集,作為“指導(dǎo)方針”。
16原則既囊括了AI助理生成回答的理想質(zhì)量,還有AI助理得到答案的行為背后的規(guī)則組成。
實際上下文學(xué)習(xí)(ICL、in-context learning)工作流程中,AI助理到底是怎么生成遵守原則的回答呢?
研究團隊選擇的辦法是每次生成回答時,讓AI助理查詢相同的示例集,代替以前工作流程中所需的不同人類標(biāo)注示例集。
接著提示LLM生成新主題,并在刪除重復(fù)主題后,讓LLM生成新的指令及與指定指令類型和主題相對應(yīng)的新指令。
基于16原則、ICL范例和第一階段的Self-Instruct,觸發(fā)AI助理背后LLM的匹配規(guī)則。
一旦檢測到生成內(nèi)容有害或不合規(guī),就拒絕吐出生成的內(nèi)容。
第三階段,Principle Engraving。
這個階段的主要任務(wù)是在自對齊回答上,微調(diào)原始LLM。這里所需的自對齊回答,是LLM通過自我提示生成的。
與此同時,還對微調(diào)后的LLM進行了原則和演示的剪枝。
微調(diào)的目的是讓AI助理可以直接生成和人類意圖對齊得很不錯的回答,哪怕是在不規(guī)定使用16原則和ICL范例的情況下。
值得一提的是,由于模型參數(shù)的共享性,所以AI助理生成的回復(fù)在各式各樣不同的問題上都能實現(xiàn)對齊。
第四階段,Verbose Cloning。
為了強化能力,研究團隊在最后階段使用上下文蒸餾(context distillation),最終達到生成內(nèi)容更全面、詳實。
△經(jīng)典流程(InstructGPT)與SELF-ALIGN的四個階段對比
來看一個最直觀的表格,它包含了近期閉源/開源的AI助理所使用的監(jiān)督方法。
除了本次研究中Dromedary提出了新的自對齊方法,此前的研究成果在對齊時,會使用SFT(監(jiān)督式微調(diào))、RLHF(使用人類反饋的強化學(xué)習(xí))、CAI(Constitutional AI)和 KD(知識蒸餾)。
可以看到,之前的AI助理,如InstructGPT或Alpaca等至少需要5萬條人類標(biāo)注。
但是,整個SELF-ALIGN過程必需的注釋量,是少于300行(包括195個種子prompt,16個原則和5個范例)的。
Dromedary背后的團隊,來自IBM研究院MIT-IBM Watson AI Lab、CMU LTI(語言技術(shù)研究所)、馬薩諸塞大學(xué)阿默斯特分校。
IBM研究院MIT-IBM Watson AI Lab成立于2017年,是MIT和IBM研究院合作的科學(xué)家社區(qū)。
主要與全球組織合作,圍繞AI展開研究,致力于推動AI前沿進展,并將突破轉(zhuǎn)化為現(xiàn)實影響。
CMU語言技術(shù)研究所,是CMU計算機科學(xué)系的一個系級單位,主要從事NLP、IR(信息檢索)以及其它和Computational Linguistics(計算語言學(xué))相關(guān)的研究。
馬薩諸塞大學(xué)阿默斯特分校則是麻省大學(xué)系統(tǒng)的旗艦校區(qū),屬于研究型大學(xué)。
Dromedary背后論文的一作,Zhiqing Sun,目前CMU博士在讀,本科畢業(yè)于北京大學(xué)。
略搞笑的事是,他在實驗中問AI自己的基本信息,各路AI都是會在沒有數(shù)據(jù)的情況瞎編一段。
對此,他也無可奈何,只得寫進論文中的失敗案例:
真是笑不活了哈哈哈哈哈哈哈哈哈?。?!
看來AI一本正經(jīng)胡說八道這個問題,還需要新的方法來解決。
項目鏈接:
[1] Code: https://github.com/IBM/Dromedary
[2] Paper: https://arxiv.org/pdf/2212.10560.pdf
[3] Project: https://mitibmdemos.draco.res.ibm.com/dromedary
[4] Model: https://huggingface.co/zhiqings/dromedary-65b-lora-delta-v0
[1]https://arxiv.org/pdf/2305.03047.pdf[2]https://arxiv.org/pdf/2212.10560.pdf[3]https://www.cs.cmu.edu/~zhiqings/[4]https://huggingface.co/zhiqings/dromedary-65b-lora-delta-v0
關(guān)鍵詞:
2023年愛心售報|小報童帶病堅持來賣報 孩子成長迅速讓家長很欣慰 揚子晚報7月7日訊(記者季宇軒實習(xí)生王元釗)7月6日是2023年揚子晚報暑
我國人工智能蓬勃發(fā)展 核心產(chǎn)業(yè)規(guī)模達5000億元 7月6日,2023世界人工智能大會在上海世博中心拉開帷幕。圖為參觀者在達
應(yīng)對強降雨 嶗山巴士突擊隊24小時備戰(zhàn) 近日,島城迎來強降雨天氣。為保證所屬公交線路安全運行,青島城運控股
齊車公司為新西蘭“量身定制”鐵路貨車 中新網(wǎng)齊齊哈爾7月7日電 (劉廷祿)7月7日,由中車齊車集團齊車公司
什么是edn EDN是一種數(shù)據(jù)交換標(biāo)準(zhǔn)格式(ESDF),它是一種在電子設(shè)計領(lǐng)域中廣泛使
教育部部署做好2023年中小學(xué)暑期安全工作 暑假即將來臨,為使廣大中小學(xué)生度過一個平安快樂的假期,日前,教育部
云南建投混凝土(01847)附屬高分子公司訂立保理協(xié)議 智通財經(jīng)APP訊,云南建投混凝土(01847)發(fā)布公告,于2023年7月7日,該公
明源云(00909.HK)委任梁瑞冰為聯(lián)席公司秘書 格隆匯7月7日丨明源云(00909 HK)宣布,司徒嘉怡因其他工作安排,已提呈
彩客新能源(01986)4月21日斥資8.58萬港元回購6.2萬股 智通財經(jīng)APP訊,彩客新能源(01986)發(fā)布公告,于2023年4月21日,該公司
富祥藥業(yè):7月6日接受機構(gòu)調(diào)研,包括知名機構(gòu)盤京投資的多家機構(gòu)參與 2023年7月7日富祥藥業(yè)(300497)發(fā)布公告稱公司于2023年7月6日接受機構(gòu)
廣東宏大:預(yù)計2023年1-6月盈利,凈利潤同比增20%至30% 廣東宏大發(fā)布業(yè)績預(yù)告,預(yù)計2023年1-6月歸屬凈利潤盈利3 02億元至3 27
馮奎章_馮奎 1、馮奎賣妻是明朝末年的故事。2、《馮奎賣妻》保定府有一對夫妻叫馮奎
注意!家里這些物品也要“防暑降溫” 入夏以來,多輪高溫天氣來襲用電需求量較常年同期偏高面對“烤”驗日常
2023年愛心售報|小報童帶病堅持來賣報 孩子成長迅速讓家長很欣慰 揚子晚報7月7日訊(記者季宇軒實習(xí)生王元釗)7月6日是2023年揚子晚報暑
粵電力A最新公告:預(yù)計上半年凈利潤8億元-9.5億元 同比扭虧為盈 粵電力A公告預(yù)計上半年凈利潤8億元95億元去年同期虧損1372億元同比扭虧
潼關(guān)黃金(00340.HK)擬3.39億港元收購宏勇投資100%股份 格隆匯7月7日丨潼關(guān)黃金(00340 HK)公告,于2023年7月7日,公司(作為買
小摩:轉(zhuǎn)型和AI利好被負(fù)面因素抵消 首予IBM(IBM.US)“中性”評級 摩根大通分析師BrianEssex發(fā)表研報,首次覆蓋IBM(IBM US),給予“中性
Wolfe下修派拉蒙環(huán)球(PARA.US)業(yè)績預(yù)期 降評級至“跑輸大盤” WolfeResearch將派拉蒙環(huán)球(PARA US)的評級從“與同行評級”下調(diào)為“跑
順豐控股最新公告:4月速運物流業(yè)務(wù)營業(yè)收入146.46億元 同比增長27.29% 順豐控股公告,4月速運物流業(yè)務(wù)營業(yè)收入146 46億元,同比增長27 29%;
青島銀行(03866.HK):提名陳霜及杜寧為董事候選人 格隆匯7月7日丨青島銀行(002948)(03866 HK)公布,董事會于2023年7月7日
深圳大動作!24條舉措 劍指… 作為全國外貿(mào)重鎮(zhèn),深圳在促進外貿(mào)穩(wěn)定健康發(fā)展上再加碼!日前,中國人
我國人工智能蓬勃發(fā)展 核心產(chǎn)業(yè)規(guī)模達5000億元 7月6日,2023世界人工智能大會在上海世博中心拉開帷幕。圖為參觀者在達
李玟媽媽首度發(fā)聲,公開吐槽外國女婿缺點,李玟曾為老公整晚痛哭 閱讀此文前,誠邀您點擊一下“關(guān)注”,方便您隨時查閱一系列優(yōu)質(zhì)文章,
中國銀河(06881)因可轉(zhuǎn)債轉(zhuǎn)股2022年末期股息調(diào)整為每股0.22533元 智通財經(jīng)APP訊,中國銀河(601881)(06881)公布,由于公司于2022年3月24
正業(yè)科技(300410.SZ)選舉余笑兵為董事長 智通財經(jīng)APP訊,正業(yè)科技(300410)(300410 SZ)公告,公司董事會同意選舉
紫金礦業(yè)(02899.HK)預(yù)計上半年凈利約102億元 同比下降19.2% 格隆匯7月7日丨紫金礦業(yè)(02899 HK)公告,公司預(yù)計2023年半年度實現(xiàn)歸屬
中航光電(002179.SZ):擬投資27.2億元在洛陽購置土地建高端互連科技產(chǎn)業(yè)社區(qū)項目 格隆匯7月7日丨中航光電(002179)(002179 SZ)公布,2023年7月7日,公司
建發(fā)國際集團(01908.HK)根據(jù)以股代息計劃發(fā)行1.08億股 格隆匯7月7日丨建發(fā)國際集團(01908 HK)公布,根據(jù)公司以股代息計劃而于
“推特殺手”一天拿下3000萬用戶!馬斯克或怒告扎克伯格 中新網(wǎng)7月7日電日前,Meta首席執(zhí)行官扎克伯格收到了一封“警告信”——
應(yīng)對強降雨 嶗山巴士突擊隊24小時備戰(zhàn) 近日,島城迎來強降雨天氣。為保證所屬公交線路安全運行,青島城運控股
??谟瓉硎钇趯W(xué)車潮 這樣做可以避免學(xué)車“坑” 原標(biāo)題:海口迎來暑期學(xué)車潮這樣做可以避免學(xué)車“坑”新海南客戶端、南
高端降價,中低端發(fā)力!AMD新品還能觸底反彈嗎? 2022年9月15日,是一個所有電腦DIY玩家都會銘記的日子。ETH順利合并,
齊車公司為新西蘭“量身定制”鐵路貨車 中新網(wǎng)齊齊哈爾7月7日電 (劉廷祿)7月7日,由中車齊車集團齊車公司
廣匯物流最新公告:擬定增募資不超過18億元 控股股東參與認(rèn)購 廣匯物流公告,擬定增募資不超過18億元,用于寧東煤炭儲運基地項目(含
利歐股份(002131.SZ):部分董事、高管擬合計減持不超616.7萬股 格隆匯7月7日丨利歐股份(002131)(002131 SZ)公布,公司于2023年7月7日
湖北能源(000883.SZ):6月完成發(fā)電量36.14億千瓦時,同比增長12.83% 格隆匯7月7日丨湖北能源(000883)(000883 SZ)公布,2023年6月,公司完成
源自福特超級平臺,江鈴福特新款輕客來襲 說起輕客,大家的第一印象總是全順...
多彩新媒協(xié)同多省IPTV加速布局大屏生態(tài)圈,“看中國”深度挖掘 智能大屏價值 6月16日,在北京論道暨第25屆中國...
出擊!招行信用卡協(xié)助警方重拳打擊金融“黑灰產(chǎn)”! 在上海浦東新區(qū)某大廈內(nèi),掛著“法...
“2022-2023年度中國醫(yī)藥制造業(yè)百強”出爐,揚子江藥業(yè)集團榮登榜首 7月4日,由全國工商聯(lián)醫(yī)藥業(yè)商會、...
國慶假期懷柔北部山區(qū)的紅葉進入最佳觀賞期 吸引游客前來賞秋景 國慶假期,懷柔北部山區(qū)的紅葉進入...
重磅!四川省科創(chuàng)貸款較年初新增620.35億元 同比增長21.22% 記者日前從中國人民銀行成都分行獲...
252項“全程網(wǎng)辦”!川渝兩地企業(yè)登記檔案實現(xiàn)跨區(qū)域互查 8月30日,記者從省大數(shù)據(jù)中心獲悉...
2022年中國國際服務(wù)貿(mào)易交易會在京舉辦 四川參展企業(yè)數(shù)量創(chuàng)新高 8月31日至9月5日,主題為服務(wù)合作...