三级久久三级久久_精品一区二区三区在线观看视频_黄色在线观看网站_日韩中文视频_成人观看网址_精品日韩免费_九九**精品视频免费播放_久久久久成人黄色影片

當前位置    :     網站首頁    /     專題 > 詳情頁

悟道·天鷹 Aquila + 天秤 FlagEval,打造大模型能力與評測標準雙標桿

2023-06-27 18:05:10來源:砍柴網

為推動大模型在產業落地和技術創新,智源研究院發布“開源商用許可語言大模型系列+開放評測平臺” 2 大重磅成果,打造“大模型進化流水線”,持續迭代、持續開源開放。

悟道·天鷹(Aquila)開源商用許可語言大模型系列


(相關資料圖)

悟道·天鷹(Aquila) 語言大模型是首個具備中英雙語知識、支持商用許可協議、國內數據合規需求的開源語言大模型。

悟道·天鷹(Aquila)語言大模型在中英文高質量語料基礎上從 0 開始訓練,通過數據質量的控制、多種訓練的優化方法,實現在更小的數據集、更短的訓練時間,獲得比其它開源模型更優的性能。系列模型包括 Aquila基礎模型(7B、33B),AquilaChat對話模型(7B、33B)以及 AquilaCode-7B “文本-代碼”生成模型,后續將持續更新迭代并開源更新版本。

Aquila基礎模型(7B、33B)在技術上繼承了 GPT-3、LLaMA 等的架構設計優點,替換了一批更高效的底層算子實現、重新設計實現了中英雙語的 tokenizer,升級了 BMTrain 并行訓練方法,實現了比 Magtron+DeepSpeed ZeRO-2 將近8倍的訓練效率。

AquilaChat 對話模型(7B、33B)支持流暢的文本對話及多種語言類生成任務,通過定義可擴展的特殊指令規范,實現 AquilaChat對其它模型和工具的調用,且易于擴展。例如,調用智源開源的 AltDiffusion 多語言文圖生成模型,實現了流暢的文圖生成能力。配合智源 InstructFace 多步可控文生圖模型,輕松實現對人臉圖像的多步可控編輯。

AquilaChat 訓練過程中,實現了模型能力與指令微調數據的循環迭代,包括數據集的高效篩選與優化,充分挖掘基礎模型的潛力。

圖注:多輪對話

圖注:高考作文生成

AquilaChat 支持可擴展的特殊指令規范,令用戶可在AquilaChat中輕松實現多任務、工具的嵌入,如文圖生成,下圖示例為在對話中調用智源開源的多語言文圖生成模型 AltDiffusion。

圖注:文圖生成

AquilaChat 具備強大的指令分解能力,配合智源InstructFace多步可控文生圖模型,輕松實現對圖片的多步可控編輯。

圖注:多步可控人臉編輯

AquilaCode-7B “文本-代碼”生成模型,基于 Aquila-7B 強大的基礎模型能力,以小數據集、小參數量,實現高性能,是目前支持中英雙語的、性能最好的開源代碼模型,經過了高質量過濾、使用有合規開源許可的訓練代碼數據進行訓練。

此外,AquilaCode-7B 分別在英偉達和國產芯片上完成了代碼模型的訓練,并通過對多種架構的代碼+模型開源,推動芯片創新和百花齊放。

圖注:文本-代碼生成

天秤(FlagEval)大模型評測體系及開放平臺

天秤(FlagEval)大模型評測體系及開放平臺,旨在建立科學、公正、開放的評測基準、方法、工具集,協助研究人員全方位評估基礎模型及訓練算法的性能,同時探索利用AI方法實現對主觀評測的輔助,大幅提升評測的效率和客觀性。目前已推出語言大模型評測、多國語言文圖大模型評測及文圖生成評測等工具,并對各種語言基礎模型、跨模態基礎模型實現評測。后續將全面覆蓋基礎模型、預訓練算法、微調算法等三大評測對象,包括自然語言處理(NLP)、計算機視覺(CV)、語音(Audio)及多模態(Multimodal)等四大評測場景和豐富的下游任務。

首期推出的 FlagEval 大語言模型評測體系,創新構建了“能力-任務-指標”三維評測框架,細粒度刻畫基礎模型的認知能力邊界,可視化呈現評測結果,總計 600+ 評測維度,任務維度包括 22 個主觀&客觀評測數據集。除了知名的公開數據集 HellaSwag、MMLU、C-Eval等,FlagEval 還集成了包括智源自建的主觀評測數據集 Chinese Linguistics & Cognition Challenge (CLCC) ,北京大學與閩江學院共建的語義關系判斷、多義詞理解、修辭手法判斷評測數據集。更多維度的評測數據集也在陸續集成中。

FlagEval 評測榜單目前涵蓋了前面談到的22 個主觀和客觀評測集,84433 道題目,細粒度刻畫大模型的認知能力。基于“悟道 · 天鷹”Aquila 基礎模型(7B)打造的 AquilaChat 對話模型,在 FlagEval 大語言模型評測榜單上,目前暫時在“主觀+客觀”的評測上領先其他同參數量級別的開源對話模型。

在我們當前的最新評測結果中,AquilaChat 以大約相當于其他模型 50% 的訓練數據量(SFT 數據+預訓練數據分別統計)達到了最優性能。但由于當前的英文數據僅訓練了相當于Alpaca的40%,所以在英文的客觀評測上還暫時落后于基于 LLaMA 進行指令微調的Alpaca。隨著后續訓練的進行,我們相信很快可以超越。

悟道·天鷹(Aquila)模型還在迭代進步的過程中,天秤(FlagEval)評測能力也在不斷的擴充中, 因而此評測結果只是暫時的,新的評測結果還會不斷更新。此外,FlagEval的評測體系方法及相關研究還需要繼續深入,當前對模型能力的覆蓋程度仍有很大的進步空間,智源也期待與多方合作,共同打造全面、科學的評測方法體系。

圖注:在評測時,FlagEval 根據數據集的不同規模進行了自動化采樣,總計采樣 28041 條數據。

天秤(FlagEval)開放評測平臺現已開放申請(flageval.baai.ac.cn),打造自動化評測與自適應評測機制,可輔助模型研發團隊利用評測結果指導模型訓練,同時支持英偉達、昇騰(鵬城云腦)、寒武紀、昆侖芯等多種芯片架構及 PyTorch、MindSpore 等多種深度學習框架。

作為“科技創新2030”旗艦項目重要課題,天秤(FlagEval)正與北京大學、北京航空航天大學、北京師范大學、北京郵電大學、閩江學院、南開大學、中國電子技術標準化研究院、中國科學院自動化研究所等合作單位共建(按首字母排序),定期發布權威評測榜單。

總的來說,智源此次發布的 2 大重磅成果僅僅是一個新的起點:

一方面,悟道 · 天鷹 Aquila 語言大模型將不斷完善訓練數據、優化訓練方法、提升模型性能,在更優秀的基礎模型基座上,培育枝繁葉茂的“模型樹”,持續開源開放。

另一方面,天秤 FlagEval 大模型評測體系及開放平臺將繼續拓展“大模型認知能力”框架,集成豐富的數據集與評測指標,并探索與心理學、教育學、倫理學等社會學科的交叉研究,以期更加科學、全面地評價語言大模型。

「模型 + 評測」雙輪驅動,加速大模型技術創新與產業落地。歡迎學界、產業界同仁提供建議。

標簽:

電腦

硬件

數碼

索尼A7系列如何設置拍攝延時?佳能單反相機的拍攝技巧有哪些? 相機的光圈大小有什么區別?如何查看快門次數? 索尼相機怎么傳照片到手機上?佳能相機怎么連接手機? 佳能閃光燈怎么開?佳能相機定時拍攝怎么設置? 索尼微單怎么調光圈?索尼閃光燈怎么開啟?
產品

智勇大沖關廖慧_智勇大沖關廖慧敏是哪一期? 當前熱門

每日速遞:威赫電廠項目新進展 煙囪順利到頂

今亮點!和病魔斗爭9年的男孩考出632分 他想成為一名人民教師!

應急管理部開展燃氣安全專項整治 加強安全監管

特斯拉賽博卡車在運送到南半球試驗場的過程中再次被發現

亚洲黄色网址| 狠狠爱成人网| 天天操夜夜干| 亚洲色图35p| 免费在线观看一区二区三区| 秋霞av在线| av影片免费在线观看| 丝袜连裤袜欧美激情日韩| 成人精品免费看| 精品国产福利在线| 国产精品成人在线观看| 2022国产精品视频| 久久久久久免费| av在线不卡电影| 免费看黄色91| 一区二区三区久久| 日韩一区二区在线观看视频播放| 91精品欧美福利在线观看| 日韩一区在线免费观看| av电影在线观看不卡| 日韩成人dvd| 国内成人自拍视频| 性8sex亚洲区入口| 国产精品毛片在线看| 成人在线免费观看视频| 美女脱光内衣内裤视频久久网站 | 一区二区欧美在线观看| 精品少妇一区二区| 日韩伦理在线| 欧美亚洲网站| 欧美色精品天天在线观看视频| eeuss影院www在线观看| 久操国产精品| 欧美国产激情一区二区三区蜜月 | 91精品一区国产高清在线gif | 精品中文一区| 国产精品免费看片| 在线影院自拍| 西野翔中文久久精品字幕| 久久天堂av综合合色蜜桃网| 亚洲精品国产精品国自产在线| 日韩成人亚洲| 国内不卡的二区三区中文字幕| 日韩欧美在线影院| 免费成人直播| 精品一区二区三区在线观看 | 亚洲日本在线天堂| 国产黄色免费在线观看| 伊人久久大香线蕉综合四虎小说 | 亚洲伊人精品酒店| 成+人+亚洲+综合天堂| 亚洲免费小视频| 先锋影音国产精品| 亚洲黄色免费网站| av在线官网| 日韩精品色哟哟| 日韩成人在线网站| 欧美freesex8一10精品| 亚洲免费视频中文字幕| 日本三级视频在线播放| 国产精品久久久久久模特| 欧美精品精品一区| 狂野欧美性猛交xxxx| 99久久99久久精品免费看蜜桃| 国产精品三级a三级三级午夜| 美女扒开腿让男人桶爽久久动漫| 国产精品毛片久久久久久久| 中文字幕在线观看日本| 日韩电影在线免费看| 日韩成人av在线| 精品久久久久久久| 在线看不卡av| 亚洲精品黑牛一区二区三区| 中文字幕人成不卡一区| 日本资源在线| 波多野洁衣一区| 亚洲欧美视频一区二区| 日韩综合小视频| 国产aa视频| 午夜激情久久| 欧美精品色综合| 国产精品色呦| 欧美小视频在线| 午夜久久av| 亚洲午夜激情网页| 成人国产一区| 亚洲伊人色欲综合网| 婷婷激情一区| 亚洲精品一二三区| 欧美片第1页| 亚洲免费观看在线观看| а_天堂中文在线| 成人一道本在线| 欧美性天天影视| 波多野结衣91| 羞羞视频在线观看免费| 26uuu国产日韩综合| 超碰在线网址| 99国产欧美另类久久久精品 | 日日噜噜噜夜夜爽爽狠狠| 亚洲国产高清视频| **孕交吃奶水一级毛片| 在线电影一区二区| 亚洲精品在线观看视频| 欧美大片一区| 一二三四中文在线| 韩日欧美一区二区三区| 九一国产在线| 99视频超级精品| 成人免费网站观看| 亚洲欧美怡红院| 91大神在线观看线路一区| 亚洲免费电影在线| 国产精品66| 亚洲福利视频一区| 99久久香蕉| 日韩丝袜美女视频| 欧美视频二区| 中文字幕不卡免费视频| 国产福利91精品一区二区三区| av中文在线| 国产精品久久三| 奇米一区二区| 欧美一区二区三区免费观看视频| 99久久婷婷国产综合精品电影√| 亚洲二区中文字幕| 美女黄网久久| 91精品国产91久久久久久青草| 亚洲国产精品v| 亚洲一区二区三区日本久久九| 欧美高清精品3d| 欧美在线日韩| 在线碰免费视频在线观看| 国产精品456露脸| 中文不卡1区2区3区| 欧美色视频日本高清在线观看| 成人久久一区| 两个人看的免费完整在线观看| 成人国产视频在线观看| 日日夜夜天天综合| 欧美日韩高清一区二区不卡| 伊人久久婷婷| 嫩草在线视频| 精品久久久久久国产91| 久久一区二区三区电影| 男人av在线| 国产精品每日更新在线播放网址| 国产精品15p| 国产国产人免费人成免费视频 | 亚洲校园欧美国产另类| 东方aⅴ免费观看久久av| 国产精品无码久久久久| 欧美一级生活片| 久久99国产精品尤物| 国产网站在线| 日韩你懂的在线观看| 日本欧美一区二区三区| 欧美成人性网| 亚洲精品一区二区三区蜜桃下载| 免费观看在线色综合| 午夜av成人| 精品福利一区二区三区| 国产在线不卡视频| 亚洲精品一区av| 亚洲欧洲第一视频| 久久久久国产精品免费免费搜索| 国产精品久av福利在线观看| 黑料吃瓜在线观看| 日本一区二区三区在线不卡| 色小子综合网| 黄色成人在线观看| 91成人在线观看喷潮| 狠狠v欧美v日韩v亚洲ⅴ| 国产91在线播放精品| 国产福利电影网| 国产精品久久久久久亚洲毛片| 亚洲精品99| 国产蜜臀一区二区打屁股调教| 欧美日韩国产免费| 不卡av免费在线观看| 欧美日韩夜夜| 久久五月精品| 欧美电影一区二区| 成人福利电影精品一区二区在线观看| 国产美女撒尿一区二区| 日韩在线免费看| 精品视频123区在线观看| 奇米精品一区二区三区在线观看一| 91精品一区| 中文字幕网站视频在线| 欧美色播在线播放| 国产一区二区三区久久久| 9l亚洲国产成人精品一区二三 | 热久久久久久久| 99a精品视频在线观看| 亚洲kkk444kkk在线观看| 午夜精品久久久久久不卡8050| 黄网站免费久久| 精品一区二区三区在线 | 久久精品人人做人人综合|