欧美 国产 日本-欧美 国产 日韩 第一页-欧美 日产 国产精品-欧美 日韩 国产 在线-极品福利视频-极品成人

首頁 > 知識技能 > 知識技能 > 谷歌開源最強端側小模型:2B參數(shù)越級跑贏GPT-3.5-Turbo

谷歌開源最強端側小模型:2B參數(shù)越級跑贏GPT-3.5-Turbo

發(fā)布時間:2024-08-01 22:35:25

谷歌也來卷「小」模型了,一出手就是王炸,勝過了比自己參數(shù)多得多的GPT-3.5、Mixtral競品模型。

今年 6 月底,谷歌開源了 9B、27B 版 Gemma 2 模型系列,并且自亮相以來,27B 版本迅速成為了大模型競技場 LMSYS Chatbot Arena 中排名最高的開放模型之一,在真實對話任務中比其兩倍規(guī)模以上的模型表現(xiàn)還要好。

 

如今,僅僅過去了一個多月,谷歌在追求負責任 AI 的基礎上,更加地考慮該系列模型的安全性和可訪問性,并有了一系列新成果。

 

此次,Gemma 2 不僅有了更輕量級「Gemma 2 2B」版本,還構建一個安全內容分類器模型「ShieldGemma」和一個模型可解釋性工具「Gemma Scope」。具體如下:

  • Gemma 2 2B 具有內置安全改進功能,實現(xiàn)了性能與效率的強大平衡;
  • ShieldGemma 基于 Gemma 2 構建,用于過濾 AI 模型的輸入和輸出,確保用戶安全;
  • Gemma Scope 提供對模型內部工作原理的無與倫比的洞察力。

其中,Gemma 2 2B 無疑是「最耀眼的仔」,它在大模型競技場 LMSYS Chatbot Arena 中的結果令人眼前一亮:僅憑 20 億參數(shù)就跑出了 1130 分,這一數(shù)值要高于 GPT-3.5-Turbo(0613)和 Mixtral-8x7b。

這也意味著,Gemma 2 2B 將成為端側模型的最佳選擇。

 

 

蘋果機器學習研究(MLR)團隊研究科學家 Awni Hannun 展示了 Gemma 2 2B 跑在 iPhone 15 pro 上的情況,使用了 4bit 量化版本,結果顯示速度是相當快。

 

 

 
00:01 / 00:26
 
 

 

視頻來源:https://x.com/awnihannun/status/1818709510485389563

此外,對于前段時間很多大模型都翻了車的「9.9 和 9.11 誰大」的問題,Gemma 2 2B 也能輕松拿捏。

 

 

圖源:https://x.com/tuturetom/status/1818823253634564134

與此同時,從谷歌 Gemma 2 2B 的強大性能也可以看到一種趨勢,即「小」模型逐漸擁有了與更大尺寸模型匹敵的底氣和效能優(yōu)勢。

這種趨勢也引起了一些業(yè)內人士的關注,比如知名人工智能科學家、Lepton AI 創(chuàng)始人賈揚清提出了一種觀點:大語言模型(LLM)的模型大小是否正在走 CNN 的老路呢?

在 ImageNet 時代,我們看到參數(shù)大小快速增長,然后我們轉向了更小、更高效的模型。這是在 LLM 時代之前,我們中的許多人可能已經忘記了。

  • 大型模型的曙光:我們以 AlexNet(2012)作為基線開始,然后經歷了大約 3 年的模型大小增長。VGGNet(2014)在性能和尺寸方面都可稱為強大的模型。
  • 縮小模型:GoogLeNet(2015)將模型大小從 GB 級縮小到 MB 級,縮小了 100 倍,同時保持了良好的性能。類似工作如 SqueezeNet(2015)和其他工作也遵循類似的趨勢。
  • 合理的平衡:后來的工作如 ResNet(2015)、ResNeXT(2016)等,都保持了適中的模型大小。請注意,我們實際上很樂意使用更多的算力,但參數(shù)高效同樣重要。
  • 設備端學習?MobileNet(2017)是谷歌的一項特別有趣的工作,占用空間很小,但性能卻非常出色。上周,我的一個朋友告訴我「哇,我們仍然在使用 MobileNet,因為它在設備端具有出色的特征嵌入通用性」。是的,嵌入式嵌入是實實在在很好用。

最后,賈揚清發(fā)出靈魂一問,「LLM 會遵循同樣的趨勢嗎?」

知識技能更多>>

捐贈的19噸物資送達榕江,賬戶只剩5毛錢,“跪行巨人”胡雷先生 柬埔寨公主:來中國像回家,源于她與中國長達數(shù)十年的不解之緣 央視怒贊!河南“漂流哥”火了,扛6000份燴面支援,一頓兩千人吃 沒填的抓緊!一圖了解如何辦理個稅匯算 中國6月官方制造業(yè)PMI為49.7 世俱杯:拜仁4-2弗拉門戈晉級八強 當2名泰州球迷誤入徐州“敵營” 陳垣宇0比4張本智和 鄭欽文溫網(wǎng)首輪前瞻 長春亞泰1比2上海申花 郭富城給周杰倫當嘉賓 熱舞秀腹肌 哈登兩年8150萬續(xù)約快船 巴黎圣日耳曼4比0邁阿密國際 鄧超發(fā)文回應和鹿晗吃飯 汪小菲與馬筱梅日常互動很貼心 感受上海最新地標LV巨輪的人流量 小S女兒在畫展上談及大S 網(wǎng)傳男歌手師洋去世 母親辟謠 白玉蘭組委會疑似回應劉亦菲沒去 北大退學考上清華小伙回應開直播 馬龍去看林俊杰演唱會:嗓子又啞了 63歲兒子帶103歲養(yǎng)父周游全國 孟子義自曝曾因為太漂亮失去角色 三女兒齊唱歌曲送別父親黃旭華 外賣員遇“關門殺” 物業(yè)被判賠21萬 央視曝光舞蹈培訓市場亂象 誰說豐田只會造油車?首款純電越野12.98萬,軸距超2米8+高階智駕 吉利這些年買工廠學技術的那些事,其實挺有意思 油電都得玩明白!一汽-大眾如何從“合資老炮”變身“智能新貴” 騰訊混元-A13B上線,1張中低端GPU卡即可部署
主站蜘蛛池模板: 91精品视频在线观看免费 | 中文字幕在线播放视频 | 欧美综合网欧美色妞网 | a级片免费 | 亚洲一区有码 | 免费精品国产 | 青青精品视频 | 尤物免费视频 | 国产三级在线观看播放 | 九九在线视频 | 日本成年人视频网站 | 国产欧美日本在线 | 香蕉免费一区二区三区在线观看 | 免费高清在线爱做视频 | 欧美大片在线 | 精品视频一区二区三三区四区 | 国产成人啪精品视频免费网站软件 | 四虎影视884a精品国产古代 | 一菊综合网成人综合网 | a毛片网站| 免费看一区二区三区 | 播播成人网 | 免费看黄色大片 | 资源网址在线免费观看 | 成人高清视频免费观看 | 成人欧美一区二区三区在线观看 | 亚洲视频一二三 | 亚洲黄色高清视频 | 99久久99这里只有免费费精品 | 中文一区二区视频 | 成年美女黄网站色大片免费软件看 | 国产最新地址 | 精品国产欧美一区二区最新 | 性做久久久久久久久老女人 | 中文日韩 | 在线免费看黄视频 | 一边吃奶一边做边爱带音视频 | 亚洲免费成人网 | 麻豆合集 | 亚洲乱码卡一卡二卡三 | 四虎影视国产精品婷婷 |