久久av影视,中文字幕人成乱码在线观看,日韩不卡视频在线观看,日韩精品视频在线看

首頁 > 原創(chuàng)內(nèi)容 > 原創(chuàng)內(nèi)容 > 性能與成本雙贏:實測戴爾AI工作站支撐企業(yè)大模型的本地部署與訓(xùn)練

性能與成本雙贏:實測戴爾AI工作站支撐企業(yè)大模型的本地部署與訓(xùn)練

發(fā)布時間:2024-10-12 22:05:29來源: 13041198719
談到大模型私有化部署,很多人會首先想到數(shù)據(jù)中心,以為動輒就得使用很多臺服務(wù)來支撐。一些中小企業(yè)或者應(yīng)用部門,主要做知識庫和智能體方向的應(yīng)用,模型大小基本在70B以內(nèi)。只要搭配合理,用本地的專業(yè)工作站同樣可以訓(xùn)練推理,算得上極具性價比的方案了。
 
隨著OpenAI o1-preview的發(fā)布,大模型已經(jīng)越發(fā)成熟,距離走入企業(yè)生產(chǎn)應(yīng)用已經(jīng)很近了。但OpenAI提供訪問的次數(shù)非常有限,這給企業(yè)用戶的AI應(yīng)用普及帶來了一定的費用焦慮和困擾。為了應(yīng)對日益增長的訪問頻率需求,越來越多的企業(yè)用戶傾向于大模型的本地化部署。大模型本地部署可以極大地降低數(shù)據(jù)泄漏的風(fēng)險,而且系統(tǒng)響應(yīng)速度和實時性更強,在一些需要快速反饋的場景里優(yōu)勢非常明顯,同時也能應(yīng)對企業(yè)個性化需求。
 
通過在傳統(tǒng)數(shù)據(jù)中心上進(jìn)行本地大模型部署的方法,會對IT設(shè)施帶來比較大的挑戰(zhàn),因為從計算資源來說,很多企業(yè)的數(shù)據(jù)中心計算資源很緊張,而且擴展成本比較高,甚至有些中小企業(yè)還不具備搭建數(shù)據(jù)中心的能力。所幸的是,對于知識庫等企業(yè)級AI 應(yīng)用來說,完全可以用高配的AI工作站來應(yīng)對計算需求,以經(jīng)濟高效的方式減輕對數(shù)據(jù)中心計算資源的壓力,從而降低云服務(wù)的成本支出。
 
這次我們選用的是Dell Precision 7960 Tower,搭載了4張「NVIDIA RTX 5880 Ada 」顯卡,每張顯卡顯存48GB,相當(dāng)于在1臺工作站里就能最多有192GB顯存,完全可以部署Llama3.1 70B模型。
 
 
Dell Precision 7960 Tower
 
70B模型擁有700億參數(shù)量,在語言理解和生成方面具有顯著優(yōu)勢,已經(jīng)能夠滿足常見的企業(yè)級AI應(yīng)用,比如知識庫應(yīng)用、對話問答等,同時多任務(wù)處理能力也很強,可以支持企業(yè)在一個統(tǒng)一的平臺上運行多種AI 應(yīng)用。同時,開源大模型70B的開放和靈活使得它在市場上具有廣泛的適用性,大大降低企業(yè)的使用成本。而且量化后的70B模型僅占70G的顯存,非常適合部署在工作站上,降低計算資源方面的成本。
 
購置機器前我們做了相對完整的測試和驗證,包括推理、訓(xùn)練和噪音測試,下面給大家分享一些數(shù)據(jù)。
 
一、測試環(huán)境
硬件配置:
硬件平臺:Dell Precision 7960 Tower
 
CPU: Intel(R) Xeon(R) w5-3433
 
內(nèi)存:64G DDR5 * 8
 
GPU: NVIDIA RTX 5880 ada * 4
 
軟件平臺環(huán)境:
操作系統(tǒng):ubuntu22.04
 
Driver Version: 550.107.02
 
CUDA: 12.1
 
軟件包:conda python3.10 torch2.4 vllm0.6.1
 
測試模型:
這次我們分別測試了單GPU、雙GPU以及四卡GPU的表現(xiàn)情況。并在不同的模型下進(jìn)行測試,模型參數(shù)分別為8B/13B/32B/70B,具體模型名稱如下:
 
Meta-Llama-3.1-8B-Instruct
 
Baichuan2-13B-Chat
 
Qwen1.5-32B-Chat
 
Meta-Llama-3.1-70B-Instruct
 
說明:接下來的推理測試,會使用FP16或FP8格式進(jìn)行測試。在模型名稱的后綴,如果有FP8字樣,則使用的是FP8格式,否則使用的是FP16格式。
 
FP8是NVIDIA、Arm、Intel聯(lián)合推出的8位浮點數(shù)據(jù)格式,用于加速深度學(xué)習(xí)訓(xùn)練和推理。相對于常用的半精度FP16而言,F(xiàn)P8在不損失多少精度的情況下,將顯存的占用大小減少了一半,特別適合于將大模型部署于工作站上。FP8訓(xùn)練利用E5M2/E4M3格式,具備與FP16相當(dāng)?shù)膭討B(tài)范圍,適用于反向傳播與前向傳播。FP8訓(xùn)練在相同加速平臺上的峰值性能顯著超越FP16/BF16,并且模型參數(shù)越大,訓(xùn)練加速效果越好,且其與16-bits訓(xùn)練在收斂性和下游任務(wù)表現(xiàn)上無顯著差異。
 
推理框架:
vllm推理引擎來進(jìn)行測試,為最大程度利用GPU顯存,將其GPU utilization參數(shù)設(shè)置為0.99。
 
述語說明:
Batch size: 推理或訓(xùn)練時輸入的數(shù)據(jù)批量數(shù)量,為1表示單個輸入,例如一段文字,為2表明同時進(jìn)行兩段文字的生成,以此類推。它代表的是用戶并發(fā)數(shù)量。
 
token/s:推理或訓(xùn)練的速度,每秒生成的數(shù)量。一個token是代表一個單詞或詞根,如果是中文的話,可能是一個字或一個詞。
 
AI 應(yīng)用場景測試列表

 

原創(chuàng)內(nèi)容更多>>

全球汽車供應(yīng)鏈或面臨新一輪沖擊,這次原因是AI數(shù)據(jù)中心 廣汽埃安與滴滴自動駕駛聯(lián)手打造,Robotaxi R2正式交付 Rivian提交新專利:電動獨立開啟尾門玻璃及物理控制組件 2025年俄羅斯汽車市場多項指標(biāo)下滑:新車銷量、汽車信貸及皮卡銷量同比減少 加州累計零排放汽車銷量突破250萬輛 充電設(shè)施持續(xù)擴建 九識智能正式進(jìn)駐阿布扎比,RoboVan開啟常態(tài)化運營 日元貶值推動豐田加速印度本土化與出口,首款國產(chǎn)電動車即將上市 起亞在韓國下調(diào)多款電動車售價以應(yīng)對市場競爭 為何特斯拉、小米、理想、小鵬都力推“7年超低息”貸款? 6大趨勢詳解:誰說手機行業(yè)沒有新東西了? 從“死了么”到合川呆呆,2026年的第一場流量“圍獵” 2025年汽車產(chǎn)銷量再創(chuàng)歷史新高 連續(xù)17年穩(wěn)居全球第一 馬斯克:特斯拉將在2月14日后停售FSD,此后僅提供月度訂閱方式 “死了么”將更名Demumu,估值已達(dá)數(shù)千萬 1688發(fā)布“三保”搶跑計劃,王強:AI驅(qū)動產(chǎn)業(yè)帶商家呈現(xiàn)K型分化 榮耀500 Pro MOLLY 20周年款定于1月19日發(fā)布 趙長江:自己天天學(xué)習(xí)華為,最大的挑戰(zhàn)“在于我自身” “Arrow Lake Refresh” 雙旗艦:英特爾酷睿Ultra 9 290K/290HX Plus處理器現(xiàn)身 王自如回應(yīng)曾稱看董明珠很幸福:到今天都堅定這個觀點 歐洲汽車零部件行業(yè)持續(xù)“失血”,近兩年裁員逾10萬人 雙巨頭加碼AI!黃仁勛披露要與聯(lián)想集團聯(lián)合發(fā)布“革命性服務(wù)器”,未來2年合作規(guī)模再翻5倍 雷軍直播拆車后,小米汽車的“王牌”也真正打出來了! OpenAI首款硬件曝光,前蘋果傳奇設(shè)計師操刀 華碩計劃CES推出WiFi 8路由器,但相關(guān)標(biāo)準(zhǔn)還沒確定 三星發(fā)布全球首款130英寸Micro RGB電視!支持100% BT.2020色域 firefly螢火蟲右舵車量產(chǎn),首批將發(fā)運至新加坡市場 輕舟智航攜手奇瑞商用車,打造量產(chǎn)級L4無人物流車 王曉玲接任長安馬自達(dá)執(zhí)行副總裁,推動新能源戰(zhàn)略落地 美團騎手“不闖紅燈”安全激勵活動通知,騎手保持零闖燈記錄每天可獲現(xiàn)金獎勵 比亞迪元 UP DM-i(BYD ATTO 2 DM-i)歐洲發(fā)布會,并同步發(fā)布長續(xù)航純電版(BYD ATTO 2 Comfort)
久久av影视,中文字幕人成乱码在线观看,日韩不卡视频在线观看,日韩精品视频在线看
日韩一区二区三区高清在线观看| 国产精品麻豆成人av电影艾秋| 国产日韩专区| 私拍精品福利视频在线一区| 亚洲欧洲美洲国产香蕉| 日本黄色精品| 久久婷婷国产| 国产成人精品999在线观看| 国产伦精品一区二区三区千人斩| 日韩专区欧美专区| 丝袜亚洲精品中文字幕一区| 黄色在线观看www| 精品福利久久久| 日韩欧美午夜| 神马午夜久久| 精品一区二区三区在线观看视频| 久久av资源| 91精品高清| 久久中文欧美| 久久精品不卡| 午夜在线精品偷拍| 97久久亚洲| 国产精品亚洲欧美日韩一区在线 | 免费看欧美美女黄的网站| 视频一区二区欧美| 涩涩涩久久久成人精品| 久久永久免费| 日韩a一区二区| 久久国产精品久久久久久电车| 久久不射中文字幕| 给我免费播放日韩视频| 欧美日韩国产免费观看视频| 久久久久久婷| 亚洲欧美久久精品| 成人一二三区| 亚洲va久久| 国产精品永久| 成人台湾亚洲精品一区二区| 麻豆mv在线观看| 欧美有码在线| 欧美理论视频| 久久久精品日韩| 日本亚洲欧美天堂免费| 国产+成+人+亚洲欧洲在线| 视频一区日韩| 亚洲午夜黄色| 久久久久久久久久久妇女| 亚洲自啪免费| 99视频一区| 久久黄色影院| 国产免费播放一区二区| 国产视频一区二| 国产亚洲福利| 日韩不卡视频在线观看| 成人在线免费观看网站| 亚洲欧美在线专区| 久久国产精品毛片| 黄毛片在线观看| 国产欧美午夜| 91麻豆精品激情在线观看最新| 国产精品嫩草99av在线| 99热精品久久| 国产精品三级| 亚洲精品在线a| 亚洲精品国模| 日韩av不卡在线观看| 婷婷视频一区二区三区| 另类中文字幕国产精品| 国产999精品在线观看| 91中文字幕精品永久在线| 麻豆91小视频| 亚洲天堂一区二区| 精品网站aaa| 国产精品99久久免费观看| 精品免费av| 久久一区二区三区电影| 欧美日韩精品一本二本三本| 捆绑调教美女网站视频一区| 欧美日韩 国产精品| 麻豆高清免费国产一区| 国产专区一区| 99亚洲视频| 欧美激情亚洲| 日韩精品一区二区三区免费视频 | 日韩国产一区二| 日韩精品乱码av一区二区| 国产亚洲电影| 丁香婷婷久久| 美女精品在线| 久久爱www成人| 国产精品亚洲四区在线观看 | 在线视频亚洲| 亚洲欧美成人综合| 日韩av在线免费观看不卡| 欧美黄色精品| 亚洲一区久久| 久久xxx视频| 国产一区二区三区亚洲| 91精品99| 午夜久久中文| 日韩欧美久久| 999国产精品永久免费视频app| 亚洲2区在线| 国产精品99精品一区二区三区∴| 国产伊人久久| 日韩区欧美区| 欧美天堂亚洲电影院在线观看| 久久wwww| 视频一区二区三区入口| 成人在线黄色| 欧美一区二区三区久久| 亚洲无线一线二线三线区别av| 国产精品国码视频| 欧美综合社区国产| 国产一区国产二区国产三区| 亚洲综合另类| 午夜国产精品视频| 日韩av免费| caoporn视频在线| 亚洲伊人精品酒店| 国产suv精品一区| 精品久久久网| 精品视频免费| 国产福利资源一区| 欧美精品91| 亚洲综合另类| 久久亚洲成人| 久久天堂成人| 九一精品国产| 风间由美中文字幕在线看视频国产欧美| 日本91福利区| 99视频+国产日韩欧美| 蜜臀91精品国产高清在线观看| 五月天av在线| 国产精品2区| 国产日韩一区二区三区在线播放| 久久免费视频66| 91麻豆精品激情在线观看最新 | 久久青草久久| 亚洲激情欧美| 亚洲精品成人图区| 日韩毛片在线| 欧美在线亚洲| 免费在线观看视频一区| 亚洲精品第一| 精品视频一区二区三区四区五区 | 亚洲人成在线网站| 亚洲午夜黄色| 日韩欧美精品一区二区综合视频| 麻豆一区二区在线| 国产精品视频一区二区三区四蜜臂 | av亚洲在线观看| 国产婷婷精品| 日本v片在线高清不卡在线观看| 日韩一区电影| 国产伊人精品| 国产精品一级| 伊人久久婷婷| 国产美女视频一区二区| 精品国产免费人成网站| 国产精品入口久久| 国产精品视频3p| 欧美成人综合| 亚洲人www| 欧美国产美女| 久久激情婷婷| 一区二区三区四区在线观看国产日韩| 久久xxxx精品视频| 国产精品一级在线观看| 久久精品亚洲欧美日韩精品中文字幕| 国产亚洲毛片在线| 久久精品亚洲| 国产午夜久久av| 久久69成人| 免费人成在线不卡| 日韩欧美另类一区二区| 91精品尤物| 日韩精品一区二区三区中文字幕| 国产成人精品三级高清久久91| 成人片免费看| 亚洲免费毛片| 亚洲欧美日韩视频二区| 麻豆高清免费国产一区| 日韩欧美三区| 四虎国产精品免费久久| 精品成人免费一区二区在线播放| 亚洲91网站| 亚洲精品国产精品粉嫩| 欧美专区18| 欧美专区一区二区三区| 亚洲精品**中文毛片| 久久精品国产99国产| 香蕉成人久久| 亚洲欧洲日本mm| 亚洲精品中文字幕乱码| 日韩成人在线看| 日本免费一区二区视频| 久久国产精品免费精品3p| 伊人精品在线| 不卡一区2区|