DeepSeek-R1 Distill系列
基于DeepSeek-R1的推理能力,通過蒸餾技術(shù)將推理能力遷移到較小的模型上,在保持高效性能的同時(shí),成功降低了計(jì)算成本,實(shí)現(xiàn)了“小身材、大智慧”的完美平衡!該鏡像使用vLLM部署提供支持,適用于高性能大語言模型的推理和微調(diào)任務(wù),
第一步:登錄「優(yōu)云智算」算力共享平臺(tái)并進(jìn)入「鏡像社區(qū)」
地址:https://www.compshare.cn/?ytag=seo
第二步:選擇「vLLM-DeepSeek-R1-Distill」鏡像,點(diǎn)擊「使用該鏡像創(chuàng)建實(shí)例」
鏡像地址:https://www.compshare.cn/images-detail?ImageID=compshareImage-17ym815cbokz
根據(jù)鏡像說明中的引導(dǎo),選擇所用模型需要的GPU算力規(guī)格,并點(diǎn)擊「立即部署」即可擁有一個(gè)自帶模型的算力資源。
第三步:?jiǎn)?dòng)vLLM api 服務(wù),鏡像已配置好所需依賴環(huán)境,無需額外安裝,即可通過以下命令啟動(dòng)vLLM服務(wù):
單卡4090
# DeepSeek-R1-Distill-Qwen-1.5B
vllm serve /model/HuggingFace/deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B --port 8000
# DeepSeek-R1-Distill-Qwen-7B
vllm serve /model/HuggingFace/deepseek-ai/DeepSeek-R1-Distill-Qwen-7B --port8000 --max-model-len 65536
# DeepSeek-R1-Distill-Llama-8B
vllm serve /model/HuggingFace/deepseek-ai/DeepSeek-R1-Distill-Llama-8B --port8000 --max-model-len 17984
2卡4090
# DeepSeek-R1-Distill-Qwen-14B
vllm serve /model/HuggingFace/deepseek-ai/DeepSeek-R1-Distill-Qwen-14B --port8000-tp2 --max-model-len 59968
4卡4090
# DeepSeek-R1-Distill-Qwen-32B
vllm serve /model/HuggingFace/deepseek-ai/DeepSeek-R1-Distill-Qwen-32B --port 8000 -tp 4 --max-model-len 65168
8卡4090
# DeepSeek-R1-Distill-Llama-70B
vllm serve /model/HuggingFace/deepseek-ai/DeepSeek-R1-Distill-Llama-70B --port 8000
文章版權(quán)歸作者所有,未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請(qǐng)注明本文地址:http://systransis.cn/yun/131183.html
DeepSeek Janus-Pro開源模型DeepSeek團(tuán)隊(duì)于1月28日凌晨發(fā)布了開源多模態(tài)大語言模型Janus-Pro,這是一款基于DeepSeek-LLM-1.5b-base和DeepSeek-LLM-7b-base構(gòu)建的模型。第一步:登錄「優(yōu)云智算」算力共享平臺(tái)并進(jìn)入「鏡像社區(qū)」地址:https://www.compshare.cn/?ytag=seo 第二步:選擇「Janus-Pro-...
DeepSeek-R1-671b動(dòng)態(tài)量化版,由unsloth.ai發(fā)布,推薦使用多卡進(jìn)行部署,具體操作如下。本鏡像還附帶32b的無限制版蒸餾模型,使用open-webui和ollama以及l(fā)lama.cpp進(jìn)行部署,內(nèi)置所有環(huán)境,即拉即用。第一步:登錄「優(yōu)云智算」算力共享平臺(tái)并進(jìn)入「鏡像社區(qū)」,新用戶免費(fèi)體驗(yàn)10小時(shí)4090地址:https://www.compshare.cn/?ytag=seo...
DeepSeek-R1-32B-WebUIDeepSeek-R1采用強(qiáng)化學(xué)習(xí)進(jìn)行后訓(xùn)練,旨在提升推理能力,尤其擅長(zhǎng)數(shù)學(xué)、代碼和自然語言推理等復(fù)雜任務(wù),該鏡像安裝和使用 Ollama 和 Open WebUI,以便更好地利用深度學(xué)習(xí)模型進(jìn)行推理和交互。第一步:登錄「優(yōu)云智算」算力共享平臺(tái)并進(jìn)入「鏡像社區(qū)」地址:https://www.compshare.cn/?ytag=seo第二步:選擇「Deep...
DeepSeek V3憑借多頭潛注意力(MLA)與優(yōu)化的混合專家網(wǎng)絡(luò)(MoE)架構(gòu),奠定了高效訓(xùn)練的基礎(chǔ),僅以557.6萬元成本實(shí)現(xiàn)媲美OpenAI O1的性能;而R1則基于V3進(jìn)一步突破,通過無監(jiān)督強(qiáng)化學(xué)習(xí)與知識(shí)蒸餾技術(shù),在推理能力上對(duì)標(biāo)頂尖模型,同時(shí)開源多尺寸版本,推動(dòng)更廣泛的應(yīng)用。DeepSeek三種模式對(duì)比基礎(chǔ)模型(V3):通用模型(2024.12),高效便捷,適用于絕大多數(shù)任務(wù),規(guī)范性 ...
我們身處數(shù)字化浪潮中,知識(shí)管理和利用的重要性與日俱增。擁有一個(gè)專屬的本地知識(shí)庫,能極大提升工作效率,滿足個(gè)性化需求。但對(duì)于技術(shù)小白來說,搭建這樣的知識(shí)庫不僅存在技術(shù)門檻,同時(shí)也意味著需要一定的成本投入。本期 DeepSeek 入門教程,優(yōu)刻得將為您提供一個(gè)0成本基于DeepSeek(滿血版)輕松搭建本地知識(shí)庫的方式。獲取優(yōu)刻得模型服務(wù)平臺(tái)密鑰Key登錄 UCloud 控制臺(tái)https://cons...
閱讀 517·2025-02-07 13:29
閱讀 554·2024-11-07 18:25
閱讀 130983·2024-02-01 10:43
閱讀 1015·2024-01-31 14:58
閱讀 982·2024-01-31 14:54
閱讀 83139·2024-01-29 17:11
閱讀 3403·2024-01-25 14:55
閱讀 2163·2023-06-02 13:36