基于Ktransformers的DeepSeek-R1滿血版部署

UCloud小助手發(fā)布于2025-02-19 13:50 / 65人閱讀

2月10日，清華大學(xué)KVCache.AI團(tuán)隊(duì)聯(lián)合趨境科技發(fā)布的KTransformers開(kāi)源項(xiàng)目公布更新：一塊24G顯存的4090D就可以在本地運(yùn)行DeepSeek-R1、V3的671B“滿血版”。預(yù)處理速度最高達(dá)到286 tokens/s，推理生成速度最高能達(dá)到14 tokens/s。

KTransformers通過(guò)優(yōu)化本地機(jī)器上的LLM部署，幫助解決資源限制問(wèn)題。該框架采用了異構(gòu)計(jì)算、先進(jìn)量化技術(shù)、稀疏注意力機(jī)制等多種創(chuàng)新手段，提升了模型的計(jì)算效率，并具備處理長(zhǎng)上下文序列的能力。

基于Ktransformers部署DeepSeek-R1

第一步：登錄「優(yōu)云智算」算力共享平臺(tái)并進(jìn)入「鏡像社區(qū)」

訪問(wèn)優(yōu)云智算官網(wǎng)：https://www.compshare.cn/ ，點(diǎn)擊右上角登錄進(jìn)行賬號(hào)注冊(cè)，注冊(cè)實(shí)名后將得到20元算力金，可免費(fèi)體驗(yàn)4090 10小時(shí)。

步驟二：創(chuàng)建GPU實(shí)例

訪問(wèn)優(yōu)云智算鏡像社區(qū)，選擇DeepSeek Ktransformers鏡像。

鏈接直達(dá)：https://www.compshare.cn/images-detail?ImageID=compshareImage-18ikrnb3x30r

KTransformers目前支持Q4級(jí)別的DeepSeek的QA對(duì)話，由于內(nèi)存需要300G以上，因此需要選擇4卡4090資源。

第三步：啟動(dòng)推理服務(wù)，鏡像已配置好所需依賴環(huán)境，無(wú)需額外安裝，即可通過(guò)以下命令啟動(dòng)推理服務(wù)

打開(kāi)Jupyterlab：

進(jìn)入Terminal并執(zhí)行服務(wù)啟動(dòng)命令：

進(jìn)入 KTransformers 目錄：

cd ktransformers/

運(yùn)行本地聊天程序：

python ./ktransformers/local_chat.py --model_path deepseek-ai/DeepSeek-R1 --gguf_path /compshare-model/DeepSeek-R1-GGUF/DeepSeek-R1-Q4_K_M --force_think true --cpu_infer 60 --max_new_tokens 1000 --optimize_rule_path ktransformers/optimize/optimize_rules/DeepSeek-V3-Chat-multi-gpu.yaml

服務(wù)啟動(dòng)較慢，需要等待幾分鐘。

參數(shù)說(shuō)明：

--model_path（必需）：指定模型名稱，例如 "deepseek-ai/DeepSeek-V2-Lite-Chat"，該名稱會(huì)自動(dòng)從 Hugging Face 下載配置文件。如果您已經(jīng)有本地文件，可以直接使用該路徑來(lái)初始化模型。

注意：目錄中不需要 .safetensors 文件，我們只需要配置文件來(lái)構(gòu)建模型和分詞器。

--gguf_path（必需）：指定包含 GGUF 文件的目錄路徑，這些文件可以從 Hugging Face 下載。注意該目錄應(yīng)僅包含當(dāng)前模型的 GGUF 文件，這意味著每個(gè)模型需要一個(gè)多帶帶的目錄。

--optimize_rule_path（除 Qwen2Moe 和 DeepSeek-V2 外必需）：指定包含優(yōu)化規(guī)則的 YAML 文件路徑。ktransformers/optimize/optimize_rules 目錄中預(yù)先寫好了兩個(gè)規(guī)則文件，用于優(yōu)化 DeepSeek-V2 和 Qwen2-57B-A14，這兩個(gè)是當(dāng)前最先進(jìn)的 MoE 模型。

--max_new_tokens：整數(shù)（默認(rèn)值為 1000）。生成的新令牌的最大數(shù)量。

--cpu_infer：整數(shù)（默認(rèn)值為 10）。用于推理的 CPU 數(shù)量。理想情況下應(yīng)設(shè)置為（總核心數(shù) - 2）。

以上是優(yōu)云智算平臺(tái)支持的Ktransformers DeepSeek模型，優(yōu)云智算鏡像社區(qū)仍在不斷更新DeepSeek系列鏡像，更有海量AI行業(yè)鏡像等你來(lái)體驗(yàn)！

云服務(wù)器 GPU云服務(wù)器基于docker的私有云部署基于云服務(wù)器的部署基于docker的混合云部署方案基于docker快速部署微服務(wù)

文章版權(quán)歸作者所有，未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為，您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請(qǐng)注明本文地址：http://systransis.cn/yun/131188.html

發(fā)表評(píng)論

登陸后可評(píng)論

0條評(píng)論

UCloud小助手

男|高級(jí)講師

我要關(guān)注我要私信

TA的文章

DeepSeek從入門到精通（2）：0成本用DeepSeek（滿血版）搭建本地知識(shí)庫(kù)

閱讀 109·2025-02-19 18:27
DeepSeek從入門到精通（1）：10分鐘用DeepSeek搭建私有化知識(shí)庫(kù)

閱讀 133·2025-02-19 18:21
基于Ktransformers的DeepSeek-R1滿血版部署

閱讀 66·2025-02-19 13:50
UCloud X DeepSeek V3、R1滿血版橫向大對(duì)比！

閱讀 809·2025-02-13 22:35
基于unsloth的DeepSeek-R1動(dòng)態(tài)量化版本部署

閱讀 512·2025-02-08 10:20
2025年U大使新年軟文推廣限時(shí)活動(dòng)

閱讀 5779·2025-01-02 11:25
U大使獎(jiǎng)勵(lì)規(guī)則全新發(fā)布

閱讀 743·2024-12-10 11:51
服務(wù)器常用端口大全

閱讀 580·2024-11-07 17:59

成人国产在线小视频_日韩寡妇人妻调教在线播放_色成人www永久在线观看_2018国产精品久久_亚洲欧美高清在线30p_亚洲少妇综合一区_黄色在线播放国产_亚洲另类技巧小说校园_国产主播xx日韩_a级毛片在线免费

資訊專欄INFORMATION COLUMN

上云采購(gòu)季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺(tái)、長(zhǎng)期優(yōu)惠，快來(lái)選購(gòu)！

基于Ktransformers的DeepSeek-R1滿血版部署

基于Ktransformers部署DeepSeek-R1

第一步：登錄「優(yōu)云智算」算力共享平臺(tái)并進(jìn)入「鏡像社區(qū)」

步驟二：創(chuàng)建GPU實(shí)例

第三步：啟動(dòng)推理服務(wù)，鏡像已配置好所需依賴環(huán)境，無(wú)需額外安裝，即可通過(guò)以下命令啟動(dòng)推理服務(wù)

相關(guān)文章

**DeepSeek從入門到精通（2）：0成本用DeepSeek（滿血版）搭建本地知識(shí)庫(kù)**

UCloud X DeepSeek V3、R1滿血版橫向大對(duì)比！

**基于unsloth的DeepSeek-R1動(dòng)態(tài)量化版本部署**

DeepSeek R1系列模型一鍵部署教程，支持云端免費(fèi)體驗(yàn)！

使用Ollama本地化部署DeepSeek

發(fā)表評(píng)論

0條評(píng)論

UCloud小助手

男|高級(jí)講師

TA的文章

DeepSeek從入門到精通（2）：0成本用DeepSeek（滿血版）搭建本地知識(shí)庫(kù)

DeepSeek從入門到精通（1）：10分鐘用DeepSeek搭建私有化知識(shí)庫(kù)