“歐洲OpenAI”開源新模型，實(shí)現(xiàn)更快、更長(zhǎng)的代碼生成

UCloud小助手發(fā)布于2024-07-17 16:19 / 308人閱讀

在人工智能領(lǐng)域，我們深感技術(shù)發(fā)展的迅速和成就的巨大。其中，法國(guó)初創(chuàng)公司MistralAI在這方面尤為令人矚目。MistralAI成立于2023年5月，由DeepMind和Meta的前科學(xué)家創(chuàng)立，被稱為“歐洲版OpenAI”。

這是一家創(chuàng)新而富有前景的公司，他們的雄心壯志和成績(jī)讓人嘆為觀止。這家公司以產(chǎn)生開源大型語(yǔ)言模型著稱，其中最受人矚目的是 Mistral 7B 和 Mixtral 8x7B。這些模型在多項(xiàng)基準(zhǔn)測(cè)試中表現(xiàn)優(yōu)異，展現(xiàn)了強(qiáng)大的自然語(yǔ)言處理能力和廣泛的應(yīng)用前景。這不僅推動(dòng)了自然語(yǔ)言處理技術(shù)的發(fā)展，也為開發(fā)者提供了更多的選擇和可能性。

而就在今天，MistralAI在其不斷壯大的大語(yǔ)言模型（LLM）家族中增添了兩名新成員：一位是名為Mathstral的基于數(shù)學(xué)的模型，另一位是基于其他研究人員去年年底開發(fā)的名為Mamba的新架構(gòu)，供程序員和開發(fā)人員提供的代碼生成模型。

現(xiàn)在，通過(guò)采用這種新架構(gòu)，Mistral 新推出的 Codestral Mamba 7B的模型即使在處理較長(zhǎng)的輸入文本時(shí)也能提供快速的響應(yīng)時(shí)間。Codestral Mamba非常適合代碼生成，尤其是對(duì)于更本地化的編程項(xiàng)目。本文接下來(lái)將簡(jiǎn)單介紹一下Mamba以及MistralAI。

“Mamba”架構(gòu)：大道至簡(jiǎn)，加強(qiáng)效率

Codestral Mamba 是一種狀態(tài)空間模型架構(gòu)，與 transformer架構(gòu)相比具有顯著優(yōu)勢(shì)：transformer 推理計(jì)算（通常是推理時(shí)間）與上下文/序列長(zhǎng)度呈二次縮放，而 Mamba 架構(gòu)呈線性縮放。這就是為什么 Codestral Mamba 能夠提供 256k 令牌的上下文窗口，>7 倍 Mistral 7B 的上下文窗口。這也意味著在使用模型時(shí)可以更快地進(jìn)行推理/速度，特別是對(duì)于RAG等大型上下文用例。

Mamba架構(gòu)旨在通過(guò)簡(jiǎn)化注意力機(jī)制來(lái)提高大多數(shù)領(lǐng)先 LLM 使用的 transformer 架構(gòu)的效率。與更常見的基于 transformer 的模型不同，基于 Mamba 的模型可以具有更快的推理時(shí)間和更長(zhǎng)的上下文。包括 AI21 在內(nèi)的其他公司和開發(fā)商已經(jīng)發(fā)布了基于它的新 AI 模型。

現(xiàn)在，使用這種新架構(gòu)，Mistral旗下恰如其名的Codestral Mamba 7B 即便輸入較長(zhǎng)的文本也能提供快速響應(yīng)時(shí)間。Codestral Mamba 非常適合代碼生產(chǎn)力用例，尤其是對(duì)于更多本地編碼項(xiàng)目。

Mistral 測(cè)試了該模型，測(cè)試結(jié)果顯示該模型可以在 Mistral 的 l a Plateforme API上免費(fèi)使用，可處理多達(dá) 256,000 個(gè)令牌的輸入——是 OpenAI 的 GPT-4o 的兩倍。這種高效的模型對(duì)編程開發(fā)尤其重要，不受輸入長(zhǎng)度的限制意味著模型可以讀取更多代碼內(nèi)容并根據(jù)上下文編寫更適合的代碼、幫助開發(fā)者構(gòu)建更完整的項(xiàng)目。

在基準(zhǔn)測(cè)試中，Mistral 表明 Codestral Mamba 在 HumanEval 測(cè)試中的表現(xiàn)明顯優(yōu)于競(jìng)爭(zhēng)對(duì)手開源模型 CodeLlama 7B、CodeGemma-1.17B 和 DeepSeek。

開發(fā)人員可以從 GitHub 存儲(chǔ)庫(kù)和 HuggingFace 修改和部署 Codestral Mamba。它將采用開源 Apache 2.0 許可證。

Mistral 聲稱Codestral 的早期版本優(yōu)于其他代碼生成器，如 CodeLlama 70B 和 DeepSeek Coder 33B。

需要說(shuō)的是，Codestral Mamba 同樣是一個(gè)指導(dǎo)模型，開發(fā)者可以根據(jù)自己的需要使用 mistral-inference 進(jìn)行微調(diào)訓(xùn)練，打造適合自己或特定領(lǐng)域的版本。

代碼生成和編碼助手已經(jīng)成為人工智能模型廣泛使用的應(yīng)用程序，其中由 OpenAI 提供支持的GitHub 的 Copilot、亞馬遜的 CodeWhisperer和Codenium等平臺(tái)越來(lái)越受歡迎。

“Mathstral”模型：兼顧數(shù)學(xué)與推理

Mistral 推出的第二款模型是Mathstral 7B，這是一種專為數(shù)學(xué)推理和科學(xué)發(fā)現(xiàn)而設(shè)計(jì)的人工智能模型。Mistral 與 Project Numina 合作開發(fā)了 Mathstral。

Mathstral 擁有 32K 上下文窗口，將采用 Apache 2.0 開源許可。Mistral 表示，該模型的表現(xiàn)優(yōu)于所有為數(shù)學(xué)推理設(shè)計(jì)的模型。它可以在具有更多推理時(shí)間計(jì)算的基準(zhǔn)測(cè)試中實(shí)現(xiàn)“明顯更好的結(jié)果”。用戶可以按原樣使用它，也可以對(duì)模型進(jìn)行微調(diào)。

Mistral 的圖表顯示了 Mathstral 的評(píng)估。

Mistral 在一篇博客文章中表示：“Mathstral 是構(gòu)建特定用途模型時(shí)實(shí)現(xiàn)的出色性能/速度權(quán)衡的另一個(gè)例子——這是我們?cè)?la Plateforme 中積極推廣的開發(fā)理念，尤其是其新的微調(diào)功能。”

MistralAI：堅(jiān)持開源的新興獨(dú)角獸

Mistral AI 是一家法國(guó)人工智能公司。它于 2023 年 4 月由曾受雇于 Meta 和 Google 的研究人員創(chuàng)建，包括：Arthur Mensch、Timothée Lacroix 和 Guillaume Lample。截至 2023 年 12 月，該公司已融資 6.6 億美元。2023 年 12 月，該公司的估值超過(guò) 20 億美元，晉身獨(dú)角獸。

Mistral AI的技術(shù)架構(gòu)建立在數(shù)據(jù)層、算法層和模型層之上，通過(guò)運(yùn)用深度學(xué)習(xí)等先進(jìn)算法，實(shí)現(xiàn)對(duì)數(shù)據(jù)的智能分析、處理和應(yīng)用。

與具有諷刺意味的名字 OpenAI 不同，Mistral AI 產(chǎn)生開源大型語(yǔ)言模型，這意味著這些模型可以免費(fèi)用于商業(yè)用途。開發(fā)人員還可以更改、復(fù)制或更新源代碼，并將其與許可證副本一起分發(fā)。正因如此，Mistral AI的成立和發(fā)展在法國(guó)乃至歐洲都引起了廣泛關(guān)注。其開源的人工智能大模型在歐洲向封閉的OpenAI發(fā)起了挑戰(zhàn)，被視為法國(guó)挑戰(zhàn)美國(guó)科技巨頭的一個(gè)機(jī)遇。

官網(wǎng)：https://mistral.ai/

云服務(wù)器 GPU云服務(wù)器模型實(shí)例代碼 tcp服務(wù)器代碼模型 webrtc開源實(shí)現(xiàn) 比cdn更快

文章版權(quán)歸作者所有，未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為，您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請(qǐng)注明本文地址：http://systransis.cn/yun/131135.html

發(fā)表評(píng)論

登陸后可評(píng)論

0條評(píng)論

UCloud小助手

男|高級(jí)講師

我要關(guān)注我要私信

TA的文章

服務(wù)器常用端口大全

閱讀 177·2024-11-07 17:59
又來(lái)!OpenAI 宮斗大戲曝光,首席技術(shù)官M(fèi)ira 離職

閱讀 225·2024-09-27 16:59
2.4K star的GOT-OCR2.0：端到端OCR 模型

閱讀 357·2024-09-23 10:37
Openai 放出大招！O1: 邁向下一代人工智能的2.0時(shí)代

閱讀 403·2024-09-14 16:58
Openai 放出大招！O1: 邁向下一代人工智能的2.0時(shí)代

閱讀 267·2024-09-14 16:58
網(wǎng)頁(yè)開發(fā)助手——自動(dòng)編寫運(yùn)行代碼

閱讀 371·2024-08-29 18:47
一直爆料OpenAI「草莓」的賬號(hào)，竟然是個(gè)智能體？Agent Q橫空出世，AI界新秀or營(yíng)銷大師

閱讀 603·2024-08-16 14:40
傳媒人必備：不花錢的AI開源視頻神助攻

閱讀 323·2024-08-14 17:54

成人国产在线小视频_日韩寡妇人妻调教在线播放_色成人www永久在线观看_2018国产精品久久_亚洲欧美高清在线30p_亚洲少妇综合一区_黄色在线播放国产_亚洲另类技巧小说校园_国产主播xx日韩_a级毛片在线免费

資訊專欄INFORMATION COLUMN

上云采購(gòu)季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺(tái)、長(zhǎng)期優(yōu)惠，快來(lái)選購(gòu)！

“歐洲OpenAI”開源新模型，實(shí)現(xiàn)更快、更長(zhǎng)的代碼生成

相關(guān)文章

成為優(yōu)秀的程序員需要到以下幾點(diǎn)

OpenAI突然上線兩件“殺手锏”：勢(shì)在維持大模型霸主地位

分享好東西

2019年KubeCon + CloudNativeCon提案征集（CFP）的新優(yōu)化安排

發(fā)表評(píng)論

0條評(píng)論

UCloud小助手

男|高級(jí)講師

TA的文章

服務(wù)器常用端口大全

又來(lái)!OpenAI 宮斗大戲曝光,首席技術(shù)官M(fèi)ira 離職

2.4K star的GOT-OCR2.0：端到端OCR 模型

Openai 放出大招！O1: 邁向下一代人工智能的2.0時(shí)代

Openai 放出大招！O1: 邁向下一代人工智能的2.0時(shí)代

網(wǎng)頁(yè)開發(fā)助手——自動(dòng)編寫運(yùn)行代碼

一直爆料OpenAI「草莓」的賬號(hào)，竟然是個(gè)智能體？Agent Q橫空出世，AI界新秀or營(yíng)銷大師

傳媒人必備：不花錢的AI開源視頻神助攻

最新活動(dòng)

資訊專欄INFORMATION COLUMN

上云采購(gòu)季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺(tái)、長(zhǎng)期優(yōu)惠，快來(lái)選購(gòu)！

“歐洲OpenAI”開源新模型，實(shí)現(xiàn)更快、更長(zhǎng)的代碼生成

相關(guān)文章

發(fā)表評(píng)論

0條評(píng)論

男|高級(jí)講師

TA的文章

最新活動(dòng)

上云采購(gòu)季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺(tái)、長(zhǎng)期優(yōu)惠，快來(lái)選購(gòu)！

“歐洲OpenAI”開源新模型，實(shí)現(xiàn)更快、更長(zhǎng)的代碼生成