Meta發(fā)布人工智能新模型系列 Llama 4
Meta公司在周六發(fā)布了其 Llama 系列中的一組新的人工智能模型 ——Llama 4。
該系列總共有四個新模型:Llama 4 Scout、Llama 4 Maverick 和 Llama 4 Behemoth。Meta 稱,所有這些模型都經(jīng)過了 “大量未標(biāo)注的文本、圖像和視頻數(shù)據(jù)” 的訓(xùn)練,以使它們具備 “廣泛的視覺理解能力”。
Scout 和 Maverick 模型在Llama.com網(wǎng)站以及 Meta 的合作伙伴(包括人工智能開發(fā)平臺 Hugging Face)處均可公開獲取,而 Behemoth 模型仍在訓(xùn)練中。Meta 表示,其人工智能助手 Meta AI(應(yīng)用于 WhatsApp、Messenger 和 Instagram 等應(yīng)用程序)已在 40 個國家更新為使用 Llama 4 模型。目前,多模態(tài)功能僅在美國以英語提供。
一些開發(fā)者可能會對 Llama 4 模型的使用許可持異議。
“位于” 歐盟或 “主要營業(yè)地” 在歐盟的用戶和公司被禁止使用或分發(fā)這些模型,這可能是該地區(qū)人工智能和數(shù)據(jù)隱私法律所施加的監(jiān)管要求導(dǎo)致的結(jié)果(過去,Meta 曾譴責(zé)這些法律過于繁瑣)。此外,與之前發(fā)布的 Llama 模型一樣,月活躍用戶超過 7 億的公司必須向 Meta 申請?zhí)厥庠S可,Meta 可自行決定是否授予該許可。
Meta 在一篇博客文章中寫道:“這些 Llama 4 模型標(biāo)志著 Llama 生態(tài)系統(tǒng)新時代的開始。這僅僅是 Llama 4 系列的開端。”
Meta 表示,Llama 4 是其首個采用混合專家(MoE)架構(gòu)的模型系列,這種架構(gòu)在訓(xùn)練和回答查詢時計算效率更高?;旌蠈<壹軜?gòu)基本上是將數(shù)據(jù)處理任務(wù)分解為子任務(wù),然后將它們委派給更小的、專門的 “專家” 模型。
例如,Maverick 總共有 4000 億個參數(shù),但在 128 個 “專家” 模型中只有 170 億個活躍參數(shù)(參數(shù)數(shù)量大致與模型的問題解決能力相對應(yīng))。Scout 有 170 億個活躍參數(shù)、16 個 “專家” 模型以及總計 1090 億個參數(shù)。
根據(jù) Meta 的內(nèi)部測試,Maverick 最適合用于 “通用助手和聊天” 等應(yīng)用場景,比如創(chuàng)意寫作,在某些編碼、推理、多語言、長文本上下文和圖像基準(zhǔn)測試中,其表現(xiàn)超過了 OpenAI 的 GPT-4o 和谷歌的 Gemini 2.0 等模型。然而,Maverick 與谷歌的 Gemini 2.5 Pro、Anthropic 的 Claude 3.7 Sonnet 和 OpenAI 的 GPT-4.5 等功能更強(qiáng)大的最新模型相比,仍有一定差距。
Scout 的優(yōu)勢在于文檔摘要以及對大型代碼庫的推理等任務(wù)。獨(dú)特的是,它擁有非常大的上下文窗口:1000 萬個詞元(“詞元” 代表原始文本的片段,例如單詞 “fantastic” 可拆分為 “fan”、“tas” 和 “tic”)。簡單來說,Scout 可以處理圖像以及多達(dá)數(shù)百萬字的文本,使其能夠處理和使用極其冗長的文檔。
根據(jù) Meta 的計算,Scout 可以在單個英偉達(dá) H100 GPU 上運(yùn)行,而 Maverick 則需要英偉達(dá) H100 DGX 系統(tǒng)或同等設(shè)備。
Meta 尚未發(fā)布的 Behemoth 模型將需要更強(qiáng)大的硬件支持。據(jù)該公司稱,Behemoth 有 2880 億個活躍參數(shù)、16 個 “專家” 模型,總參數(shù)數(shù)量接近 2 萬億個。Meta 的內(nèi)部基準(zhǔn)測試顯示,在一些衡量解決數(shù)學(xué)問題等科學(xué)、技術(shù)、工程和數(shù)學(xué)(STEM)技能的評估中,Behemoth 的表現(xiàn)優(yōu)于 GPT-4.5、Claude 3.7 Sonnet 和 Gemini 2.0 Pro(但不如 Gemini 2.5 Pro)。
值得注意的是,Llama 4 系列中沒有一個模型是像 OpenAI 的 o1 和 o3-mini 那樣真正意義上的 “推理” 模型。推理模型會對其答案進(jìn)行事實核查,并且通常能更可靠地回答問題,但因此也比傳統(tǒng)的 “非推理” 模型花費(fèi)更長的時間來給出答案。
有趣的是,Meta 表示,他們對所有 Llama 4 模型進(jìn)行了優(yōu)化,使其更少拒絕回答 “有爭議的” 問題。據(jù)該公司稱,Llama 4 能夠回答之前的 Llama 模型不會回答的 “有爭議的” 政治和社會話題。此外,該公司還表示,Llama 4 在處理那些它完全不會回應(yīng)的提示時 “更加平衡”。
Meta 的一位發(fā)言人告訴meiti:“你可以指望 [Llama 4] 提供有用的、基于事實的回答,且不帶任何評判。我們會繼續(xù)讓 Llama 模型更具響應(yīng)性,以便它能回答更多問題,能夠回應(yīng)各種不同的觀點…… 并且不會偏袒某些觀點而忽視其他觀點?!?/p>
這些調(diào)整是在一些白宮盟友指責(zé)人工智能聊天機(jī)器人在政治上過于 “覺醒” 的背景下做出的。
美國總統(tǒng)唐納德?特朗普的許多親信,包括億萬富翁埃隆?馬斯克以及加密貨幣和人工智能 “沙皇” 大衛(wèi)?薩克斯,都聲稱流行的人工智能聊天機(jī)器人審查保守派觀點。薩克斯過去曾特別指出 OpenAI 的 ChatGPT “被編程為具有覺醒傾向”,并且在政治話題上不真實。
實際上,人工智能中的偏見是一個棘手的技術(shù)問題。馬斯克自己的人工智能公司 xAI 也一直在努力開發(fā)一款不會偏袒某些政治觀點的聊天機(jī)器人。
盡管如此,包括 OpenAI 在內(nèi)的公司仍在調(diào)整其人工智能模型,使其能夠回答比以前更多的問題,尤其是與有爭議話題相關(guān)的問題。
佛山公司差旅網(wǎng)站排名,揭秘高效差旅管理的新選擇,佛山差旅網(wǎng)站排名,探索高效差旅管理創(chuàng)新方案,佛山差旅網(wǎng)站排名,揭秘高效差旅管理創(chuàng)新解決方案
下一篇歡迎使用Z-BlogPHP!
相關(guān)文章
最新評論