Meta發(fā)布人工智能新模型系列 Llama 4

快訊 2025年04月06日 11:30 1 admin

　　Meta公司在周六發(fā)布了其 Llama 系列中的一組新的人工智能模型 ——Llama 4。

　　該系列總共有四個新模型：Llama 4 Scout、Llama 4 Maverick 和 Llama 4 Behemoth。Meta 稱，所有這些模型都經(jīng)過了 “大量未標(biāo)注的文本、圖像和視頻數(shù)據(jù)” 的訓(xùn)練，以使它們具備 “廣泛的視覺理解能力”。

Meta發(fā)布人工智能新模型系列 Llama 4

　　Scout 和 Maverick 模型在Llama.com網(wǎng)站以及 Meta 的合作伙伴（包括人工智能開發(fā)平臺 Hugging Face）處均可公開獲取，而 Behemoth 模型仍在訓(xùn)練中。Meta 表示，其人工智能助手 Meta AI（應(yīng)用于 WhatsApp、Messenger 和 Instagram 等應(yīng)用程序）已在 40 個國家更新為使用 Llama 4 模型。目前，多模態(tài)功能僅在美國以英語提供。

　　一些開發(fā)者可能會對 Llama 4 模型的使用許可持異議。

　　“位于” 歐盟或 “主要營業(yè)地” 在歐盟的用戶和公司被禁止使用或分發(fā)這些模型，這可能是該地區(qū)人工智能和數(shù)據(jù)隱私法律所施加的監(jiān)管要求導(dǎo)致的結(jié)果（過去，Meta 曾譴責(zé)這些法律過于繁瑣）。此外，與之前發(fā)布的 Llama 模型一樣，月活躍用戶超過 7 億的公司必須向 Meta 申請?zhí)厥庠S可，Meta 可自行決定是否授予該許可。

　　Meta 在一篇博客文章中寫道：“這些 Llama 4 模型標(biāo)志著 Llama 生態(tài)系統(tǒng)新時代的開始。這僅僅是 Llama 4 系列的開端。”

Meta發(fā)布人工智能新模型系列 Llama 4

　　Meta 表示，Llama 4 是其首個采用混合專家（MoE）架構(gòu)的模型系列，這種架構(gòu)在訓(xùn)練和回答查詢時計算效率更高?；旌蠈＜壹軜?gòu)基本上是將數(shù)據(jù)處理任務(wù)分解為子任務(wù)，然后將它們委派給更小的、專門的 “專家” 模型。

　　例如，Maverick 總共有 4000 億個參數(shù)，但在 128 個 “專家” 模型中只有 170 億個活躍參數(shù)（參數(shù)數(shù)量大致與模型的問題解決能力相對應(yīng)）。Scout 有 170 億個活躍參數(shù)、16 個 “專家” 模型以及總計 1090 億個參數(shù)。

　　根據(jù) Meta 的內(nèi)部測試，Maverick 最適合用于 “通用助手和聊天” 等應(yīng)用場景，比如創(chuàng)意寫作，在某些編碼、推理、多語言、長文本上下文和圖像基準(zhǔn)測試中，其表現(xiàn)超過了 OpenAI 的 GPT-4o 和谷歌的 Gemini 2.0 等模型。然而，Maverick 與谷歌的 Gemini 2.5 Pro、Anthropic 的 Claude 3.7 Sonnet 和 OpenAI 的 GPT-4.5 等功能更強(qiáng)大的最新模型相比，仍有一定差距。

　　Scout 的優(yōu)勢在于文檔摘要以及對大型代碼庫的推理等任務(wù)。獨(dú)特的是，它擁有非常大的上下文窗口：1000 萬個詞元（“詞元” 代表原始文本的片段，例如單詞 “fantastic” 可拆分為 “fan”、“tas” 和 “tic”）。簡單來說，Scout 可以處理圖像以及多達(dá)數(shù)百萬字的文本，使其能夠處理和使用極其冗長的文檔。

　　根據(jù) Meta 的計算，Scout 可以在單個英偉達(dá) H100 GPU 上運(yùn)行，而 Maverick 則需要英偉達(dá) H100 DGX 系統(tǒng)或同等設(shè)備。

　　Meta 尚未發(fā)布的 Behemoth 模型將需要更強(qiáng)大的硬件支持。據(jù)該公司稱，Behemoth 有 2880 億個活躍參數(shù)、16 個 “專家” 模型，總參數(shù)數(shù)量接近 2 萬億個。Meta 的內(nèi)部基準(zhǔn)測試顯示，在一些衡量解決數(shù)學(xué)問題等科學(xué)、技術(shù)、工程和數(shù)學(xué)（STEM）技能的評估中，Behemoth 的表現(xiàn)優(yōu)于 GPT-4.5、Claude 3.7 Sonnet 和 Gemini 2.0 Pro（但不如 Gemini 2.5 Pro）。

　　值得注意的是，Llama 4 系列中沒有一個模型是像 OpenAI 的 o1 和 o3-mini 那樣真正意義上的 “推理” 模型。推理模型會對其答案進(jìn)行事實核查，并且通常能更可靠地回答問題，但因此也比傳統(tǒng)的 “非推理” 模型花費(fèi)更長的時間來給出答案。

Meta發(fā)布人工智能新模型系列 Llama 4

　　有趣的是，Meta 表示，他們對所有 Llama 4 模型進(jìn)行了優(yōu)化，使其更少拒絕回答 “有爭議的” 問題。據(jù)該公司稱，Llama 4 能夠回答之前的 Llama 模型不會回答的 “有爭議的” 政治和社會話題。此外，該公司還表示，Llama 4 在處理那些它完全不會回應(yīng)的提示時 “更加平衡”。

　　Meta 的一位發(fā)言人告訴meiti：“你可以指望 [Llama 4] 提供有用的、基于事實的回答，且不帶任何評判。我們會繼續(xù)讓 Llama 模型更具響應(yīng)性，以便它能回答更多問題，能夠回應(yīng)各種不同的觀點…… 并且不會偏袒某些觀點而忽視其他觀點?！?/p>

　　這些調(diào)整是在一些白宮盟友指責(zé)人工智能聊天機(jī)器人在政治上過于 “覺醒” 的背景下做出的。

　　美國總統(tǒng)唐納德?特朗普的許多親信，包括億萬富翁埃隆?馬斯克以及加密貨幣和人工智能 “沙皇” 大衛(wèi)?薩克斯，都聲稱流行的人工智能聊天機(jī)器人審查保守派觀點。薩克斯過去曾特別指出 OpenAI 的 ChatGPT “被編程為具有覺醒傾向”，并且在政治話題上不真實。

　　實際上，人工智能中的偏見是一個棘手的技術(shù)問題。馬斯克自己的人工智能公司 xAI 也一直在努力開發(fā)一款不會偏袒某些政治觀點的聊天機(jī)器人。

　　盡管如此，包括 OpenAI 在內(nèi)的公司仍在調(diào)整其人工智能模型，使其能夠回答比以前更多的問題，尤其是與有爭議話題相關(guān)的問題。

標(biāo)簽：人工智能模型系列

一	二	三	四	五	六	日
				1	2	3
4	5	6	7	8	9	10
11	12	13	14	15	16	17
18	19	20	21	22	23	24
25	26	27	28	29	30

综合亚洲色一区二区,国产精品视频99re6,亚洲成A∨人综合在线观看,裸体美女扒开尿口

Meta發(fā)布人工智能新模型系列 Llama 4

佛山公司差旅網(wǎng)站排名，揭秘高效差旅管理的新選擇，佛山差旅網(wǎng)站排名，探索高效差旅管理創(chuàng)新方案，佛山差旅網(wǎng)站排名，揭秘高效差旅管理創(chuàng)新解決方案

歡迎使用Z-BlogPHP！

標(biāo)簽列表

最新評論

最新留言

综合亚洲色一区二区,国产精品视频99re6,亚洲成A∨人综合在线观看,裸体美女扒开尿口

Meta發(fā)布人工智能新模型系列 Llama 4

佛山公司差旅網(wǎng)站排名，揭秘高效差旅管理的新選擇，佛山差旅網(wǎng)站排名，探索高效差旅管理創(chuàng)新方案，佛山差旅網(wǎng)站排名，揭秘高效差旅管理創(chuàng)新解決方案

歡迎使用Z-BlogPHP！

標(biāo)簽列表

最新評論

最新留言

佛山公司差旅網(wǎng)站排名，揭秘高效差旅管理的新選擇，佛山差旅網(wǎng)站排名，探索高效差旅管理創(chuàng)新方案，佛山差旅網(wǎng)站排名，揭秘高效差旅管理創(chuàng)新解決方案

歡迎使用Z-BlogPHP！