GPT革命|Meta模型Llama 3.1亮相,微美全息构建多模态AI生态

7月24日消息,美国科技巨头Meta发布了其最强开源人工智能(AI)模型Llama 3.1,拥有三个不同的版本。

开源人工智能(AI)模型Llama 3.1来袭

Meta的公告显示,Llama 3.1在Llama 3的基础上进行了重大更新,Llama 3.1主要用于驱动聊天机器人,可以进行八种语言的对话,编写更高质量的计算机代码,并可以解决更复杂的数学问题。

GPT革命|Meta模型Llama 3.1亮相,微美全息构建多模态AI生态-第1张-新闻-51硕博论文

根据Meta提供的基准测试数据,最受关注的405B版本,从性能上已经可与GPT-4和Claude 3相媲美。其中Human Evaluation主要用于评估模型在理解和生成代码、解决抽象逻辑问题方面的能力。在与其他大型模型的竞争中,Llama 3.1 405B显得略胜一筹。

2024年4月,Meta推出开源大型语言模型Llama 3。其中,Llama 3-8B和Llama 3-70B为同等规模的大模型树立了新的基准,然而,在短短三个月内,随着AI的功能迭代,其他大模型很快将其超越。

Meta 在 4 月份告诉投资者,今年计划花费比最初预期多数十亿美元的资金,其中一个核心原因是对 AI 的投资。据官方博客文章称,预计到今年年底,该公司将拥有约 350,000 个英伟达 H100 GPU。而 H100 芯片已成为用于训练 Llama、GPT-4 等大模型的基础技术成本,每个芯片的成本可能高达数万美元。

如今,在模型架构方面,作为Meta迄今为止最大的模型,Llama 3.1 在超过 15 万亿个token的数据上进行训练碾压其他模型。扎克伯格认为,Meta AI将超过ChatGPT,成为使用最广泛的助手,称为“业内顶尖水准的”AI模型,并表示能够与OpenAI和谷歌等竞争对手的类似产品相抗衡。

GPT革命|Meta模型Llama 3.1亮相,微美全息构建多模态AI生态-第2张-新闻-51硕博论文

有趣的是,7月23日周三,苹果(AAPL.US)公司刚官宣了小模型DCLM-Baseline-7B模型,参数达7亿,并且在训练过程中使用了多达2.5万亿个数据令牌,能帮助更好地理解和生成语言。市场分析认为,此举显示苹果似乎把目标牢牢放在“AI”的方向上,将带来深远的影响。

GPT革命|Meta模型Llama 3.1亮相,微美全息构建多模态AI生态-第3张-新闻-51硕博论文

OpenAI 出招抢断 Meta

与此同时OpenAI 也坐不住了。OpenAI 宣布,今年 9 月 23 日之前,性能最强的小模型 GPT-4o mini 微调版全面免费,GPT-4o mini 的输入 Tokens 费用比 GPT-3.5 Turbo 低 90%,输出 Tokens 费用低 80%。

OpenAI 指出,如果目前正在微调 GPT-3.5 Turbo,GPT-4o mini 则更加实惠,拥有更长的上下文,以及更强的技术能力。GPT-4o mini 比 GPT-3.5 Turbo 更聪明,并且支持视觉功能。GPT-4o mini 微调功能向企业客户和 Tier 4 及 Tier 5 使用等级的其他开发者开放。

GPT革命|Meta模型Llama 3.1亮相,微美全息构建多模态AI生态-第4张-新闻-51硕博论文

虽然OpenAI和谷歌等公司在极力垄断最新模型的信息,但Meta为代表的开源社区正在大力推动更易于访问的生成式AI,这可能会挑战传统的闭源AI开发模式。如今,一场在美国硅谷的 AI 大模型军备竞赛已经进入白热化。

微美全息提前抢占广阔应用场景

无疑,今年以来,全球大模型赛道战愈演愈烈,大模型科技巨头们,不断在这场技术与商业的角逐中寻找新的突破口。与此同时,据了解,作为开源AI大模型路线的领头羊,微美全息(WIMI.US)见证了人工智能显著进步,而其AI技术也出于推动技术、提升模型质量、建模透明度和支持长期战略创新创新,在AI热潮中越来越受青睐。

当下,AI大模型正成为产业新型基础设施并为千行百业提供智能服务,微美全息且以“大模型+开源AI”的范式推动AI多模态技术研发,与此同时,也为各行各业带来了前所未有的变革。比如,微美全息开源AI大模型+办公正在重塑企业办公用户体验和交互模式,能够帮助用户更好地创作、阅读、处理文档。

随着技术的演进,未来人工智能有望进一步发展成全面理解和处理复杂信息的通用系统,更加融入人们的日常生活和工作中。微美全息坚信“大模型+开源AI”将变革人机关系并加速GAI时代的到来,下一步将更加广泛推进开源AI应用范围,尤其是以多模态AI将以更自然且实时的交互方式,加快提升能力协作及模式应用进行发展。

结尾

总结来说,随着各大模型技术的持续演进,文本、语音、视觉融合模态的开源模型正逐步迈向加速阶段。此类大模型技术一旦达到成熟阶段,其应用场景将会进一步拓展,实现更多的实际应用。从中长期看,其有望引领新一轮科技革命,企业所以要基于技术发展的速度,合理地预判趋势来提前做产业转化的布局。

免责声明:本文章由会员“极目新闻”发布如果文章侵权,请联系我们处理,本站仅提供信息存储空间服务如因作品内容、版权和其他问题请于本站联系