Llama 3 - 搜索 News

5 天

在人工智能的不断进化中，多模态大模型的发展备受关注。尤其是Llama-3.2，这一模型通过借鉴Stable ...

2 天

IT之家获悉，系列模型基于 Meta Llama 3.2 语言模型打造而成，主打繁体中文处理能力，同时支持多模态输入和函数调用，能够识别图像并调用外部工具。在繁体中文处理能力方面，联发科提供的对比显示，相较于参数量相同的 Llama 3.2 3B Instruct 模型，Llama-Breeze2-3B 在撰写关于台北夜市的小短文时，能够准确列举出士林夜市、饶河街夜市和罗东夜市等当地知名夜市 ...

来自MSN16 天

Mistral开源Mistral Small 3 24B，称性能超越3倍大的Llama 3.3

法国AI创业公司Mistral AI上周公布开源高速、低延迟的模型Mistral Small 3 24B，性能超越参数量3倍大的Llama 3.3 70B。 Mistral Small ...

51CTO14 天

在个人电脑上运行Llama 3 70B大规模模型指南精华

随着人工智能和机器学习技术的迅猛发展，像Llama 3 70B这样的庞大语言模型已经成为了研究、开发和应用中的重要工具。这篇文章将详细介绍如何在个人电脑上运行Llama 3 70B大模型，并涵盖硬件要求、软件环境配置、安装步骤、运行示例和常见问题的解决方案。

17 天

开源的AI大模型那么多，DeepSeek V3凭啥震动全球AI圈？

各位老铁，最近AI圈可是炸了锅！Meta的 Llama 3 、马斯克 xAI公司的大模型，还有阿里的千问，哪个不是响当当的开源顶流？但偏偏杀出一匹中国黑马DeepSeek V3，直接把“行业地震”玩成了“日常操作”！今天咱们就掰扯掰扯，这背后的门道到底有多深？

3 小时

10美元成功复现DeepSeek顿悟时刻，3B模型爆发超强推理！微软论文实锤 ...

结果显示，只有70亿参数的Qwen2.5-7B，在经过5K个逻辑问题的训练后，就发展出了一些在逻辑语料库中原本不存在的高级推理技能——如反思、验证和总结能力。问题：一个非常特殊的岛屿上只住着骑士和骗子。骑士总是说真话，骗子总是说谎。你遇到两位岛民：Zoey和Oliver。Zoey说：「Oliver不是骑士。」Oliver说：「Oliver是骑士且Zoey是骗子。」请问，谁是骑士，谁是骗子？

51CTO4 天

DeepSeek团队新作：把代码变成思维链，大模型推理各种能力全面提升

DeepSeek团队最新研究，利用300多万个实例，将代码转换成思考过程，构建出数据集CODEI/O，对Qwen、Llama等模型进行了训练。用 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果