摘要:
LG AI Research 于2024年8月7日宣布推出了韩国首个开源人工智能模型EXAONE 3.0,这标志着韩国在由美国科技巨头以及中国和中东新兴企业主导的全球 AI 领域迈出了重要一步。EXAONE 3.0 基于 Decoder-only Transformer 架构,拥有7.8亿参数,训练数据量达到8TB,是一款专注于英语和韩语的双语模型。
LG 表示,EXAONE 3.0 的7.8B指令调整模型已经提前开源,旨在促进国内外AI研究人员进行更深入的研究,推动AI生态系统的发展。在官方测试中,EXAONE 3.0 在英语能力上达到了“全球顶级水平”,在真实用例平均分上超越了 Llama 3.0 8B、Gemma 2 9B 等模型。在数学和编码方面,EXAONE 3.0 同样表现优异,推理能力突出。
特别值得一提的是,在韩语测试中,EXAONE 3.0 在实际用例和单一基准的平均得分均排名第一。LG 还声称,与上一代产品相比,EXAONE 3.0 的推理时间缩短了56%,内存使用量减少了35%,运营成本降低了72%;与 EXAONE 1.0 相比,成本降低了6%。
EXAONE 3.0 已经在6000万个与专利、代码、数学和化学相关的专业数据案例上进行了训练,并计划在年底前扩展到1亿个案例,覆盖更多领域。模型的开源链接已提供,以便研究人员和开发者访问和使用。
请注意,这是根据提供的网页内容编写的摘要,旨在概括文章的主要内容和关键信息。
来源:IT之家【阅读原文】
© 版权声明
文章版权归作者所有,未经允许请勿转载。