Cloud&AI
`
2025/3/6 14:39
AMD 推出完全开源的 3B 参数语言模型 Instella,媲美 Llama-3.2-3B 和 Qwen2.5-3B
0
0

AMD 今日宣布,为 Radeon RX 9070 系列开源 Linux 驱动程序,还宣布开源 Instella —— 一个完全开源的 3B 参数语言模型

AMD Instella 代表“完全开源的尖端 30 亿参数语言模型(LMs)”。这些模型在 AMD Instinct MI300X GPU 上进行了训练,根据 AMD 发布的数据,其性能与 Llama 3.2 3B、Gemma-2 2B 和 Qwen 2.5 3B 等相媲美

AMD Instella 模型是在 Instinct MI300X 硬件上从头开始训练的,并且宣称是完全开源的:

完全开源和可访问:模型权重、训练超参数、数据集和代码的完全开源发布,促进人工智能社区内的创新与合作。

IT之家附开源地址如下:

https://github.com/AMD-AIG-AIMA/Instella

免责声明:本文仅代表作者个人观点,与C114通信网无关。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。

给作者点赞
0 VS 0
写得不太好

C114简介     联系我们     网站地图

Copyright©1999-2025 c114 All Rights Reserved 沪ICP备12002291号-4

C114通信网版权所有 举报电话:021-54451141 用户注销