龙萃游戏园资讯大观 → AMD 推出完全开源的 3B 参数语言模型 Instella,媲美 Llama-3.2-3B 和 Qwen2.5-3B

AMD 推出完全开源的 3B 参数语言模型 Instella,媲美 Llama-3.2-3B 和 Qwen2.5-3B

2025-03-08 17:34:28      小编:龙萃游戏园      

本站 3 月 6 日消息,AMD 今日宣布,为 Radeon RX 9070 系列开源 Linux 驱动程序,还宣布开源 Instella —— 一个完全开源的 3B 参数语言模型。

AMD Instella 代表“完全开源的尖端 30 亿参数语言模型(LMs)”。这些模型在 AMD Instinct MI300X GPU 上进行了训练,根据 AMD 发布的数据,其性能与 Llama 3.2 3B、Gemma-2 2B 和 Qwen 2.5 3B 等相媲美。

AMD Instella 模型是在 Instinct MI300X 硬件上从头开始训练的,并且宣称是完全开源的:

完全开源和可访问:模型权重、训练超参数、数据集和代码的完全开源发布,促进人工智能社区内的创新与合作。

本站附开源地址如下:

https://github.com/AMD-AIG-AIMA/Instella

  • 猜你喜欢
  • 相关手机游戏
  • 最新手机精选