更新 | 基于北京迅为iTOP-RK3588大语言模型部署测试-新闻动态-北京迅为电子有限公司

明晚8点 | 双管齐下！两大教程即将更新

日期：2024-03-07

人工智能（AI）领域中的大模型（Large Model）逐渐成为研究的热点。大模型，顾名思义，是指拥有海量参数和高度复杂结构的深度学习模型。它的出现，不仅推动了AI技术的突破，更为各行各业带来了革命性的变化。

RK3588是瑞芯微推出的新一代旗舰级高端处理器，采用8nm工艺设计，搭载四核A76+四核A55的八核CPU和Arm高性能GPU，内置6T算力的NPU。能够高效地处理AI算法和模型，为大模型的运行提供了强大的硬件支持。

在北京迅为推出的搭载了RK3588处理器的iTOP-RK3588开发板上，使用RKLLM 工具套件支持在iTOP-RK3588平台上进行LLM（大型语言模型）模型的转换和部署。它与Hugging Face模型架构兼容（Hugging Face是广泛用于自然语言处理任务的模型架构。目前，该系统支持以下模型：LLaMA、Qwen、Qwen2和Phi-2。支持量化技术，即使用w8a8（8位权重，8位激活）和w4a16（4位权重，16位激活）精度进行模型量化。这可以在目标平台上更高效地存储和计算模型，减小内存占用。

iTOP-RK3588开发板体验大模型

为了让用户更快速的体验RKLLM ，北京迅为已经对Linux内核源码中的NPU版本进行了升级，升级到了最新的0.9.6版本，具体如下所示：

默认以将RKLLM动态库集成在了Ubuntu和Debian系统中，用户可以直接拷贝转换完成的RKLLM大预言模型和推理程序进行测试。详细说明请见NPU手册中RKLLM模型转换和测试相关步骤。

更新内容

iTOP-RK3588开发板NPU使用手册》v1.1

添加第八章RKLLM大语言测试相关章节

探索更多

官方商城论坛交流

新闻中心

公司动态行业资讯

解决方案

方案定制服务流程解决方案质量保障

服务支持

服务体系下载中心常见问题

关于迅为

公司简介荣誉资质研发实力加入我们联系我们

立即联系 TOPEET 迅为

如您有任何疑问或希望了解更多信息,
欢迎来电

关注我们

服务热线：010-85270708 010-85270716

收缩

在线客服
QQ咨询
售前咨询
售前咨询

旺旺咨询

电话咨询
01085270716

瑞芯微

龙芯

海思

意法

NXP(飞思卡尔)

三星

智能终端

方案定制

服务流程

解决方案

质量保障

服务体系

下载中心

常见问题

明晚8点 | 双管齐下！两大教程即将更新

在线客服

电话咨询