0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

软硬协同优化,地平线旭日3成功部署14亿参数大语言模型

章鹰观察 来源:厂商供稿 作者:地平线 2023-09-12 13:36 次阅读

近日,地平线成功在旭日3中的BPU®️计算单元上,部署运行参数规模高达14亿的大语言模型(Large Language Model , LLM)。这不仅是业界在端侧成功部署大模型的一次突破性实践,更验证了BPU®️对先进神经网络算法的高效支持,为大模型在端侧实现产品级应用拓展了更广阔的想象空间。

大模型端侧部署的技术实践对加速智能化产业变革具有重要意义。端侧部署具备实时性、低时延优势,能够灵活支持弱网或无网等丰富场景,为终端用户提供更流畅、稳定的交互体验;同时端侧支持信息本地化处理,可有效保护用户数据与隐私安全;端侧计算还将大幅缓解云端算力压力,端云协同更会驱动产业降本提效,加速实现大模型技术的应用普惠。

然而,大模型端侧推理部署仍面临巨大挑战。区别于云端推理部署计算资源应用尽用,端侧部署大模型并实现产品级应用,则需综合考量不同应用间的计算资源分配,以及计算效率、带宽占用与功耗等各项指标。如何在众多约束条件下最大程度地提高大模型端侧推理效率是面临的首要技术挑战。此外,推理过程将大量占用内存带宽,如何在不影响推理结果的前提下减少内存访问,降低带宽依赖,进而减少推理耗时,则需要在软件工程层面进行系统优化。

作为软硬协同技术路径的坚定践行者,地平线通过硬件资源的最大化利用和软件工程的极致优化,并成功在5 TOPS算力的边缘计算芯片上部署高达14亿级参数的大语言模型。这源于旭日3所搭载的双核BPU®️伯努利计算单元对神经网络计算的原生性支持,能够在处理大语言模型方面提供高性能、低功耗的计算处理能力。另一方面,地平线通过软硬协同编译,采用算子重写、算子重排、算子融合和KV-Cache等技术,进一步优化了模型结构,实现推理速度的成倍提升。

从资源占用情况看,该大语言模型在旭日3上的应用效果表现优异,CPU占用单核60%、BPU占用单核50%,为后续其他应用预留充足的算力资源;同时在5GB/s内存带宽基础上实现了约4~5字/秒的生成速度,可充分满足实时性需求;在最能体现真实效能的FPS/Watt指标上,该模型的运行效能相较于LLaMA.cpp等纯CPU方案提升了2.5倍。这也意味着,旭日3对此大预言模型的支持性可达到产品级应用水平。

地平线现已通过GitHub开放该模型的推理代码,开发者可通过RDK X3系列开发者套件,即刻前往「NodeHub全开源机器人应用中心」推荐项目,尝鲜体验大语言模型在旭日3上的实际运行效果,更期待各位开发者参与「星光之路」活动,一同探索大模型在旭日3的上层应用落地!

我们相信,通过软硬协同的技术路径,大模型端侧应用部署将驱动人机交互方式变革,多维度提升用户智能化体验,加速“智能计算平权”时代的到来。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 地平线
    +关注

    关注

    0

    文章

    276

    浏览量

    14466
收藏 人收藏

    评论

    相关推荐

    地平线旭日X3派试用体验】开箱与板载资源介绍视频

    地平线旭日X3派的开箱视频,讲解板载资源.
    发表于 07-10 00:14

    地平线旭日X3派试用体验】烧录镜像与UBUNTU桌面环境初体验视频

    地平线旭日X3派开发板烧录镜像,以及体验UBUNTU桌面系统。
    发表于 07-10 00:24

    地平线旭日X3派试用体验】#旭日X3派首百尝鲜#资料下载及环境搭建初试

    地平线旭日X3派的新品体验官,一直想做一些不一样的东西,看到地平线旭日X3派的发布会,加之电子发烧友有开发板试用活动,果断申请。非常高兴被选中。收到开发板后打开货品,非常小巧大气
    发表于 07-12 13:45

    地平线旭日X3派试用体验】开箱+快速上手体验

    地平线旭日X3派的新品体验官,前不久开发板到了,目前玩了有一个星期左右了,先来简单发一个开箱帖子。【开箱】收到开发板的那一瞬间感觉外盒挺有趣的。盒子里面配了一块散热片、USB转
    发表于 07-17 22:31

    地平线旭日X3派试用体验】开箱篇硬件介绍

    地平线旭日X3是梦寐以求的开发板,上图,地平线是一家细心的公司,包装都做得这么精致。还带个散热片。接口:一个CSI的相机接口,板载USB有3个,包含1个USB3.0和2个USB2.0,这里是一个板载
    发表于 07-26 19:13

    地平线旭日X3派试用体验】 HHP环境搭建及简单demo演示

    地平线机器人平台用户手册 1.0 文档 (horizon.ai)前言: 前面两篇基本测试了板端跑Ubuntu Server镜像及基本外设功能,接下来测试地平线机器人平台HHP,根据
    发表于 07-31 20:18

    #旭日X3派首百尝鲜# 用solidworks画了一个旭日X3派的模型

    模型文件,只能用2021或者更高版本),和.STL文件(可用于3D打印)「地平线旭日X3派,开启你的嵌入式开发之旅」,欢迎正在阅读的你申请试用,一起交流开发心得此处下载附件
    发表于 08-31 11:18

    地平线旭日X3派试用体验】地平线旭日X3派AGV智能车设计

    地平线旭日X3派ROS-SLAM激光雷达自主导航AGV机器人原型设计。地平线旭日X3派ROS主机、副控板及驱动、控制端,通过xrbase节点调用xrmiddleware中间件API
    发表于 09-12 19:25

    地平线旭日X3M芯片赋能FITURE健身镜

    3”和“FITURE魔镜3Plus”发售,这两款健身镜均搭载了地平线旭日X3M芯片(以下简称地平线X3M)。地平线X3M芯片的开放算力
    的头像 发表于 07-06 10:27 1983次阅读

    地平线旭日X3派试用体验】地平线旭日X3派AGV智能车设计

    地平线旭日X3
    的头像 发表于 10-21 10:23 1698次阅读
    【<b>地平线</b><b>旭日</b>X<b>3</b>派试用体验】<b>地平线</b><b>旭日</b>X<b>3</b>派AGV智能车设计

    地平线旭日X3派试用-玩转串口通信

    地平线旭日X3派,开启你的嵌入式开发之旅」,欢迎正在阅读的你申请试用,一起交流开发心得
    的头像 发表于 07-22 11:27 532次阅读
    <b>地平线</b><b>旭日</b>X<b>3</b>派试用-玩转串口通信

    地平线旭日X3派试用体验】保姆级配置git与使用+C语言编写贪吃蛇

    地平线旭日X3派,开启你的嵌入式开发之旅」,欢迎正在阅读的你一起交流开发心得
    的头像 发表于 08-09 16:27 327次阅读
    【<b>地平线</b><b>旭日</b>X<b>3</b>派试用体验】保姆级配置git与使用+C<b>语言</b>编写贪吃蛇

    旭日,从地平线升起——地平线旭日X3派开箱试用

    地平线旭日X3派,开启你的嵌入式开发之旅
    的头像 发表于 11-08 15:22 596次阅读
    <b>旭日</b>,从<b>地平线</b>升起——<b>地平线</b><b>旭日</b>X<b>3</b>派开箱试用

    旭日X3派BPU部署教程系列之带你轻松走出模型部署新手村

    地平线自主研发的可编程AI加速引擎,相比GPU昂贵的价格,使用地平线旭日®X3派中BPU进行推理部署,在地平线“芯片+算法+工具链+开发平台”的模式基础之上,使之成为经济有效、高效开源的推理方案之一。
    的头像 发表于 11-29 14:37 287次阅读
    <b>旭日</b>X<b>3</b>派BPU<b>部署</b>教程系列之带你轻松走出<b>模型</b><b>部署</b>新手村

    地平线旭日3成功部署运行参数规模高达14亿的大语言模型

    地平线成功旭日3中的BPU计算单元上,部署运行参数规模高达14亿的大语言模型(Large Language Model , LLM)。这不仅是业界在端侧成功部署模型的一
    的头像 发表于 09-12 09:24 187次阅读