大语言模型涉及对高性能硬件(如 GPU、TPU)、大规模高质量数据集的需求以及软件算法的提高等多方面要求。
1.HBM 技术:高吞吐高带宽,AI 带动需求激增
HBM(High Bandwidth Memory)意为高带宽存储器,是一种硬件存储介质,是高性能 GPU 的核心组件。HBM 具有高吞吐高带宽的特性,受到工业界和学术界的关注。它单颗粒的带宽可以达到 256 GB/s,远超过 DDR4 和 GDDR6。DDR4 是 CPU 和硬件处理单元的常用外挂存储设备,但是它的吞吐能力不足以满足当今计算需求,特别是在 AI 计算、区块链和数字货币挖矿等大数据处理访存需求极高的领域。GDDR6 也比不上 HBM,它单颗粒的带宽只有 64 GB/s,是HBM 的 1/4。而 DDR4 3200 需要至少 8 颗粒才能提供 25.6 GB/s 的带宽,是 HBM 的 1/10。
HBM 使用多根数据线实现高带宽,完美解决传统存储效率低的问题。HBM 的核心原理和普通的 DDR、GDDR 完全一样,但是 HBM 使用多根数据线实现了高带宽。HBM/HBM2 使用 1024 根数据线传输数据,作为对比,GDDR 是 32 根,DDR 是 64 根。HBM 需要使用额外的硅联通层,通过晶片堆叠技术与处理器连接。这么多的连接线保持高传输频率会带来高功耗。因此 HBM 的数据传输频率相对很低,HBM2 也只有 2 Gbps,作为对比,GDDR6 是 16 Gbps,DDR4 3200 是3.2 Gbps。这些特点导致了 HBM 技术高成本,容量不可扩,高延迟等缺点。
HBM 可以被广泛的应用到汽车高带宽存储器,GPU 显存芯片,部分 CPU 的内存芯片,边缘 AI加速卡,Chiplets 等硬件中。在高端 GPU 芯片产品中,比如 NVDIA 面向数据中心的 A100 等加速卡中就使用了 HBM;部分 CPU 的内存芯片,如目前富岳中的 A64FX 等 HPC 芯片中也有应用到。车辆在快速移动时,摄像头、传感器会捕获大量的数据,为了更快速的处理数据,HBM是最合适的选择。Chiplets 在设计过程中没有降低对内存的需求,随着异构计算(尤其是小芯片)的发展,芯片会加速对高带宽内存的需求,无论是 HBM、GDDR6 还是 LPDDR6。
HBM 缓解带宽瓶颈,是 AI 时代不可或缺的关键技术。AI 处理器架构的探讨从学术界开始,当时的模型简单,算力低,后来模型加深,算力需求增加,带宽瓶颈出现,也就是 IO 问题。这个问题可以通过增大片内缓存、优化调度模型等方法解决。但是随着 AI 大模型和云端 AI处理的发展,计算单元剧增,IO 问题更严重了。要解决这个问题需要付出很高的代价(比如增加 DDR 接口通道数量、片内缓存容量、多芯片互联),这便是 HBM 出现的意义。HBM 用晶堆叠技术和硅联通层把处理器和存储器连接起来,把 AI/深度学习完全放到片上,提高集成度,降低功耗,不受芯片引脚数量的限制。HBM 在一定程度上解决了 IO 瓶颈。未来人工智能的数据量、计算量会越来越大,超过现有的 DDR/GDDR 带宽瓶颈,HBM 可能会是唯一的解决方案。
巨头领跑,各大存储公司都已在 HBM 领域参与角逐。SK 海力士、三星、美光等存储巨头在HBM 领域展开了升级竞赛,国内佰维存储等公司持续关注 HBM 领域。SK 海力士早在 2021 年10 月就开发出全球首款 HBM3,2022 年 6 月量产了 HBM3 DRAM 芯片,并将供货英伟达,持续巩固其市场领先地位。三星也在积极跟进,在 2022 年技术发布会上发布的内存技术发展路线图中,HBM3 技术已经量产。
2、Chiplet技术:全产业链升级降本增效,国内外大厂前瞻布局
Chiplet 即根据计算单元或功能单元将 SOC 进行分解,分别选择合适制程工艺制造。随着处理器的核越来越多,芯片复杂度增加、设计周期越来越长,SoC 芯片验证的时间、成本也急剧增加,特别是高端处理芯片、大芯片。当前集成电路工艺在物理、化学很多方面都达到了极限,大芯片快要接近制造瓶颈,传统的 SoC 已经很难继续被采纳。Chiplet,俗称小芯片、芯粒,是将一块原本复杂的 SoC 芯片,从设计的时候就按照不同的计算单元或功能单元进行分解,然后每个单元分别选择最合适的半导体制程工艺进行制造,再通过先进封装技术将各自单元彼此互联。Chiplet 是一种类似搭乐高积木的方法,能将采用不同制造商、不同制程工艺的各种功能芯片进行组装,从而实现更高良率、更低成本。
Chiplet 可以从多个维度降低成本,延续摩尔定律的“经济效益”。随着半导体工艺制程推进,晶体管尺寸越来越逼近物理极限,所耗费的时间及成本越来越高,同时所能够带来的“经济效益”的也越来越有限。Chiplet 技术可从三个不同的维度来降低成本:
(1)可大幅度提高大型芯片的良率:芯片的良率与芯片面积有关,Chiplet 设计将大芯片分成小模块可以有效改善良率,降低因不良率导致的成本增加。
(2)可降低设计的复杂度和设计成本:Chiplet 通过在芯片设计阶段就将 Soc 按照不同功能模块分解成可重复云涌的小芯粒,是一种新形式的 IP 复用,可大幅度降低设计复杂度和成本累次增加。
(3)可降低芯片制造的成本:在 Soc 中的一些主要逻辑计算单元是依赖于先进工艺制程来提升性能,但其他部分对制程的要求并不高,一些成熟制程即可满足需求。将Soc进行Chiplet化后对于不同的芯粒可选择对应合适的工艺制程进行分开制造,极大降低芯片的制造成本。
Chiplet 为全产业链提供了升级机会。在后摩尔时代,Chiplet 可以开启一个新的芯片生态。2022年 3 月,Chiplet的高速互联标准——UCIe(UniversalChiplet Interconnect Express,通用芯粒互联技术)正式推出,旨在芯片封装层面确立互联互通的统一标准,打造一个开放性的 Chiplet 生态系统。巨头们合力搭建起了统一的 Chiplet 互联标准,将加速推动开放的Chiplet 平台发展,并横跨 x86、Arm、RISC-V 等架构和指令集。Chiplet 的影响力也从设计端走到芯片制造与封装环节。在芯片小型化的设计过程中,需要添加更多 I/O 与其他芯片芯片接口,裸片尺寸必须要保持较大的空白空间。而且,要想保证 Chiplet 的信号传输质量就需要发展高密度、大宽带布线的先进封装技术。另外,Chiplet 也影响到从 EDA 厂商、晶圆制造和封装公司、芯粒 IP 供应商、Chiplet 产品及系统设计公司到 Fabless 设计厂商的产业链各个环节的参与者。
(1)最先受到影响的是芯片 IP 设计企业,Chiplet 本质就是不同的 IP 芯片化,国内类似 IP 商均有望参与其中,比如华为海思有 IP 甚至指令集开发实力的公司,推出基于 RISC-V 内核的处理器(玄铁 910)阿里平头哥半导体公司,独立的第三方 IP 厂商,如芯动科技、芯原股份、芯耀辉、锐成芯微、芯来等众多 IP 公司等。
(2)Chiplet 需要 EDA 工具从架构探索、芯片设计、物理及封装实现等提供全面支持,为国内 EDA 企业发展带来了突破口。芯和半导体已全面支持 2.5D Interposer、3DIC 和 Chiplet 设计。
(3)Chiplet 也推动了先进封装技术的发展。根据长电科技公告,在封测技术领域取得新的突破。4nm 芯片作为先进硅节点技术,是导入 Chiplet 封装的一部分通富微电提供晶圆级及基板级封装两种解决方案,其中晶圆级 TSV 技术是 Chiplet 技术路径的一个重要部分。
国外芯片厂率先发力,通过 Chiplet 实现收益。AMD 的 EPYC 率先采用了 Chiplet 结构,实现了在服务器 CPU 市场上的翻身。随后,Ryzen 产品上重用了 EYPC Rome 的 CCD,这样的 chiplet设计极好的降低了总研发费用。2023 年 1 月,Intel 发布了采用了 Chiplet 技术的第四代至强可扩展处理器 Sapphire Rapids 以及英特尔数据中心 GPU Max 系列等。Sapphire Rapids是 Intel 首个基于 Chiplet 设计的处理器,被称为“算力神器”。Xilinx 的 2011 Virtex-72000T 是 4 个裸片的 Chiplet 设计。Xilinx 也是业界唯一的同构和异构的 3D IC。
3、CPO 技术:提升数据中心及云计算效率,应用领域广泛
CPO(Co-packaged,共封装光学技术)是高速电信号能够高质量的在交换芯片和光引擎之间传输。在 5G 时代,计算、传输、存储的带宽要求越来越高,同时硅光技术也越来越成熟,因此板上和板间的光互连成为了一种必要的方式。随着通道数大幅增加,需要专用集成电路(ASIC)来控制多个光收发模块。传统的连接方式是 Pluggable(可插拔),即光引擎是可插拔的光模块,通过光纤和 SerDes 通道与网络交换芯片(AISC)连接。之后发展出了 NPO(Near-packaged,近封装光学),一种将光引擎和交换芯片分别装配在同一块 PCB 基板上的方式。而CPO 是一种将交换芯片和光引擎共同装配在同一个 Socketed(插槽)上的方式,形成芯片和模组的共封装,从而降低网络设备的功耗和散热问题。NPO 是 CPO 的过渡阶段,相对容易实现,而 CPO 是最终解决方案。
随着大数据及 AI 的发展,数据中心的需求激增,CPO 有着广泛的应用前景。在数据中心领域,CPO 技术可以实现更高的数据密度和更快的数据传输速度,还可以减少系统的功耗和空间占用,降低数据中心的能源消耗和维护成本,能够应用于高速网络交换、服务器互联和分布式存储等领域,例如,Facebook 在其自研的数据中心网络 Fabric Aggregator 中采用了CPO 技术,提高了网络的速度和质量。在云计算领域,CPO 技术可以实现高速云计算和大规模数据处理。例如微软在其云计算平台 Azure 中采用了 CPO 技术,实现更高的数据密度和更快的数据传输速度,提高云计算的效率和性能。
在 5G 通信领域,CPO 技术可以实现更快的无线数据传输和更稳定的网络连接。例如华为在其 5G 通信系统中采用了 CPO 技术,将收发器和芯片封装在同一个封装体中,从而实现了高速、高密度、低功耗的通信。除此之外,5G/6G 用户的增加,人工智能、机器学习 (ML)、物联网 (IoT) 和虚拟现实流量的延迟敏感型流量激增,对光收发器的数据速率要求将快速增长;AI、ML、VR 和 AR 对数据中心的带宽要求巨大,并且对低延迟有极高的要求,未来 CPO 的市场规模将持续高速扩大。
审核编辑 :李倩
相关推荐
, 继承了该接口的诸多优点,也更适合此类场景应用,为用户提供了一种算力边缘侧部署的解决方案,同时MXM接口还可以为用户提供其它架构算力模块搭配方案,如MXM界面的寒武纪算力卡,MXM界面的登临算力卡等
发表于 05-18 15:52
目的本文介绍广州星嵌DSP C6657+Xilinx Zynq7035平台下Xilinx Zynq7035算力指标。基本概念FLOPs/FLOPSFLOPs,Floating Point
发表于 12-15 21:19
电工技术和电子技术△电工学在生活、学习、国防、工作等中的应用△电工学在科学技术界的地位技术基础课基本知识、基本理论、基本技能电路模型:强调共性;电路实体:强调应用。电工学在水利工程等中的相关应用电
发表于 09-24 12:00
作为颠覆平板电视、电脑、电影等传统收看方式的技术革命,3D技术以前所未有的冲击力迅速成为市场消费热点,毫无疑问,3D技术的发展已经势不可挡,相关专家预测,未来几年内,3D功能将成为高端
发表于 08-09 16:41
今日话题“MEMS技术打破可穿戴医疗大屏障” 现在,可穿戴医疗成为人们关注的新焦点,市场呈现大爆发趋势,各种可穿戴医疗产品琳琅满目。但是实实在在接地气的确并不多,可穿戴医疗要想真正进入寻常百姓
发表于 09-09 19:30
进入国家电网系统的企业,打破欧美等国家对我国在这一市场领域的技术垄断,加快了国家智能电网“中国芯”国产化的步伐。IGBT器件作为电压控制型器件,具有容量大、损耗小、易于控制等优点,可使换流器拓扑结构更加
发表于 01-30 10:18
经常看到不少同事工作中也很努力,安排的事情也都努力去做,但是其技术技能的提高却非常有限,哪怕反复的培训,扩大知识面等,效果也不明显,似乎到了某一种瓶颈,被封住了。这种情况,不仅其本人无奈,公司也很
发表于 07-21 13:29
的科技结晶,它强大的压缩渲染技术也将打破过去3D模型无法在移动端高保真交互的尴尬境地。今年四月,眸瑞科技自主研发的AMR技术和老子云平台等项目的上线,势必将会引领一场互联网科技风波大战。
发表于 04-06 10:29
HBM传感器 HBM称重仪表,HBM称重传感器,HBM称重传感器模块,HBM称重显示器上海瑞堂机电设备有限公司代理销售德国 HBM称重仪表,HBM称重传感器,HBM称重传感器模块,HBM称重显示器等
发表于 04-18 14:30
摘要: 如何避免自己成为整个团队的瓶颈?如何让集体成为真正的团队?我们需要怎样的工程师?团队效能的未来在哪里?阿里云效邀请了阿里巴巴高级技术专家李云(花名至简),亲情讲解团队效能动力模型,破解团队
发表于 06-06 21:28
,目前我国使用手机支付的用户总数已超过500万。“我们很高兴地看到,越来越多的网络运营商开始把手机支付和网上支付结合起来。”张琪向本报记者表示,通过RFID这一核心技术开展支付业务,最好的终端就是手机,手机支付将打破各种费用支付的瓶颈,“中国拥有4亿手机用户,这个数字还在不断的增长中,潜力巨大。”
发表于 07-01 06:56
由于移动性和成本的优势,无线通信领域的新用户和新服务不断增多,市场对于无线通信技术的需求也持续升温。不断发展的射频技术会催生出更加尖端的测量仪器。在3G热火朝天、4G初露端倪的时代,射频测量仪器有哪些技术瓶颈?又有哪些创新技术呢?
发表于 08-06 06:17
WiMAX(全球互通微波接入)技术是以IEEE 802.16系列标准为基础的宽带无线接入技术,可以在固定和移动的环境中提供高速的数据、语音和视频等业务,兼具了移动、宽带和IP化的特点,近年来发展迅速
发表于 08-12 07:51
,矿机的归属权上。托管的矿机你已经买下了,它就是你的啦,而你只是放在矿场委托维护管理而已;而云矿机的话,那矿机不是你的,你只是租下它某个时段的算力而已。而云算力的概念其实和云矿机差不多哦,如果说云矿机
发表于 07-02 15:38
云算力矿机租赁平台,IPFS算力租赁app专业的区块链技术开发公司,有现成的云算力租赁系统开发可以咨询13823153121Q:1992891126云算力开发系统可分为两大类:? ? 1.独立运作
发表于 10-11 17:10
本文介绍一种称为无间断捕获的RF录存技术,它将打破射频干扰难捕获的僵局。
发表于 04-30 06:48
和质量一致性、技术亟待创新突破等问题。许多锂电池相关事故的原因,都指向锂电池的质量缺陷问题,比如生产过程中引入毛刺,活性物质涂覆不均,极耳焊接工艺缺陷等问题。从实践中看,在规范实施系统性质量管
发表于 05-07 10:11
晶体管技术方案面临了哪些瓶颈?
发表于 05-26 06:57
代码冗长和在不同设计阶段重新利用模型时很难更改的问题,在团队间用于交流的需求、技术规范、测试等其他文档也可能引起歧义和误解。 基于高层次抽象的建模和可综合的逻辑代码自动生成技术成为被重点关注和研究的领域
发表于 06-08 09:29
已下是rx580显卡算力9-11 Mh 没有开启计算模式,挖几分种重启自动开启,计算模式只支持WIN1022-28 Mh 原版BIOS,开启时序,并设置超频29-32 Mh 正常算力,卡体质不同算力
发表于 07-23 06:59
背景介绍数据、算法和算力是人工智能技术的三大要素。其中,算力体现着人工智能(AI)技术具体实现的能力,实现载体主要有CPU、GPU、FPGA和ASIC四类器件。CPU基于冯诺依曼架构,虽然灵活,却
发表于 07-26 06:47
机,投*资者需要考虑场地、运维、电费等费用和投入精力来维护矿机。运算力,只需支付管理费(前期付费和后期收益费用)。风险大小:购买矿机挖矿后,退出只能变卖矿机硬件。云算力在一些制度上会保障投*资者
发表于 08-24 17:45
当今的移动应用都向着智能化和多样化方向发展,例如AI辅助,VR/AR应用,沉浸式游戏等。然而现实中的移动设备,因为便携性要求受限于尺寸、电池容量以及温控等要求,往往在算力、能耗以及所支持的输入输出
发表于 11-15 14:54
NPU算力集成有哪些特性呢?RK1808内置的NPU算力集成有何功能?
发表于 02-16 07:52
智能技术,总体上说,机器学习主要需要三个阶段,训练、推理,其中由于训练的模型需要较高的算力和计算机性能要求,一般的步骤是在服务器上或是高性能计算机上进行训练后,形成成熟的模型后,再将模型进行剪枝、蒸馏
发表于 02-27 23:28
基于注意力机制等的社交网络热度预测模型
发表于 06-07 15:12
•14次下载
新能源汽车电池、电机等关键技术成为技术瓶颈
顶着高科技光环的新能源汽车近期频频在各大车展高调亮相,然而
发表于 02-21 08:35
•1254次阅读
现如今的人工智能的神经网络与GPU密不可分,但是GPU的算力对于未来神经网络的发展是不够用的,好在IBM全新AI芯片设计,能够解决GPU的算力瓶颈。
发表于 06-13 09:28
•1170次阅读
分享会从 AI 算力的现状和趋势谈起,并从硬件设计和算法优化两个层面切入,剖析算力提升的最新落地经验和误区,最后针对算力成本居高不下的普遍现状,引入算力的新型协作方式---借用区块链生态的分布式协作,大幅降
发表于 08-01 16:08
•7830次阅读
在上周的文章里,大白给大家介绍了《什么是51%算力攻击》。对于采用PoW共识机制的加密货币而言,矿工掌握了该区块链超过50%的算力,就可以做恶:双花、压制某些地址发送/接受Token等。
所以
发表于 05-07 10:24
•3727次阅读
HPC 是算力坊内生的生态系统代币,支撑着算力坊项目的运行,是算力坊生态系统中重要的支付载体, HPC 将算力坊数万台矿机算力为价值担保,提供可靠的去中心化加密货币算力服务。
发表于 08-26 11:51
•1121次阅读
把“命门”掌握在自己手中。
摩尔定律提出后的半个多世纪,日趋走向瓶颈的集成技术加上更高算力的巨大需求,一再将它推向终结。
发表于 09-11 14:58
•3808次阅读
“人类生产力发展已经进入算力时期,计算能力成为这个时期最强大的新型生产力。”中国移动副总裁李正茂曾作如上表述。在安防行业,随着AI技术的不断渗透,技术价值中心也逐渐由软件算法层向核心算力曾转移。近年来许多安防企业也逐渐意识到在数据、算法层的领先无法完全覆盖产业竞
发表于 09-21 09:57
•544次阅读
云算力挖矿是指用户在平台上购买算力合约,租赁一定量的算力进行挖矿,并在合约期限内定时获取数字币的挖矿方式。目前提供云算力挖矿的主流平台有火币矿池、算力巢、KGfire、Nicehash等。
发表于 11-20 11:44
•6346次阅读
周志华表示,当今的人工智能热潮是由于机器学习,特别是其中的深度学习技术取得巨大进展,在大数据、大算力的支持下发挥出巨大的威力。机器学习算法模型用了更多数据和算力后,获得的性能增长可能远超算法模型设计者的预想。但是,把模型“做大”要付出
发表于 08-28 10:30
•1.2w次阅读
MicroLED作为未来显示技术潮流,在显示屏行业是炙手可热。然而相比已经初步实现市场化的MiniLED,MicroLED还存在一些技术难点和瓶颈亟待解决,比如说成本高、巨量转移技术、检测技术,以及如何进一步推动市场应用落地等方面。
发表于 08-31 11:22
•3571次阅读
Chiplet SiP的 2.5D/3D封装,以及晶圆级封装,并且利用晶圆级技术在射频特性上的优势推进扇出型(Fan-Out)封装。此外,我们也在开发部分应用于汽车电子和大数据存储等发展较快的热门封装类型。”包旭升指出。
发表于 09-17 17:43
•8296次阅读
采用Chiplet技术的光口速率可以达到惊人的2Tbps。而本文介绍的同样采用Chiplet技术的HBM,访存带宽高达425GB/s,那么采用这样光口和缓存的网卡会是一种怎样的高性能呢?对NIC或者
发表于 11-08 10:56
•8046次阅读
前言: 算力正取代电力,成为新基建的核心。因为算力是数字经济时代的基础设施,是新的生产力。在新基建和5G、云、AI和IoT的大技术趋势下,多元算力将迎来爆发。 新基建的背后需要算力作支撑 算力
发表于 10-16 11:36
•2505次阅读
然而在此过程中,我们除了看到AI对算力的要求以外,内存带宽也是限制AI芯片发展的另一个关键要HBM2E成为了AI芯片的一个优先选择,这也是英伟达在Tesla A100和谷歌在二代TPU上选择这个内存方案的原因。
发表于 11-09 12:45
•1933次阅读
从 DARPA 的 CHIPS 项目到 Intel 的 Foveros,都把 chiplet 看成是未来芯片的重要基础技术。简单来说,chiplet 技术就是像搭积木一样,把一些预先生产好的实现特定
发表于 01-04 15:58
•4.8w次阅读
随着企业上云和数字化转型升级的不断深化,云计算在人工智能领域的重要作用日渐凸显,许多人工智能模型训练都需要高性能计算。CLOUDAM云端自主研发的云E算力平台能够为有算力需求的企业和个人用户提供
发表于 03-12 13:52
•438次阅读
随着技术的进步和社会经济的发展,高性能计算的基础设施建设也在不断扩大,出现了许多超级计算中心、云计算数据中心以及公有云厂商所建立的各种公有云平台等不同形态的算力基础设施。而北鲲云超算平台是基于公有云的自主研发的算力SaaS平台。其最大的特点是,为有
发表于 07-16 11:24
•1824次阅读
。 算力、数据、算法是数字经济发展的三大主导因素,算力是推动数字经济发展的根基所在,是新一代技术的引擎,正在成为这个时代最强大的生产力之一。如何加快先进计算的基础研究和应用发展,逐渐成为各国在数字经济领域抢占竞
发表于 11-16 09:27
•1385次阅读
功能上无法对智能化沉浸式体验的应用提供全方位的支持,导致很多应用场景难以得到实现。 为了解决移动端算力瓶颈,HarmonyOS跨端分布式计算应运而生,给用户带来易协同、低延迟和高稳定的分布式体验。下面,我们将对跨端分布式计算技术
发表于 11-17 16:34
•2284次阅读
Chiplet Interconnect Express)产业联盟。作为中国大陆首批加入该组织的企业,芯原将与UCIe产业联盟其他成员共同致力于UCIe 1.0版本规范和新一代UCIe技术标准的研究与应用,为芯原Chiplet技术和产品的发展进一步夯实基础。
发表于 04-02 11:47
•1017次阅读
华为数据通信产品线研发总裁刘少伟接受央视《对话》栏目的采访,畅谈“东数西算”和算力时代,阐述华为如何基于“IPv6+”创新技术打造算力时代的联接底座,并提出算力网络的长期目标是构建 “全国一台计算机”,算力
发表于 04-18 12:37
•1297次阅读
由基于CPU芯片的服务器所提供的算力,主要用于基础通用计算。日常提到的云计算、边缘计算等都属于基础算力,它为移动计算、物联网等提供计算支持。基础算力占整体算力的比重由2016年的95%下降至2020年的57%,但其依旧是
发表于 05-13 14:36
•3411次阅读
电子发烧友网报道(文/李弯弯)前不久,后摩智能宣布,其自主研发的业内首款存算一体大算力AI芯片成功点亮,并成功跑通智能驾驶算法模型。 这是存算一体在大算力方向的一大进展,早在一年前,就有行业人士
发表于 05-31 00:03
•3624次阅读
在人工智能、工业互联网等国家战略领域的呼唤之下,算力成为拉动数字经济持续健康发展的新引擎。而算力服务作为东数西算及算力经济的核心支撑,成为业内关注的热点,大量参与者纷纷涌入。
发表于 06-09 14:34
•1034次阅读
算力网络基础设施的普及是智能时代标志之一。随着5G、IoT、人工智能、工业互联网等技术的逐步成熟,“新基建”成为我们国家下一步基础设施建设的大方向。
发表于 06-10 16:47
•1626次阅读
近几年,随着传统冯·诺依曼结构的瓶颈逐渐显现,越来越多企业投身于存算一体芯片研发的浪潮中,试图打破“存算墙”、“能耗墙”和“编译墙”对AI应用进一步发展带来的掣肘,在 “超摩尔时代”走出新的道路。尽管有着相似的目标,但各企业采取的技术路线却不尽相同。
发表于 06-20 08:00
•2660次阅读
算网大脑作为算力网络的中枢核心,主要实现算力感知、算网统一调度、算网智能编排等。
发表于 06-20 16:05
•1612次阅读
电子发烧友网报道(文/李弯弯)过去几年,越来越多企业加入到存算一体技术的研究中,如今,存算一体芯片已经逐渐走向商用。 从目前入局的企业来看,路线各异,包括采用不同类型的存储器,从中小算力入手
发表于 06-21 09:27
•2690次阅读
事实上,由于算力网络涉及多技术领域,但当前算力和网络各自的技术体系、架构实现和发展路径不同,大部分交叉领域的理论研究和技术攻关等工作仍处于起步阶段,因此要实现算网融合并不容易。
发表于 07-07 11:04
•826次阅读
算力时代已经来临,家庭和行业的智能化应用驱动算力需求迅猛增长。河北移动携手华为推出算力应用感知APS(Application Sense)方案,结合IPv6+技术打造一体化算网底座,提供算力应用加速
发表于 07-21 09:41
•791次阅读
Chiplet的概念其实很简单,就是硅片级别的重用。从系统端出发,首先将复杂功能进行分解,然后开发出多种具有单一特定功能、可相互进行模块化组装的裸芯片,如实现数据存储、计算、信号处理、数据流管理等功能,并最终以此为基础,建立一个Chiplet的芯片网络。
发表于 08-11 11:45
•1583次阅读
算力网络的核心特征,是它通过算力,实现了对算力资源、网络资源的全面接管,可以让网络实时感知用户的算力需求,以及自身的算力状态。经过分析后,算力网络可以调度不同位置、不同类型的算
发表于 08-17 09:32
•1591次阅读
超高速、超高密度和超低延时的封装技术,用来解决Chiplet之间远低于单芯片内部的布线密度、高速可靠的信号传输带宽和超低延时的信号交互。目前主流的封装技术包括但不限于MCM、CoWoS、EMIB等。
发表于 08-17 11:33
•912次阅读
在第34届Hot Chips大会上,英特尔CEO帕特·基辛格发表了主题演讲,详细阐述了为什么需要先进的计算和封装技术来满足世界对于算力不断增长的需求,同时实现完全沉浸式的数字体验。
发表于 08-27 11:16
•518次阅读
目前,算力要想进一步提升,遇到非常大的挑战:一方面,基于CPU的性能已经到达瓶颈,摩尔定律失效;另一方面,通过AI-DSA等加速方式提供的算力灵活性、易用性都很差,导致算力的利用率很低,芯片的落地规模很小。
发表于 08-30 09:30
•893次阅读
在刚刚结束的GTIC 2022全球AI芯片峰会存算一体专题论坛上,亿铸科技创始人、董事长兼CEO熊大鹏博士发表了题为“存算新动能——基于ReRAM的全数字化实现”的演讲,介绍了亿铸科技基于ReRAM的全数字化存算一体AI大算力芯片技术等深度内容,以下为演讲回顾。
发表于 09-01 11:50
•1250次阅读
电子发烧友网报道(文/李弯弯)AI、5G等新兴产业的蓬勃发展催生了海量数据计算需求,同时AI算法模型持续迭代,复杂化日益凸显,数字经济时代下市场需要强大、普惠的算力引擎。而从供给端来看,先进
发表于 09-02 08:46
•1691次阅读
9月3日上午, “算尽其用·AI算力中心建设新实践”云端AI算力产业论坛在2022世界人工智能大会上隆重召开,来自人工智能算力领域院士专家、政府、科研院所和产业界的领导、学者和专家齐聚一堂,对人工智能领域算力
发表于 09-05 10:48
•569次阅读
当前,算力已经成为继热力、电力之后新的关键生产力。数字化转型背景下,工业、能源、交通等领域对AI算力需求巨大。凭借多年技术沉淀和落地实践,昆仑芯(北京)科技有限公司(简称“昆仑芯科技”)在AI芯片
发表于 10-19 16:31
•908次阅读
最近两天经常看到Chiplet这个词,以为是什么新技术呢,google一下这不就是几年前都在提的先进封装吗。最近资本市场带动了芯片投资市场,和chiplet有关的公司身价直接飞天。带着好奇今天扒一扒
发表于 10-20 17:42
•4422次阅读
感谢《半导体行业观察》对新思科技的关注 Chiplet是摩尔定律放缓情况下,持续提高SoC高集成度和算力的重要途径。目前业内已有多家企业发布了基于Chiplet技术的芯片,Chiplet俨然已成为各
发表于 11-10 11:15
•305次阅读
随着摩尔定律的放缓,Chiplet成为持续提高SoC集成度和算力的重要途径。目前业内已有多家企业发布了基于Chiplet技术的芯片,Chiplet俨然已成为各芯片厂商进入下一个关键创新阶段,并打破
发表于 11-23 07:10
•341次阅读
在需求驱动下,中国算力产业链条持续完善,包括算力设施、算力平台、算力服务等在内的具有国际竞争力的算力产业生态初步形成,一批具有示范效应的算力平台、新型数据中心以及产
发表于 11-24 15:02
•736次阅读
有许多成熟的模型可以针对ESD事件测试半导体器件的可靠性,以确保有效性和可靠性。主要的ESD测试是人体模型(HBM),机器模型(MM)和充电设备模型(CDM)(图1)。
发表于 11-30 16:28
•1409次阅读
数据中心和超算需要高于1000 TOPS的高算力芯片。当前,超算中心算力已经进入E级算力(百亿亿次运算每秒)时代,并正在向Z(千E)级算力发展。2022年5月登顶世界超算500强榜单的美国国防部橡树
发表于 12-09 11:29
•1274次阅读
未来集成电路将通过计算范式、芯片架构和集成方法等创新,突破高算力发展瓶颈。具体创新方法为:Chiplet异质集成提高晶体管数量、存算一体技术提高每单位器件的算力、可重构异构计算架构提高算力扩展
发表于 12-12 15:50
•344次阅读
不断发展的人工智能也对芯片的算力提出更高的要求。人工智能的应用对于算力最大的挑战依然来自于核心数据中心的模型训练,近年来,算法模型的复杂度呈现指数级增长趋势,正在不断逼近算力的上限。
发表于 12-12 15:53
•1400次阅读
算力网络的核心特征,是它通过算力,实现了对算力资源、网络资源的全面接管,可以让网络实时感知用户的算力需求,以及自身的算力状态。经过分析后,算力网络可以调度不同位置、不同类型的算
发表于 12-14 16:09
•1826次阅读
算力网络是什么意思 东数西算想必大家都知道,很长一段时间内“东数西算”都是热议焦点,要知道在数字经济时代,算力是数字化转型的重要抓手,算力将成为未来国民经济发展的重要基础设施。那么算力网络
发表于 12-14 17:55
•1520次阅读
芯动科技 x 智东西公开课 随着单一芯片的晶体管数达到百亿级别,几乎逼近摩尔定律的极限,想要通过堆叠晶体管的方式实现芯片算力、性能提升的目的也愈加艰难。为了突破物理层面上的技术难点,同时也为了实现
发表于 12-16 11:30
•362次阅读
未来集成电路将通过计算范式、芯片架构和集成方法等创新,突破高算力发展瓶颈。具体创新方法为:Chiplet异质集成提高晶体管数量、存算一体技术提高每单位器件的算力、可重构异构计算架构提高算力扩展
发表于 12-23 10:49
•750次阅读
演讲,就行业Chiplet技术热点和芯动Innolink Chiplet核心技术,与腾讯、阿里、中兴、百度、是得科技等知名企业,以及中科院物理所、牛津大学、上海交大等学术科院领域名家交流分享,共同助推Chiplet互连技术的创新与应用
发表于 12-23 20:55
•1071次阅读
发表了《智能时代,Chiplet 如何助力高性能计算突破算力瓶颈》的主题演讲。祝俊东向现场各位来宾介绍了基于Chiplet 的异构计算体系的优势和挑战,奇异摩尔在Chiplet体系方面的技术优势,以及如何帮助高算力客户高
发表于 12-27 17:46
•831次阅读
在摩尔定律已接近极致的当下,Chiplet技术由于可以有效的平衡芯片效能、成本以及良率之间的关系,近年来深受人们关注。尤其是在国产芯片遭遇种种技术封锁的背景下,人们对于国产芯片通过Chiplet技术绕开先进制程领域遭到的封锁饱含期待。
发表于 01-16 15:28
•273次阅读
模型构建、训练和推理的业务全流程,赋力生成式AI产业创新。目前,AI算力服务相关信息已在元脑生态AIStore平台上线,包括有多种算力、数据、算法等可选产品,并提供进一步购买和试用咨询。 近年来,人工智能大模型技术
发表于 02-11 20:59
•265次阅读
目前阶段开始有同构集成。国际上已经有异构集成CPU+GPU+NPU的Chiplet,其他功能芯片则采用次先进工艺制程的芯粒,感存算一体属于3DIC的Chiplet这样的方案可以灵活堆出算力高达200tops。
发表于 02-14 15:00
•939次阅读
算力是AIGC应用背后的关键,AIGC对算力有哪些需求?企业若想大力发展AIGC,在算力方面方面应该做哪些部署?
发表于 02-15 14:32
•692次阅读
在“算力交易平台”上线仪式上,中科曙光副总裁、曙光智算总经理曹振南表示,曙光依托在大型算力设施、算力资源调度、 算力生态建设等领域优势,正助“算力交易平台”成为宁夏数字产业“聚合器”,以先进
发表于 02-27 11:15
•1200次阅读
“大数据+大算力+强算法=大模型”是当前人工智能发展的主要技术路径。语言大模型ChatGPT成为现象级应用,人工智能进入普及应用的新时期。 智源研究院2020年搭建大模型攻关团队,2021年6月推出
发表于 03-01 15:10
•185次阅读
AI开放生态实验室”,加速完善软硬件生态建设。 FlagOpen大模型技术开源体系是由智源研究院与多家企业、高校和科研机构共建的一站式、高质量的大模型开源开放软件体系,包括大模型算法、模型、数据、工具、评测等重要组成部分,旨在建设大
发表于 03-10 17:09
•729次阅读
嵌入式 AI AI 简报 20230317 期 1. AI服务器市场规模持续增加,国内存在哪些算力瓶颈? 原文: https://mp.weixin.qq.com/s
发表于 03-21 14:35
•390次阅读
与SoC相反,Chiplet是将一块原本复杂的SoC芯片,从设计时就先按照不同的计算单元或功能单元对其进行分解,然后每个单元选择最适合的半导体制程工艺进行分别制造,再通过先进封装技术将各个单元彼此互联,最终集成封装为一个系统级芯片组。
发表于 03-29 10:59
•218次阅读
电子发烧友网报道(文/李弯弯)大模型的训练和推理需要高性能的算力支持。以ChatGPT为例,据估算,在训练方面,1746亿参数的GPT-3模型大约需要375-625台8卡DGX A100服务器训练
发表于 04-03 00:28
•2213次阅读
Chiplet技术对芯片设计与制造的各个环节都带来了剧烈的变革,首当其冲的就是chiplet接口电路IP、EDA工具以及先进封装。
发表于 04-03 11:33
•103次阅读
对于高阶版行泊一体,需要接入更多路、更高分辨率的摄像头,以及 4D 毫米波雷达、激光雷达,BEV+Transformer神经网络模型更大更复杂,甚至还可能需要支持本地算法训练,因此对算力需求足够高,CPU 算力至少要达到 150KDMIPS,AI 算力至少 10
发表于 04-14 10:16
•538次阅读
AI的迭代速度非常快,每一代所需要的模型数量、算力规模比上一代都有数倍甚至一倍的速度增加,远远超过了我们能够提供的增长曲线,从而为行业提出了新的命题和挑战。这样的挑战会给高性能计算带来怎样的变化?
发表于 04-14 11:13
•225次阅读
全球化的先进制程中分一杯羹,手机、HPC等需要先进制程的芯片供应受到严重阻碍,亟需另辟蹊径。而先进封装/Chiplet等技术,能够一定程度弥补先进制程的缺失,用面积和堆叠换取算力和性能。
发表于 04-15 09:48
•133次阅读
拥有强劲的音视频图像处理能力,又具备高算力优势。其搭载的芯片平台内置神经网络加速单元,算力达4TOPS@INT8,打破“嵌入式硬件不带算力”的瓶颈,让技术解决方案拥有AI应用能力,助力客户在人工智能赛道赢得先机。
发表于 08-19 19:28
•0次阅读
评论