0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

大模型参数达百万亿级别,AI商业化进程加速!

Carol Li 来源:电子发烧友网 作者:李弯弯 2023-02-26 00:44 次阅读
电子发烧友网报道(文/李弯弯)大模型,又称为预训练模型、基础模型等,大模型通常是在大规模无标注数据上进行训练,学习出一种特征和规则。近期火爆的ChatGPT,便是基于GPT大模型的一个自然语言处理工具。

参数规模上看,AI大模型先后经历了预训练模型、大规模预训练模型、超大规模预训练模型三个阶段,参数量实现了从亿级到百万亿级的突破。从模态支持上看,AI大模型从支持图片、图像、文本、语音单一模态下的单一任务,逐渐发展为支持多种模态下的多种任务。

AI大模型的发展历程

AI大模型的发展,还要从2017年Vaswani等提出Transformer架构说起,Transformer架构的提出奠定了当前大模型领域主流的算法架构基础。

2018年,谷歌提出了大规模预训练语言模型BERT,该模型是基于Transformer的双向深层预训练模型,其参数首次超过3亿规模;同年,OpenAI提出了生成式预训练Transformer模型GPT,大大地推动了自然语言处理领域的发展。此后,基于BERT的改进模型、ELNet、RoBERTa、T5等大量新式预训练语言模型不断涌现,预训练技术在自然语言处理领域蓬勃发展。

2019年,OpenAI继续推出15亿参数的GPT-2,能够生成连贯的文本段落,做到初步的阅读理解、机器翻译等。紧接着,英伟达推出了83亿参数的Megatron-LM,谷歌推出了110亿参数的T5,微软推出了170亿参数的图灵Turing-NLG。

2020年,OpenAI推出了超大规模语言训练模型GPT-3,参数达到1750亿,在两年左右的时间实现了模型规模从亿级到上千亿级的突破,并能够实现作诗、聊天、生成代码等功能。此后,微软和英伟达在2020年10月联手发布了5300亿参数的MegatronTuring自然语言生成模型(MT-NLG)。

2021年1月,谷歌推出的Switch Transformer模型以高达1.6万亿的参数量成为史上首个万亿级语言模型;到2022年一大批大模型涌现,比如Stability AI发布的文字到图像的创新模型Diffusion,以及OpenAI推出的ChatGPT。

在国内,大模型研究发展迅速。2021年,商汤发布了书生(INTERN)大模型,拥有100亿的参数量;2021年4月,华为云联合循环智能发布盘古NLP超大规模预训练语言模型,参数规模达1000亿,联合北京大学发布盘古α超大规模预训练模型,参数规模达2000亿。

同年4月,阿里达摩院发布270亿参数的中文预训练语言模型PLUG,联合清华大学发布参数规模达到 1000亿的中文多模态预训练模型M6;7月,百度推出ERNIE 3.0知识增强大模型,参数规模达到百亿;10月,浪潮信息发布约2500亿的超大规模预训练模型“源 1.0”;12月,百度推出ERNIE 3.0 Titan模型,参数规模达2600亿。

2022 年,基于清华大学、阿里达摩院等研究成果以及超算基础实现的“脑级人工智能模型”八卦炉(BAGUALU)完成建立,其模型参数规模突破了174万亿个。可以看到,目前大模型参数规模最高已经达到百万亿级别。

大模型研究的重要意义

当前人工智能正处在可以用到好用的落地阶段,但目前仍处于商业落地早期,主要面临着场景需求碎片化、人力研发和应用计算成本高、长尾场景数据较少导致模型训练精度不够、模型算法从实验室场景到真实场景效果差距大等行业痛点。

大模型具备大规模和预训练的特点,一方面有良好的通用性、泛化性,能够解决传统AI应用中门槛高、部署难的问题,另一方面可以作为技术底座,支撑智能化产品及应用落地。

过去很多年,虽然各大科技公司不断推出较大规模的模型,然而直到去年生成式AI逐渐走向商业化,以及去年底今年初OpenAI推出的ChatGPT爆火,AI大模型才真正迎来发展的转折点。美国国家工程院外籍院士、北京智源人工智能研究院理事张宏江此前表示,ChatGPT和AIGC,技术爆火背后,代表着人工智能(AI)大模型进入一个新的技术范式,也是第三波AI浪潮经过十几年发展之后一个非常重要的拐点。

张宏江认为,它其实代表着从以前各自研发专用小模型到研发超大规模通用智能模型的一个范式转变。这个转变的重要意义在于:通过这种比较先进的算法架构,尽可能多的数据,汇集大量算力,集约化的训练达模式,从而供大量用户使用。

大模型的发展很可能会改变信息产业的格局,改变以前作坊式AI开发模式,把AI应用带入基于互联网、云计算的大规模智能云阶段。

小结

虽然过去十几年人工智能技术发展迅速,然而在近几年却遇到了一些技术瓶颈和商业化难题。而大模型的发展和普及,尤其是通过大模型+微调的新技术开发范式,人工智能将能够更好的在各种场景中实现应用,当然大模型的训练和推理对算力等也提出了很高的要求,因此大模型的研究最终能够如何推进人工智能产业的发展,还需要产业链各环节的共同努力。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    87

    文章

    23771

    浏览量

    260785
  • ChatGPT
    +关注

    关注

    19

    文章

    1046

    浏览量

    2215
收藏 人收藏

    评论

    相关推荐

    初创公司AiM Future将LG的AI IP商业化

    AI加速IP商业化,用于消费电子,机器人和汽车等各种应用。该 IP 专为多模式操作而设计,可同时运行许多不同的 AI 模型。当前一代硬件
    发表于 02-23 15:08

    OpenVINO工具套件是否可以商业化使用?

    商业化使用。
    发表于 08-15 08:19

    AI商业化需要思考那三个问题?

    AI 商业化导读:每一次技术革命,都带来全新的商业机会。互联网的出现,本质上解决了效率和链接的问题,外卖、社交、打车,都搭上了互联网更便捷、更高效的快车。AI 的爆发,企业要怎样才能赶上AI 商业化的浪潮呢?今天,AI 君和各位一起探讨。
    发表于 08-15 16:38 5次下载

    国内AI商业化元年:三大应用场景亟需落地

    AI人才之所以受到如此关注,一个最本质的原因在于,2017年已经成为全球人工智能商业化、产品运用元年。与机器制造时代不同,AI商业化运用时代,中美两国可谓同时起跑。
    发表于 07-03 08:17 461次阅读

    打造试医情况良好的产品是商业化的基础!产品云端将成大趋势!

    AI 创业公司打磨产品与商业化进程并不容易。高昂的研发费用与微薄的收入促使这些即使获得大规模融资的企业也在不断探寻商业化路径。
    的头像 发表于 03-27 08:57 3071次阅读

    固态电池的新能源汽车商业化进程在持续加速

    商业化落地。这是继天际汽车、蔚来汽车、爱驰汽车之后,又一家战略布局固态电池的新造车势力车企;固态电池的新能源汽车商业化进程在持续加速
    发表于 10-15 16:35 342次阅读

    固态电池的新能源汽车商业化进程在持续加速 国外车企纷纷大力布局

    商业化落地。这是继天际汽车、蔚来汽车、爱驰汽车之后,又一家战略布局固态电池的新造车势力车企;固态电池的新能源汽车商业化进程在持续加速
    发表于 10-16 15:16 413次阅读

    荣耀赵明:5G将开启一个百万亿元级的大市场

    百万亿元级的大市场,从基础设施、网络设备到终端应用,5G将加速各个产业的变革。
    的头像 发表于 10-22 14:26 1953次阅读

    中国自动驾驶汽车分级标准出炉 加速推动其商业化进程

    加速推动其商业化进程
    发表于 03-10 14:15 374次阅读

    固态电池商业化进程持续加速 国内企业积极布局

    商业化进程持续受到广泛关注。
    发表于 04-13 11:14 520次阅读

    ADI与北云科技合作推出高精度组合导航板卡,加速自动驾驶系统的商业化进程

    百万套。A1组合导航板卡能够有效降低高精度组合导航的成本,加速自动驾驶系统的商业化进程
    的头像 发表于 05-29 09:12 2793次阅读

    氢燃料电池商业化进程正在加速

    商业化进程正在加速。前不久,中国科学院院士欧阳明高表示,近两年中国燃料电池技术研发取得了巨大进步,和五年前相比各种性能指标都出现了大幅的提高,氢燃料电池技术在中国的产业链已经建立起来,国家
    的头像 发表于 12-10 09:55 1564次阅读

    芯旺微电子车规芯片的商业化进程

    商业化进程》主题演讲。
    发表于 09-26 17:11 1279次阅读
    芯旺微电子车规芯片的<b>商业化</b><b>进程</b>

    中国企业500强营收总额首超百万亿 较上年增长14.08%

    百万亿 较上年增长14.08% 中国企业500强发展取得新突破,万亿元级企业首次突破10家,中国企业500强营收总额首超百万亿。 根据中国企业联合会、中国企业
    的头像 发表于 09-08 17:11 1193次阅读

    墨芯支持Byte MLPerf助力AI应用

    模型趋势下,墨芯通过领先的稀疏计算优势,助力企业加速AI应用,商业化进程接连取得重要突破。
    的头像 发表于 09-07 11:37 345次阅读
    墨芯支持Byte MLPerf助力<b>AI</b>应用