欢迎来到亿配芯城! | 免费注册
你的位置:Pango(紫光同创)FPGA/CPLD芯片全系列-亿配芯城 > 芯片资讯 > 云端AI芯片市场,中国军团有实力挑战英伟达的地位吗?
云端AI芯片市场,中国军团有实力挑战英伟达的地位吗?
发布日期:2024-08-03 07:15     点击次数:174

2019年,人工智能是最受注目的范畴,从医疗保健到招聘各个行业都在拥抱AI。纵观全球,虽然软件和算法演进很快,但硬件和算力的分离却能使AI的落地场景演进成为可能。在AI市场,全球抢先的公司英伟达,曾经从游戏、超级计算机到神经网络的大型计算应用范畴树立业界规范,过去的半年中,以寒武纪、华为、阿里巴巴为代表中国军团对云端AI市场不时推出新品,对这个范畴全球竞争次序发起了冲击。

中国云端AI市场,三大厂商密集发布新品上市

2019年6月20日,寒武纪宣布推出第二代云端AI芯片思云270及板卡产品。处置非稠密深度学习模型的理论峰值性能提升至上一代MLU100的4倍,到达128TOPS(INT8);同时兼容INT4和INT16运算,理论峰值分别到达256TOPS和64TOPS;支持浮点运算和混合精度运算。

图:寒武纪思云270芯片。

图:寒武纪思云270芯片

8月23日,华为正式发布算力最强的AI处置器Ascend910(昇腾910),同时推出了全场景AI计算框架MindSphore。实践测试结果标明,在算力方面,昇腾910完整到达了设计规格,即:半精度(FP16)算力到达256Tera-FLOPS,整数精度(INT8)算力到达512Tera-OPS;重要的是,到达规格算力所需功耗仅310W,明显低于设计规格的350W。

图:华为昇腾910现场展现。

图:华为昇腾910现场展现。

9月25日,在杭州云栖大会上,达摩院院长张建锋现场展现了阿里推出全球最强的AI芯片——含光800。这是一款云端神经网络处置器,主打推理,重点应用于视觉场景,在业界规范的ResNet-50测试中,含光800推理性能到达78563IPS,比目前业界最好的AI芯片性能高4倍;能效比500IPS/W,是第二名的3.3倍。

图:云栖大会上达摩院展台上展出的含光800NPU。

图:云栖大会上达摩院展台上展出的含光800NPU。

图:云栖大会上含光800NPU测试评价主动散热PCIe板卡。

云端AI芯片市场为什么这么热?

随着物联网技术的迅猛开展,全球联网设备数量呈现迸发式增长,联网设备的数量在2014年到2020年间的年复合增长率估计将达23.1%,到2020年物联网设备数量到达501亿。IDC预测2020年全球数据总量将打破40ZB,到2025年,全球联网设备一年产生的数据量到达79.4ZB。在阿里云栖大会上,阿里巴巴董事长张勇提出的公开预测数据显现,到2025年,全球一年产生的数据将达175ZB,是IDC预测的两倍。

数据是数字经济时期的石油,算力是数字经济时期的发起机,把数据变成石油,其中AI芯片是关键。依据ABIResearch的第一份报告“云端AI芯片:市场前景和供给商定位”表示:云端AI推理和锻炼所产生的AI芯片市场,估计将从2019年的42亿美圆增长到2024年的100亿美圆。终端AI芯片市场也将近80亿美圆。

与终端AI芯片相比,云端AI芯片通常具有更高的计算才能,更高的功耗,更大的物理占用面积,因而也相对愈加昂贵。关于互联网和云效劳商,其本身关于AI芯片需求越大,意味着需求付出的本钱更为昂扬,这也是阿里巴巴、华为、亚马逊等公司纷繁自研芯片的初始缘由。

三位中国应战者的实力展现

到目前为止,云端AI市场不断由英伟达GPU英特尔CPU主导,而如今的它们正面临着HabanaLabs、高通等公司的应战。最近寒武纪、华为和阿里巴巴新品的发布,也正是宣布进入这一高地。

行业权威人士指出,思索到国内高端人工智能技术的匮乏,人工智能硬件在中国还处于新兴产业,市场潜力宏大,2019年,多家公司推出新品,很快与Nvidia展开剧烈的竞争, 亿配芯城 能否能切分蛋糕,实力十分关键。

第一、在芯片性能方面,寒武纪“思元270”的性能参数有意向业界标杆英伟达TeslaT4看齐。“思元270”可支持INT16/INT8/INT4等多种定点精度计算,INT16的峰值性能为64Tops(64万亿次运算),INT8为128Tops,INT4为256Tops。

比照TeslaT4,FP16的峰值性能为65Tops,INT8为130Tops,INT4为260Tops。

功耗方面,“思元270”功耗为75w,与TeslaT4持平。

寒武纪在锻炼范畴的低精度整数运算完成了关键性打破,思元270锻炼版板卡将可经过8位或16位定点运算提供杰出的人工智能锻炼性能,该技术有望成为AI芯片开展的重要里程碑。

第二、华为轮值董事长徐直军对业界表示:昇腾910总体技术表现超出预期,作为算力最强AI处置器,当之无愧。我们曾经把昇腾910用于实践AI锻炼任务。比方,在典型的ResNet50网络的锻炼中,昇腾910与MindSpore配合,与现有主流锻炼单卡配合TensorFlow相比,显现出接近2倍的性能提升。

好像手机市场,华为在AI战略商摆出了应战对手的姿势,手机市场上华为自有品牌手机加上自有麒麟芯片技术,把握住5G手机的抢先优势,在AI市场,华为拿出昇腾910+MindSphere的硬件与架构效劳组合,还有自主的锻炼架构以及整合才能。固然这个组合在海外市场能否展开业务令人疑心,但在价钱和效能驱动夏,华为在AI市场更有竞争力,特别是聪慧城市、自动驾驶车辆、物联网和之后会医疗等抢手应用上,华为自有技术加上软硬整合,置信能够启动更大的市场。

第三、阿里巴巴首席技术官张剑锋表示,含光800的云端推理才能出众。1个含光800算力等于10个普通GPU,在业界规范的ResNet-50测试中,峰值性能到达78563IPS,每秒处置7.8万张图片,是目前全球最高性能的AI推理芯片,每瓦能够处置500张照片。同样以推理才能来说,含光800的推理才能是英伟达T4(1721IPS)的五倍,是英伟达P4的46倍,能效比是第二名HabanaLabs的Goya的3.3倍,是寒武纪MLU270的3.5倍。

在现场演示中,杭州城市大脑实时处置主城区的交通视频,需求40颗传统的GPU,延时300ms,运用含光800仅需求4颗,延时减低到150ms。在拍立淘商品库每天新增的10亿商品图片,运用传统GPU算力辨认需求1小时,运用含光800能够缩短至5分钟。软硬件协同的极致设计表现了宏大市场前景。

结语

行业专家以为,人工智能将有可能得到范围化运用,大范围新技术会在将来二三十年获得打破。人工智能将给社会提供更多的效率,国度会由于人工智能发作天翻地覆的变化。

面对人工智能带来的改动,国度本身的开展会取决于这个国度的才能,取决于行业成熟性和算法、算力、根底设备的提供,比方超级计算机、超大范围的系统等一系列的支撑。作为中国外乡云端AI芯片的主要供给商,寒武纪、华为和阿里平头哥,固然如今比英伟达的实力还有差距,但在中国宏大的市场潜力和应用带动下,会有更多可能开发出先进产品,将来如何,让我们拭目以待。