向右滑动:上一篇 向左滑动:下一篇 我知道了
广告

阿里发布最强AI芯片:性能“吊打”同行,一块顶十块GPU

时间:2019-09-25 作者:网络整理 阅读:1644
发布含光800芯片时,张建锋拿出一张芯片展示,称“这个芯片真的非常大”。张建锋表示,“含光800”是阿里平头哥成立后首款正式流片的芯片,并称含光800性能“吊打”同行。

刚刚,在阿里2019云栖大会上,阿里巴巴集团首席技术官兼阿里云智能总裁张建锋发布了阿里的首款AI芯片“含光800”。

这是一款云端AI推理芯片,峰值性能为7.8万IPS(每秒能处理7.8万张照片),峰值能效达到500IPS/W,张建锋表示,这是全球最高性能的AI推理芯片,一块“含光800”相当于10块GPU。

003ednc20190925

据了解,含光800主要应用于视觉场景,已经在阿里巴巴集团内多个场景大规模应用,其它企业可以通过阿里云获得含光NPU的算力。

性能“吊打”同行,一块顶10块GPU

发布含光800芯片时,张建锋拿出一张芯片展示,称“这个芯片真的非常大”。

004ednc20190925

张建锋表示,“含光800”是阿里平头哥成立后首款正式流片的芯片,并表示含光800性能“吊打”同行。

据达摩院介绍,在业界标准的ResNet-50测试中,含光800推理性能达到78563 IPS,比目前业界最好的AI芯片性能(第二名:15012)高5倍;能效比500 IPS/W,是第二名的3.3倍,张建锋称:“含光800是阿里巴巴在芯片领域的万里长征第一步。”

005ednc20190925

据张建锋称,这是全球最高性能的AI推理芯片,一块含光800相当于10块GPU。

据了解,不同于基于冯·诺依曼架构的传统通用处理器,含光800根据神经网络推理运算特征,设计特定的硬件神经元、高速连接的存储结构以及专用指令集,对内存和计算单元实现高效组织管理,实现单条指令完成多个操作,提高计算效率和内存访问效率。

006ednc20190925

在杭州城市大脑里,视频实时处理使用GPU需要40块,延时300ms,单路视频功耗2.8W;而使用含光800仅需4块,延时150ms,单路视频功耗1W,有效节约了硬件和时间成本。

不过,阿里在现场并没有给出Tops、功耗等数据,也没有给出对标的GPU具体品牌与产品线,让这对比的参数多少有些不明确。

从设计到流片只用了一年半时间

张建锋表示,这块芯片从设计到流片只用了一年半时间。

据了解,平头哥用7个月完成了前端设计,之后用3个月就成功流片。仅成立一年的平头哥半导体为何这么快就能设计出云端AI芯片?

007ednc20190925

要知道,芯片作为典型的长周期产品,想加速芯片的商用,在硬件和软件方面都需要有很强的实力,特别是在AI时代,软硬一体化的重要性更加突显。平头哥就得益于阿里在软硬件方面的积累:

算法方面,阿里巴巴达摩院机器智能实验室过去两年构建了完整的算法体系,涵盖语音智能、语言技术、机器视觉、决策智能等方向,并且取得多个世界领先水平的成果;硬件方面,阿里巴巴此前已在服务器、FPGA以及存储等领域拥有多年研发经验,此外,平头哥团队在体系结构、编译技术等领域拥有深厚的技术储备。

含光800性能的突破得益于软硬件的协同创新,芯片架构方面,含光800采用创新的架构,针对深度学习中使用的大量权重参数和张量数据,在支持稀疏压缩与量化处理的基础上,通过独特设计的数据访存与流水线处理技术,大大减低了I/O需求和数据的搬移。NPU同时深度优化了卷积,矩阵乘,向量计算和各种激活函数,通过高有效的硬件资源调度和全并行的数据流处理,把AI运算的性能和能效都推向极致。

其中,性能的提升必须解决内存墙问题。所谓的内存墙,是指采用采用冯诺依曼结构的处理器,存储和运算处理分离,当进行深度神经网络处理时,算力得到了提升,但大量读写运行操作会受到带宽限制,芯片的整体性能提升也同时受到限制。

平头哥的做法是通过自研架构大幅减少对内存的访问,在保证性能的情况下,把芯片功耗降到最低水平。具体而言,含光800会根据神经网络推理运算特征,设计特定的硬件、高速连接的存储结构以及专用指令集,对内存和计算单元实现高效组织管理,实现单条指令完成多个操作,提高计算效率和内存访问效率。

已应用于阿里巴巴集团内多个场景

据了解,目前,含光800已应用于阿里巴巴集团内多个场景,例如视频图像识别/分类/搜索、城市大脑等,未来还可应用于医疗影像、自动驾驶等领域。

比如,拍立淘商品库每天新增10亿商品图片,为了让用户快速从海量图片中精准搜索到商品,需要强大的计算力支撑,使用含光800搜索效率可提升12倍,时间从传统通用GPU的1小时缩减至5分钟。

过去半年,平头哥先后发布玄铁910、无剑SoC平台。随着含光800的发布,平头哥端云一体全栈产品系列初步成型,涵盖处理器IP、一站式芯片设计平台和AI芯片,实现了芯片设计链路的全覆盖。

张建锋说,这块芯片只是阿里万里长征第一步,今天阿里有足够的信心、能力,把传统硬件公司能做到的、不能做到的都做到。未来,阿里成为软硬件一体化协同发展的公司。

责编:Demi Xia

(综合整理自澎湃新闻、智东西、雷锋网等)

  • 微信扫一扫
    一键转发
  • 最前沿的电子设计资讯
    请关注“电子技术设计微信公众号”
请先说点什么

暂无评论

暂无评论
我要评论
0
您可能感兴趣的文章
  • 为“别人的设计”(SED)问题进行除错 你曾经不得不去除错或改善“别人的设计”(Someone Else's Design;SED)吗?你如何剥茧抽丝地找到问题发生的根源,以及如何发挥你的工程专业,解决那些棘手的问题?
  • 拆解iPhone11 Pro Max:三摄、反向无线充电有哪些秘密? 21日,国外著名拆解网站iFixit正式上线了iPhone 11 Pro Max的详细拆解报告。iPhone 11 Pro Max的三摄有哪些秘密?iPhone 11内部到底有没有反向无线充电的硬件?更长的续航时间是如何做到的?内部结构发生了哪些变化?EDN带大家详细分析该拆解报告:
  • 拆解:英特尔电脑棒,比别的品牌强在哪? 近年来,由于传统外形PC的需求变得越来越萧条,英特尔努力尝试研发了多种计算机外形和尺寸,试图重燃客户热情。例如英特尔电脑棒,它可以用于非常小巧的家庭影院,以及数字标牌等其他应用。
  • 拆解iPad mini 5:除了芯片升级,内部还有什么改变? 苹果今年更新了 iPad mini,作为第五代产品,虽然搭载了 A12 仿生芯片,但外观上变化却不大因此被很多人称为缩小版的iPad Air。那么除了芯片外,iPad mini 5 内部还有什么改变呢?国外知名拆解网站 iFixit 带来了详尽拆解。
  • 三星Galaxy S10+物料清单(BoM)曝光,整机成本占售价42% 每当三星发布新旗舰之后,其成本及利润都是大家关注的话题之一。那么今年三星这台在国内卖 6999 元起的新旗舰 Galaxy S10+的成本是多少?每台 S10 又能给三星带来多少利润?近日国外评测机构 TechInsights 就对采用 Exynos 9820 处理器(欧版)的 Galaxy S10+ 进行拆解,并公布了该机的物料清单(BoM)。
  • 绕着汽车转一圈,你能想到哪些电子技术? 不论是车厂、系统集成商还是半导体供应商,每个厂商的PPT都有一个共同的口号:更安全、更环保绿色、更智能。这些技术和方向的实现需要依靠大量高精度的传感和测量。这就是“三化”背后一个非常重要的基础性工作。可能很多人了解人工智能这些数字类的技术。但数字类的技术再牛,也需要有很好的信号源。
相关推荐
  • 淡定看待千亿市值,汇顶加码研发布局物联网 目前中国市值千亿的股票有84只,主要集中在银行、保险、地产、汽车等传统产业板块,而日前汇顶科技股价大涨,市值首次突破了千亿大关,成为首家市值破千亿的A股半导体公司。对此,汇顶科技研发副总裁叶金春表示:“内部对这件事反应还是比较平淡的,因为我们的目标是成为世界级的综合型半导体企业……”
  • 『全球CEO峰会』重磅演讲者:Yole Développement创始人Jean-Christophe ELOY 11月7日-8日,在深圳与全球“连接”。 随着摩尔定律的放缓,前沿技术不再是人们关注的唯一焦点,创新正朝着创造差异化的方向转变。而“连接”,让一切可能变得可控。 ASPENCORE 第二届“全球CEO峰会”仍选址在全球创新指数最强的深圳举办,峰会将邀请世界各地行业领袖和创新巨擘汇集深圳,探讨新一轮技术冲击下最热门的技术话题,搜罗差异化的创新点,准确定义下一代电子产品。
  • 『全球CEO峰会』重磅演讲者:Yole创始人Jean-Christophe ELOY 在ASPENCORE第二届“全球CEO 峰会”上,Jean-Christophe ELOY将带来题为《超越摩尔是如何成为半导体行业的领导力量的》主题报道,着重讲解超越摩尔设备增长背后的驱动力,以及行业中为支持此类增长的预期变化……
  • AI芯片发展概述及市场分析 业界对AI芯片尚没有严格的界定,广义上说,擅长执行人工智能算法的芯片即为AI芯片,目前主要有GPU、FPGA和ASIC三种技术路线。根据承担的任务和部署位置,大致可以将AI芯片分为云端
  • 拆解:Apple Watch Series 5,差别不大 Apple Watch Series 5 发布后,一直被用户吐槽与上一代差别不大,著名拆解网站 iFixit 本周先后拆解了这款新手表的44mm和40mm,拆解结果印证了人们的看法。
  • 传音上市前夕被华为起诉,涉及开机画面侵权! 昨日(9月28日),有媒体报道华为起诉了以传音为代表的一批手机制造商,深圳市中级人民法院已经受理。据了解,传音控股将于9月30日在科创板上市交易……
  • 《我和我的祖国》中那些可爱可敬的工程师们 《我和我的祖国》这首歌曲诞生于上世纪80年代初,在新中国成立70周年之际,与这首歌同名的电影也将作为献礼片上映。影片分为七个单元故事,其中前两个故事都是以工程师为主角,作为为工程师群体发声的专业媒体,《电子工程专辑》把这两章拿出来给大家伙说说……
  • 9月原厂新品推荐:传感器、dToF模块、整流器 每月一次的《国际电子商情》原厂新品推荐准时奉上,9月将为大家介绍多款传感器、小型开关、dToF模块、PCB模块、整流器等新品……
广告
近期热点
广告
广告
广告
可能感兴趣的话题
广告
广告