随着全球科技的(de)不断发展(zhǎn),人工智能产(chǎn)业(yè)规模高速增长,人(rén)工智能应用的成(chéng)熟,既催生了新的市(shì)场,也为传统产业的发展(zhǎn)注入了新的活力。
全球(qiú)市场调研(yán)机构IHS Markit发(fā)布数据显(xiǎn)示,到2025年AI应用市(shì)场(chǎng)规模(mó)将从2019年的428亿美元激(jī)增到1289亿美元(yuán)。
回顾2019年,AI机器人群聊、管(guǎn)控道(dào)路(lù)桥梁积水、写作、智(zhì)能客服……人工(gōng)智能做了许多原本人类(lèi)才会(huì)做的(de)事情。数不尽的(de)纷繁(fán)应(yīng)用背后离(lí)不开(kāi)AI 芯片的基础(chǔ)支撑。
日前,AI芯片新老牌厂(chǎng)商“混(hún)战”国际(jì)消费(fèi)类电子产品展(zhǎn)览(lǎn)会,全面覆盖当前人工智能六大(dà)核心落地(dì)场(chǎng)景,包(bāo)括云端训练、云端(duān)推理、智能手(shǒu)机、AIoT视觉推理、AIoT语音推理、自动驾驶等,国内AI芯片(piàn)进入落(luò)地阶段。
根(gēn)据中国人(rén)工(gōng)智(zhì)能产业发展联盟提供的(de)数据,2019年(nián)以来国内外芯片厂(chǎng)商共(gòng)发布AI芯片近30款(kuǎn)。
AI芯(xīn)片怎样支撑(chēng)多姿多彩的人(rén)工智能应用落地?评(píng)测标(biāo)准进展如何?今年的亮点、看点又在哪?
在过去一年,国内外产业玩家们共(gòng)同推动着(zhe)AI芯片的车(chē)轮向前(qián)滚动。7nm芯片还未全面(miàn)铺(pù)开,5nm冲锋的号角已经吹响,在AI强势(shì)侵(qīn)入并颠(diān)覆各个(gè)传统领(lǐng)域的同(tóng)时,AI芯片的架构创新持续(xù)发酵。“AI芯片”这个(gè)新鲜的概念(niàn)在过去一年间(jiān)逐(zhú)渐走过了普及的阶段,越来越被大(dà)众所熟知(zhī)。在行业走过野(yě)蛮生(shēng)长,开始加速(sù)落地、加(jiā)速整(zhěng)合的过程中,也有(yǒu)更多的AI芯片公司也开始走出属于自己的(de)差异化路线(xiàn)。
如今,AI芯片正在云(yún)计算、手机、安防监控(kòng)、智能家居、自动驾(jià)驶五(wǔ)大场景上演(yǎn)新的群雄争霸赛,包括华为、阿(ā)里、百度等巨头企业,均拿出自己的“杀手锏”。这些“杀手锏(jiǎn)”在不同程度上提振了(le)自己在(zài)行业的影响力,也给产(chǎn)业(yè)带来巨大变革,更让(ràng)业界看到了(le)中国半导体行业的希望。但是,在经历了一次次疯狂打(dǎ)call之后,每(měi)次都觉得差了点什么——那种(zhǒng)感觉仿佛就是看了一晚上网(wǎng)红带货,但是当(dāng)主播(bō)大喊“买它!”之(zhī)后,却(què)无(wú)人下单的尴尬。
可以说,尽管去年各大厂商(shāng)纷纷推出了多款产(chǎn)品,但至今仍然没(méi)有任(rèn)何一款(kuǎn)产品可以称得上“现象(xiàng)级(jí)爆款”。为什么(me)出现了此(cǐ)种叫好不叫买的情(qíng)况?不(bú)由让笔者(zhě)深感疑惑。
究其原因不难发现,覆盖细分领域,偏离(lí)主战场是其(qí)中(zhōng)的重要问题。相关调研公(gōng)司(sī)数据显示,到2022年,整体AI芯片市场(chǎng)规模(mó)将会达到596.2亿美(měi)元,其中云端训练(liàn)+云端推断芯(xīn)片达到244亿美元,占据四成以上的市场规模。毫无疑问(wèn),云端服务器(qì)市场是AI芯片的(de)主战场。目前的现状是(shì)具备(bèi)通用性(xìng)优势的GPGPU占据了(le)云端人(rén)工智能主导市场(chǎng),以TPU为代表(biǎo)的ASIC目前只运用(yòng)在巨头的闭环生态(tài),FPGA在数(shù)据中心业务中还(hái)在尝试阶段。目(mù)前全球各大公司(sī)云计算中心如(rú)谷歌(gē)、微(wēi)软、亚(yà)马逊、阿里(lǐ)巴巴等主流公司均采用GPU进行(háng)AI计(jì)算。英伟达就是(shì)在这里赚的钵满盆满。目前,全球主流的(de)硬件平台都在使(shǐ)用英伟达的 GPU 进行加速,AMD 也在(zài)积极(jí)参与。亚马逊(xùn)网(wǎng)络服(fú)务 AWS EC2、Google Cloud Engine(GCE)、IBM Softlayer、Hetzner、Paperspace 、LeaderGPU、阿里云、平安云等计算平台都(dōu)使(shǐ)用了英伟达(dá)的 GPU 产(chǎn)品提供深度学习算法训练服(fú)务。
portant;" />
反观其(qí)他专(zhuān)用AI芯片厂商,在(zài)各自聚焦的细(xì)分领域(yù)都表现抢眼(yǎn),但难(nán)以(yǐ)粉饰自身配角的地位。赛迪顾(gù)问的预测数据(jù)显示,2019年(nián)中国对于AI芯(xīn)片需求最(zuì)大的市场依次为(wéi)安防、零售(shòu)、医疗、教育、金融、制(zhì)造、交通、物流等行业。其中最大(dà)的安防市场也仅占20%,多家聚焦安防领域的AI芯片厂(chǎng)商在经历(lì)了奋力厮杀后,也难以在出货(huò)量(liàng)等方面(miàn)取得(dé)好成绩。
而深究下去,聚焦单一(yī)领域又诱发了另一问题:成本问题。随着芯片制造工艺的日益先(xiān)进,芯片制造成本也水涨船高,如今设(shè)计制造(zào)一颗10nm芯片的成本要几千万(wàn)美元,综(zōng)合成本高达上亿美元。因此,如果不(bú)能保证某款单一应用场景下能够大量出货,专(zhuān)用芯片需要保(bǎo)持一定(dìng)的通用性与灵活(huó)度。
最近两年间,产业界开始(shǐ)陆续(xù)涌现出神经(jīng)网(wǎng)络计算专用(yòng)芯(xīn)片(AI芯片),寒武纪、深(shēn)鉴科技(jì)、中星微电子等玩(wán)家的AI芯片产品采用的都是28nm的芯片工艺,前期从投入到流(liú)片的成本超过400万(wàn)美元,单一品类出货量没有百万的级别将很难收回成本。
而除(chú)了成本(běn)之外,AI算(suàn)法(fǎ)的演进(jìn)也需要(yào)纳(nà)入考虑。由于目前人工智能算法还在不断变化、不(bú)断演进的过程中,人工(gōng)智能经历了六十多年的发展(zhǎn)才(cái)迎来了(le)深度(dù)学习(xí)的(de)大规模爆发,然而(ér)现在深(shēn)度学习(xí)算法还有众多有待优化的方面,比如稀疏化、低功耗、小数(shù)据训练等,算法尚(shàng)未定型。
此(cǐ)外,目前语音/文(wén)字/图像/视(shì)频(pín)等(děng)不同应用(yòng)无法使用(yòng)统一算法,然而许多实际(jì)生活(huó)中的AI应用程序(识别图像中的对象或理解人(rén)类语言)需要不同类型的具(jù)有(yǒu)不同层数(shù)的神经网络的组合。
因此,在确保AI应用性能的前提下,AI芯片需要(yào)尽可能地保持芯片通(tōng)用性。那(nà)么问题(tí)来了(le):既(jì)然GPGPU如此(cǐ)强(qiáng)大,能够大小“通吃”,为什么厂商反而顾(gù)左右而言他?其实真正的困(kùn)难(nán)在于GPGPU的技术难度。
硬件角(jiǎo)度看,最核(hé)心的是指令集。指令集的覆盖(gài)面、颗粒度、效率等决定一(yī)款(kuǎn)芯片能否覆盖到足够宽(kuān)的应(yīng)用市(shì)场领域,并对软件开发和产品迭(dié)代足够(gòu)友好。无论(lùn)是英(yīng)伟达还是AMD的(de)GPGPU,指令集(jí)都在千条(tiáo)量级,而目前国(guó)内的AI芯片指令集(jí)大多数都在百(bǎi)条以内。类型与数量的差别映射(shè)到硬件高效实现的复杂程度,差距是巨大(dà)的,在这方面国内的团队还存(cún)在着一定的差距。另一个重要方面就是(shì)基(jī)于硬件层的任务管(guǎn)理和智能调度,这可以让芯(xīn)片从硬件层即(jí)提高(gāo)算力的利用率,也(yě)就(jiù)是大(dà)家常说的实际算力。大多数AI芯片的(de)做法是完全依赖(lài)于软件层的调度实现,但这(zhè)种方式第一增(zēng)加了软件(jiàn)开发的复杂(zá)度,第二降低了硬件算力的利用率,第三减缓了(le)软(ruǎn)件(jiàn)栈(zhàn)迭代更新的(de)速度,这在AI领域,面向算法模型、开(kāi)发环境、应(yīng)用场景(jǐng)加速更新的大背(bèi)景下无疑大(dà)大增加了产品落地与工程化的(de)难度。
在软件方面(miàn),毫无疑问,最重要的必然是开发生(shēng)态,GPGPU通过英(yīng)伟(wěi)达(dá)十(shí)多年的(de)耕(gēng)耘,已(yǐ)经建立(lì)起了一(yī)个超(chāo)过160万(wàn)开发用户的庞大而成(chéng)熟的生态-CUDA。AI芯(xīn)片则(zé)需要(yào)搭建全新的生态,它会带来两(liǎng)个维(wéi)度(dù)显(xiǎn)著的问题(tí),第(dì)一个维度是客户端,客(kè)户需要冗长的适(shì)配期,从原有的开发环境切换到(dào)新的软件生(shēng)态,这不仅(jǐn)带(dài)来了资源投(tóu)入,推(tuī)迟了(le)业务部署(shǔ)时(shí)间窗口,增加了业务的不确定性(xìng),更严重的是不利于(yú)保护已有的软件投资,软件的很多部分(fèn)都要重(chóng)新来写(xiě)并适(shì)配,这对企业级用户来讲恰恰是非(fēi)常敏感与(yǔ)慎重的事情。另(lìng)一个维度是产品开发端,从(cóng)底层芯片(piàn)与系统软件,跳过CUDA层去直(zhí)接支持开发框架,必然带来巨大的软件投入,不停得(dé)追(zhuī)赶现有框架(jià)的新版本,以及生态巨头的新框(kuàng)架,这在底层(céng)软(ruǎn)件人(rén)员(yuán)缺乏(fá)的背景下矛盾显得尤其突出。
本文在一(yī)开头就提出了一个貌似针对产品的问题,而事(shì)实(shí)上(shàng),这(zhè)还是(shì)一(yī)个关于市场(chǎng)的(de)问题。能(néng)否(fǒu)成为爆款,一方面要看产品,另一(yī)方面还需要看市场需(xū)求。数(shù)据显示,2018年中国AI芯片市(shì)场依然保(bǎo)持增长(zhǎng),整体市场规模达到80.8亿元(yuán),同比增长(zhǎng)50.2%。且目前(qián)依然以云端训练芯片为主。2018年中国云端训练芯片市(shì)场份额达到51.3%。巨大的市场前景,也引来各方诸侯前来抢夺。
除了一骑(qí)绝尘(chén)的(de)英(yīng)伟达,其他老(lǎo)牌的芯(xīn)片巨(jù)头都没闲着,特(tè)别是Intel也(yě)在(zài)加紧布局(jú)通用GPU。英特(tè)尔眼馋GPU路人皆知,其背后是一段辛酸史——从开(kāi)始对GPU的不屑,到基于自(zì)家的x86架构开发独立显卡(kǎ),英特(tè)尔折(shé)腾了十年之久仍然没(méi)做(zuò)出来一款像(xiàng)样的(de)GPU。近两年传(chuán)出消(xiāo)息(xī)英特尔将在今年推(tuī)出首(shǒu)款独立(lì)GPU,这恐怕(pà)要得益于英特(tè)尔的重金挖(wā)人——原AMD RTG显卡部门负责人Raja、Zen架构(gòu)的功勋领袖Jim Keller、显卡技术市(shì)场总监(jiān)Damien Triolet这(zhè)几(jǐ)位大神都在2018年(nián)被英特尔(ěr)招入麾下。
而(ér)在国内,一家名(míng)为“天数智芯”的公(gōng)司也宣布将(jiāng)在今(jīn)年发(fā)布GPGPU芯片(piàn)。这家公司目前围绕(rào)GPGPU的系统(tǒng)研发已聚集了一支百余人的技术团(tuán)队,其中不乏AMD在美国和上海做 GPU的核心(xīn)团队成员、行业经验超20年的世(shì)界级技术专家。
从产业发展规律(lǜ)来看,在过去两年之内AI芯(xīn)片将持续(xù)火热,大家扎堆(duī)进入(rù);但是到(dào)了2020年前后,则将会出现(xiàn)一批出局者(zhě),行业洗牌开始。由于目前AI算法(fǎ)还在不断(duàn)演进汇总(zǒng)的过程(chéng)中,最终的成功与否则将取决于各家技(jì)术路(lù)径(jìng)的选(xuǎn)择和产品落地的速度。
目前人工智(zhì)能(néng)已经发展到了(le)新的阶段,呈(chéng)现出专(zhuān)业性、专用性和普惠性的(de)特点。2020年AI人工(gōng)智能芯片的第一个“爆款”会花落(luò)谁家呢?让我们拭目以(yǐ)待。