云天励飞、地平线、全志科技......破解AI芯片落地难题

2020-11-04 10:49:02 38

本文转载自芯师爷。芯师爷-国内领先的半导体全产业链新媒体平台 属于深圳市芯师爷科技有限公司,成立于2015年,是国内领先的产业社群和内容驱动型媒体,主要聚焦在IC设计、制造、封测、材料、设备、IDM及泛半导体科技领域。以输出产业优质内容为基础,提供客观、新锐、深度、及时的洞察,目前已形成半导体全产业链媒体矩阵:芯师爷、今日芯闻、全球物联网观察、智驾未来、机器人文明5大微信公众平台,组建有500多个主题的微信群。芯师爷全媒体平台已汇聚40万+专业读者,是中国半导体行业影响力最大的新媒体之一,日均阅读总量超过5万,为半导体华语圈企业和机构提供资讯发布、品牌推广、活动策划、营销策划、视频制作、精准推广等定制化服务。


“未来十年,AI领域将出现最多独角兽公司” 李开复曾推断


2020年是AI芯片实现落地的关键之年

中国正成为AI芯片市场争夺战中的要地


更多企业入局AI领域

推动了我国AI应用的日趋繁荣

也为精通底层解决方案的半导体巨头们

带来更广阔的市场空间


随着5G时代的到来,万物互联成为可能,海量数据的产生在给网络带来巨大压力的同时,也进一步把算力的需求推到了边缘端。云天励飞DeepEye1000正是为了应对这一需求而生的,它具备高灵活、高能效、低能耗等优势。短短六年时间,云天励飞实现了“从0到1”,再“从1到N”的超越。


智能汽车时代,汽车的核心竞争力将从“传统引擎”转移为“数字引擎”。国内首款车规级AI芯片地平线征程2用实力为中国AI芯片行业注入一针强心剂。随着长安主力车型UNI-T于2020年6月的量产上市,征程2成为了全球首个上车量产的国产AI芯片,地平线正式开启了车规级 AI 芯片的前装量产元年。


图片关键词


2020年,全志科技发布主打AI语音专用的重磅产品R329,这是全志科技首款搭载Arm中国全新AI处理单元(AIPU)的高算力、低功耗AI语音专用芯片。


在AI领域,我们看到越来越多的生力军涌现出来。由芯师爷主办、深福保集团冠名、贸泽电子提供独家礼品赞助的“2020 硬核中国芯”评选活动,以表彰国内优秀半导体企业,激励国产企业加大IC产品与技术研发力度。此次评选中,特别设置“2020年度国产AI芯片评选”,本文盘点了2020年入选的AI芯片产品,为市场提供优质选型攻略。



云天励飞  DeepEye1000



比通用CPU单位性能提升20倍,单位能效提升100倍,系统时延降低200倍。


图片关键词


产品简介:


DeepEye1000是一款异构多核视觉分析SoC芯片,内嵌一颗自定义指令集神经网络处理器。与通用GPU相比,DeepEye1000单位性能提升20倍,单位能效提升100倍,系统时延降低200倍,具备高灵活、高能效、低能耗等优势。


DeepEye1000同时还提供基于TVM打造的开源开放的芯片工具链,支持Caffe,MxNET,TensorFlow等主流深度学习框架。支持多路视频流的实时人脸检测、跟踪、特征提取和识别,支持墨镜、口罩、性别、年龄等人脸属性检测,支持服装识别、表情识别、背包识别等人体属性检测;除了可运行人脸算法外,还支持其他深度学习推理算法移植和应用,可广泛应用于智能摄像机、工业检测、机器人、无人机等领域,为视觉AI城市大脑提供安全可控的实时算力。


云天励飞Moss芯片平台还承担了工信部、发改委、科技部等国家三大部委人工智能芯片的重大专项课题,开启与头部企业海康、阿里等的合作,并推进基于云天励飞芯片的智能摄像机产品的快速上市,将通过视觉应用端边AI芯片的布局,助力打造中国安可人工智能芯片生态。此外,云天励飞Moss芯片平台及产品还荣获了“2018年最具技术创新企业”、最佳商用成长奖、优秀算力奖多个重磅奖项。


目前,云天励飞自主打造的AI芯片,已经成为公司业务的重要支撑,AI芯片与系统每年能为公司带来过亿元人民币的产值。未来三年,AI芯片有望为云天励飞每年带来30-50%的业绩增长,并且有望开拓更多的应用场景。



地平线  地平线征程2



地平线征程2是中国首款车规级AI芯片。


产品简介:


地平线量产的中国首款车规级AI芯片——征程2,搭载地平线自主创新研发的高性能计算架构BPU2.0(Brain Processing Unit),可提供超过4 TOPS的等效算力,典型功耗仅2瓦。征程2能够高效灵活地实现多类AI任务处理,对多类目标进行实时检测和精准识别,可全面满足自动驾驶视觉感知、视觉建图定位、视觉ADAS等智能驾驶场景的需求,以及语音识别,眼球跟踪,手势识别等智能人机交互的功能需求,充分体现BPU架构强大的灵活性,全方位赋能汽车智能化。


征程2核心优势在能效比和开放性方面,征程2芯片具备极高的算力利用率,每TOPS AI能力输出可达同等算力GPU的10倍以上。征程2还可提供高精度且低延迟的感知输出,满足典型场景对语义分割、目标检测、目标识别的类别和数量的需求。征程2全面开放,提供从参考解决方案,到开放的感知结果,再到芯片及工具链的基础开发环境,并可依据客户的不同需求提供不同层次的产品交付和服务。


在汽车产业里,地平线作为Tier2,提供超高性价比的边缘 AI 芯片、开放的工具链、丰富的算法模型样例,为Tier1和OEM赋能,赋予汽车感知、建模的能力,实现车内车外智能化。


在汽车前装市场,地平线已在高级别自动驾驶、辅助驾驶(ADAS)、智能座舱等方向斩获来自中国各大汽车集团的十多款定点车型的前装定点。随着2020年搭载征程2的长安UNI-T量产上市,地平线正式开启了国产车规级 AI 芯片的前装量产元年。前装破局,意味着地平线征程芯片的商业化将迎来爆发式增长。


在汽车后装市场,地平线的商业化落地亦在加速推进。目前,地平线已同包括首汽约车、SK电讯在内的多家国内外出行服务商、运营商达成合作,基于地平线AI芯片及算法,提供辅助驾驶(ADAS)、车内多模交互、高精地图建图与定位等一系列智能化解决方案,并已实现批量部署,预计未来两三年内能够部署上千万辆汽车。


此外,地平线高性能、低功耗、低成本的 Matrix自动驾驶计算平台得到了国内外自动驾驶厂商和 Robotaxi 运营车队的青睐,目前已在海内外赋能近千辆 L4 级别的自动驾驶车辆,Matrix 已成为全球 L4 自动驾驶计算平台的明星产品,未来两三年将有望到达万级规模的出货。



全志科技  高性能AI语音专用处理器R329



全志科技R329是具备深度学习高性能、低功耗、高度友好开发环境的端侧智能语音AI芯片。


产品简介:


全志科技R329芯片是高性能三重异构智能语音应用处理器,采用业界先进的半导体工艺,集成DSP、NPU、64位CPU及丰富的外设接口,创新突破了超低功耗、边缘语音AI超级算力、多重异构通讯、多核调度等关键技术,处于国内先进水平。支持Tina Linux和Free RTOS双系统通讯调度,更加方便客户定制不同需求的智能语音方案,集成高达5路高精度ADC、3路I2S/TDM16、15路独立配置PWM、5路UART、GMAC、IR、LEDC等接口,可满足各类客户的行业需求。可广泛应用于智能音箱、智能家居、智能家电、智能电话会议系统、智能扫地机等领域, R329能优秀的适配语音识别等前沿技术,在智能语音交互、远场拾音、超低能耗、逻辑分析及判断等应用领域具强大竞争力。   



华夏芯  面向视觉分析和AI加速计算的高性能边缘计算SoC(GP8300)芯片



GP8300是一款基于华夏芯自主IP、专为双目立体视觉算法而设计的一款等边缘计算需求的高端通用 AI芯片。 


产品简介:


面向视觉分析和AI加速计算的高性能边缘计算SoC(GP8300)芯片


 1、产品性能:

Ø 4核64位超标量CPU,2GHz主频率,浮点支持FP16/32/64,4MB L2-Cache

Ø 1KB可变长向量计算VLV,与CPU同频运行,浮点支持FP16

Ø 双核GSNN AI专用处理器,2TOPS,每核内置2MB SRAM,支持FP16/INT16/INT8

Ø 8MB片内大容量缓存SRAM

Ø 支持32位/64位DDR3/4, LPDDR3/4

Ø 3路视频输入接口;1路视频输出接口

Ø 音频输入/输出接口

Ø 通用数据传输、I/O接口

Ø 支持消费级、工业级、车规级环境温度

Ø TSMC 28nm工艺 


2、价格竞争力:GP8300采用华夏芯自主IP设计的芯片,在成本控制上同其它SoC供应商相比,少了IP授权一大项。因此,在同性能的SoC产品中,具有明显的成本优势。


3、技术创新:GP8300实现了在华夏芯自主指令集的超标量多核CPU和可变长向量DSP,CPU、DSP在异构计算架构下的缓存共享实现,DSP提供强大的向量计算能力,加速图像和视觉计算。自主架构的AI处理器GSNN采用异步多核异构架构,有效地对张量计算进行加速。如在Tiny YOLO环境下,GP8300的识别速度可达60FPS。GP8300采用华夏芯全自主知识产权、4核64位超标量CPU:采用三发射、乱序猜测、动态多级流水线架构,包含 MMU,运行频率2GHz@28nm,标量(IU & FU) 计算:支持64位整数指令,支持半精度(16位)、单精度(32位)和双精度(64位)浮点指令;具有可变长向量(VLV)计算单元:向量寄存器长度1KB,向量计算宽度256位,支持8/16/32位整数、半精度 (16位)浮点数据类型,运行频率2GHz@28nm。


目前已取得华夏芯(GPT)H264解码器系统V1.0、华夏芯(GPT)汇编器系统V1.0、华夏芯(GPT)链接器系统V1.0、华夏芯(GPT)U-boot软件V1.0、华夏芯(GPT)Minibench测试软件V1.0等软件著作权。华夏芯(GPT)Minibench测试软件是以u-boot为基础框架,使用gpt-gcc编译器,支持GPT架构的集成测试软件。主要功能包括测试华夏芯(GPT) core以及各种外设IP的功能以及性能,也支持SoC的异常以及中断的测试,同时框架可以提供一个灵活的测试框架,采用模块化,使开发以及验证更加灵活。支持手动测试以及自动测试,对阶段性回归测试有很大帮助。


4、客户服务:华夏芯为客户提供GP8300开发板、SDK和相应技术支持。其中,主机端SDK包括基于Eclipse的图形开发环境的集成开发环境IDE(交叉编译工具、仿真器、CPU调试工具:GPT-gdb、SoC调试工具:Debug Pod调试工具);AI SDK工具集包括模型转换、网络参数评估、网络编辑、前端算法库生产、综合集成,支持Caffe/Tensorflow/Darknet等开源框架,Mobilenet/Squeezenet/Shufflenet网络,YOLO/Mobilenet-SSD Lite v1.1/Tiny-SSD Lite 目标识别网络;开发板-核心板,70mm X 70mm,DDR3, 64-bit, 4GB,16MB SPI Nor Flash,2个连接器与扩展板连接,通过连接器从扩展板供电;开发板-扩展板,145mm X 125mm,1个HDMI输出接口,1个SD卡插槽,1个1000M以太网RJ45,4个USB3.0,DVP/BT1120/BT656扩展连接器,可接双目1080p@60fps摄像头,3个RS232;1个音频输入,1个音频输出,1个RTC,1个温度传感器,1个JTAG调试端口,插针扩展口(3个SPI(可做GPIO),1个I2C(可做GPIO))。


5、市场销量:面向视觉分析和AI加速计算的高性能SoC GP8300是一款真正意义上的异构计算芯片,各处理单元基于华夏芯自主统一指令集,便于实现协同计算。不仅具有成本优势,还具备很大的性能优势和应用开发便利,市场前景极大。GP8300已完成流片,到目前为止,华夏芯与合作伙伴已经基于该款芯片,针对智慧物流、双光融合、一盔一带、智慧交通、智能电网、机器人等行业开发了众多应用解决方案。2020年,华夏芯将在计算处理器IP核领域已取得成果的基础上,抓住新基建带来的发展机遇,依靠创新驱动,不断丰富行业应用解决方案,为客户提供一整套覆盖端、边、云应用的高效协同的计算平台。同时,华夏芯的目标是基于包括CPU、DSP、GPU和AI专用处理器在内的一站式处理器IP平台,高效支持异构SoC芯片中不同处理器单元之间的协同计算和仿真编程,构建一个统一的应用开发环境和开放的异构计算生态系统。



国芯科技  超低功耗AIoT芯片GX8002


GX8002具备低功耗、低成本、小体积的特性,真正为智能穿戴而生。




产品简介:

1、产品性能:GX8002能做到在超低功耗下运行。据测算,GX8002的待机功耗只有70uW,运行时的功耗为0.6mW,平均功耗低于300uW,可能是目前业界已知功耗最低的AI芯片。GX8002支持在可穿戴以及其他设备上的语音唤醒能力,综合唤醒率超过95%,误唤醒率达到24小时内小于1次。同时,国芯为GX8002配套研发了AI通话降噪算法,还支持骨传导通话降噪方案,基于深度神经网络,实时分离人声和噪声,有效隔绝噪声。除此之外,GX8002还支持声纹识别。通过事先注册的声纹信息,耳机唤醒后校验声纹,可在很大程度上避免在噪声环境中产生的误唤醒,提升用户体验。

2、价格竞争力:GX8002的单价为0.65美元,同时可按累计采购量给予阶梯优惠,将成本降到极低,做到超高性价比。

3、技术创新:GX8002主要有两大技术突破——自研神经网络处理器gxNPU V200和自研硬件VAD模块。此次发布的gxNPU V200为国芯第二代神经网络处理器,专门针对低功耗优化,计算能效是普通DSP芯片的10倍以上。支持DNN/CNN/RNN等各种模型,自动实现网络量化压缩,可以和Tensorflow等训练平台直接对接。同时,国芯设计了全新的VAD模块,通过增加更多特征的分析来判断人声,具备超强过滤能力,在办公室、地铁、马路、咖啡馆等各种场合的实际测试中,GX8002可以让VAD待机的比例平均高达70%以上。

4、客户服务:国芯整合了丰富的资源,包括各种TWS和可穿戴产品需要的基础技术和算法方案,接入各大品牌手机助手和云端平台,打通了蓝牙主芯片的合作通道,输出完整可靠的「一站式服务」,降低了AI服务门槛,也大大的缩短客户的研发周期。同时外置唤醒的方案,可以在客户原有成熟产品的基础上,相当于加上了一个语音按键,客户原有的软件和设计都可复用,让AI的研发周期变得非常可控,有形成本和无形成本都大大降低。

5、市场销量:GX8002为全新发布的针对智能穿戴市场的AI芯片。智能穿戴市场近年来发展迅猛,主要形态包括TWS耳机、智能眼镜、智能手表手环等。根据IDC数据显示,2019年,全球可穿戴市场出货量预计将达到 2.2亿台,这一数据将在 2023年增长至3.0亿台。行业正处在快速增长阶段,GX8002芯片有望迎来市场爆发。

时擎科技  AT1000系列智能计算芯片



高能效比、高性价比、灵活适应未来3-5年算法演进,支持多模态交互。


产品简介:


1、产品性能:该产品是一款基于RISC-V指令架构的边缘智能语音芯片,具有高能效比、高集成度、低成本的特点,可以广泛地应用于多种AIoT的智能语音和智能控制应用场景,如智能音箱、语音控制的白色家电、智能玩具、故事书、扫地机等。


2、价格竞争力:同等算力,价格低40%——针对于智能语音处理的应用,为语音交互方面提供算力的场景,包括智能音箱、智能家电、智能故事机、语音模组等多种产品形态,AT1000的方案相较于友商-R而言,核心的算力和存储配置更有针对性,更好的贴合语音应用的需要,整体功耗更低,性价比更高。


同等价格,资源大幅占优——AT1000无论从算力/能效比、片上存储资源、安全解决方案、外设丰富性等各方面,均显著优于友商-C,价格相当,性价比优势明显。


3、技术创新:目前市场上大多用MCU、DSP或者ASIC的传统通用芯片解决方案,具有效率低、功耗高的缺点。时擎的方案基于RISC-V处理器可伸缩架构和拓展DSP(数字信号处理)指令集的AI边缘计算芯片,有效率高、算力强、功耗低的优点。在相同或类似应用下,在处理性能、能耗比、成本等技术指标方面具有显著优势,同时可以给用户带来更好的使用体验,会在未来几年的语音芯片市场逐渐取代传统通用芯片。具体创新点表现在:


(1)时擎方案的所有主要处理器IP(主控处理器TS-M500和Timesformer架构的blaster智能处理器),均为基于RISC-V指令集、自主知识产权的设计。在芯片设计之初就从应用和算法特点出发,进行软硬件联合设计,优化项目架构,结合RISC-V架构自身优势,以及SoC级别的架构裁剪定制。大大增强了整个系统的紧耦合度,相较于其他竞争产品的“ARM+DSP+NN加速器”搭积木式的SoC架构,具有显著优势。根据初步评估,核心计算单元的单位面积运算效能,比国内某主要竞争对手超过50%以上。


(2)与传统高端MCU相比,时擎方案通过引入基于RISC-V的深度定制化的神经网络处理单元,在面向端侧智能设备的典型应用中,如语音/图像的识别和处理等,相同的工作频率下,性能得到显著提高。


(3)与其他通用性中低端应用处理器相比,时擎方案针对于新兴的边缘端侧智能计算的要求,进行了更加有针对性的从IP到芯片级的架构优化,从而在解决人工智能应用和算法时取得更好的效能。同时,针对智能家居系统应用的需求,时擎方案对相关功能模块进行了相应的定制和裁剪,如高性能低功耗多通道音频ADC、硬件人声检测模块,为下一代智能家居的应用提供了更具针对性的方案。


4、客户服务:时擎科技可以为客户提供各种灵活的合作方案,既支持与算法公司深度合作进行自有算法的移植和优化,也可以为IDH提供集成算法和SDK的芯片、乃至系统级的完整解决方案。


5、市场销量:2020年已形成意向订单500万元。                                                     

         


时擎科技  AT5000系列智能计算芯片 



高能效比、高性价比、灵活适应未来3-5年算法演进,支持多模态交互。


产品简介:


1、产品性能:该产品是一款基于RISC-V指令架构的边缘智能视觉芯片,具有高能效比、高集成度、低成本的特点,可以广泛地应用于多种AIoT的智能视觉、多模态交互场景,如消费级智能摄像头,基于3D视觉(双目/TOF)的智能门铃/门禁系统,各类智能家居/智慧城市设备。


2、价格竞争力:同等算力,价格低200%——针对于人脸识别、车牌识别等智能视觉的应用,如人脸识别门禁、门锁,车牌识别摄像头等,AT5000的方案相较于友商-R而言,核心的算力和存储配置更有针对性,更好的贴合人脸识别应用的需要,整体功耗更低,性价比更高。


同等价格,资源大幅占优——AT5000支持基于双目摄像头或者TOF摄像头的3D智能视觉,且无论从算力/能效比、片上存储资源、安全解决方案、外设丰富性等各方面,均显著优于友商-H,价格相当,性价比优势明显。


3、技术创新:目前市场上大多用MCU、DSP或者ASIC的传统通用芯片解决方案,具有效率低、功耗高的缺点。时擎的方案基于RISC-V处理器可伸缩架构和拓展DSP(数字信号处理)指令集的AI边缘计算芯片,有效率高、算力强、功耗低的优点。在相同或类似应用下,在处理性能、能耗比、成本等技术指标方面具有显著优势,同时可以给用户带来更好的使用体验,会在未来几年的语音芯片市场逐渐取代传统通用芯片。具体创新点表现在:


(1)时擎AT5000芯片中,基于RISC-V自研了Timesformer架构的Bumble-bee智能处理器,该处理器通过多核可编程DSP处理器融合可重构的关键算子处理器TME(MAC协处理器),TPE(PIXEL协处理器),可以同时支持人工智能算法和传统图像算法的,相较于其他竞争产品的“ARM+DSP+NN加速器”搭积木式的SoC架构,具有显著优势。根据初步评估,核心计算单元的单位面积运算效能,比国内某主要竞争对手超过50%以上。


(2)时擎AT5000芯片,相较于市面上同等规格的芯片,能够额外支持3D机器视觉的需求,不仅能支持基于双目摄像头的3D机器视觉,且能支持基于TOF摄像头的机器视觉。


(3)针对智能家居、智慧城市系统应用的需求,时擎AT5000在图像视频通路、智能计算处理能力之外,还加入了如高性能低功耗多通道音频ADC、硬件人声检测模块,为下一代智能家居的应用考量,使得整体方案能以AT5000单芯片提供多模态交互的能力。


4、客户服务:时擎科技可以为客户提供各种灵活的合作方案,既支持与算法公司深度合作进行自有算法的移植和优化,也可以为IDH提供集成算法和SDK的芯片、乃至系统级的完整解决方案。


5、市场销量:预计2020年年底将投入市场。   



亿智电子  机器视觉AI SoC芯片SV810



国内少有的搭载自研NPU及ISP的AI SoC、适配深度学习算法的全栈式AI产品解决方案。


产品简介:


1、产品性能:SV810是一款应用于人脸识别出入口闸机、社区门禁、办公室考勤、智能IPC的机器视觉AI SoC芯片。SV810搭载1.2T算力的自研AI加速单元 NPU, 高效适配人脸识别和活体检测算法,可防止黑白照片、视频攻击,并支持10W+人脸底库。同时,SV810集成了自主研发的高性能ISP,利用宽动态低照度ISP设计,可在低光照环境下提供高清晰的视频图像画质。


2、关键技术指标:

- NPU提供1.2Tops的深度神经网络推理算力;

- 8M@30fps的ISP处理能力,采用3D降噪和数字宽动态技术,在弱光和宽动态场景下发挥出色性能,同时可以处理双路的摄像头输入;

- 集成图形和图像合成和处理单元,加速UI和视频合成和旋转应用;

- 先进的架构和动态调频策略,实现系统在各种应用场景下的低功耗。深度睡眠技术可提供超低的待机功耗,大大延长了电池寿命。


基于SV810芯片的出入口闸机解决方案:

· 1.2T算力,支持10W人脸库

· 活体检测,防黑白照片、视频攻击

· 支持人证比对

· 支持人脸测温,口罩识别

· 设备使用温度范围:-20~70℃

· 有效识别范围:2m


3、技术创新:

· 可编程AI加速器模块设计

· 宽动态低照度ISP设计

· 视频编码码率平滑控制设计

· 支持多框架的跨平台开发


4、客户服务:

· 于珠海、北京、深圳、上海均设办公点,为客户提供服务支持;

· 提供基于亿智电子自研AI SoC芯片的人工智能算力平台开发;这是亿智电子自主研发的一个开放性应用平台,基于企业自研的AI SoC芯片(包括SV810芯片),提供边缘端的算力部署,可从AI芯片、算法到软硬件解决方案的完整交付,达到算法和芯片的完美匹配。

平台提供跨平台的软硬件协同开发工具,该工具内置了高性能计算库,支持主流的深度学习编程框架,提供模型权重训练和转换、性能监控及调优等功能,可以实现多种场合的快速应用设计。

· SV810芯片目前已大规模量产交付。


注:本文转载自网络,支持保护知识产权,转载请注明原出处及作者,如有侵权请联系我们删除。