为旌科技:智能化背景下域控制器软硬件协同芯片解决方案
为旌科技成立于2020年,专注于芯片的设计与研发,主要包括智慧视觉和智能驾驶两条产品线。
2024年9月4日,在第四届智能汽车域控制器与中央计算平台创新峰会上,为旌科技副总裁amp;联合创始人张晓峰坦言,高质量的数据闭环和高效运行大模型算法的智驾芯片将是带来极致智驾体验的基础,也是主机厂决战智驾的重要抓手。端到端大模型架构是智能驾驶技术发展的未来方向,但模块化架构仍将是当下重要的技术框架。模块化与端到端大模型将在未来五年甚至更长时间内共存,将形成中低阶和高阶智驾车型长期共存的格局。张晓峰围绕为旌智驾芯片等展开深入介绍。
未来,智能驾驶行业的发展将与手机行业的发展类似,分层解耦又紧密合作的行业生态模式将成为主流。张晓峰介绍,为旌科技坚持Tier2的战略定位,平台型芯片产品支撑解决方案的差异化,开放的商业模式支撑大模型时代的快速迭代,力求与合作伙伴共赢。
为旌科技副总裁amp;联合创始人
以下为演讲内容整理:
为旌科技成立于2020年,是一家芯片设计公司,目前有智慧视觉和智能驾驶两大产品线。我们的智慧视觉产品线于2022年流片一版成功,在年底正式量产。2023年,我们正式发布了为旌海山系列芯片,图像质量达到业内一流水平,通过了业内TOP3家客户的图像评测并在今年实现了大客户的突破,目前在视频会议、智能交通、直播相机、热成像领域等形成了标杆项目。
图源:为旌科技
为旌科技于2022年开始做面向乘用车智能驾驶的芯片项目—为旌御行,其中面向商用车的芯片VS909,于2022年成功导入某商用车企方案商。2023年为旌御行VS919流片一版成功,在此之前,为旌科技已通过ISO26262安全体系认证,并在今年4月,VS919拿到了ISO26262产品级的认证。
去年12月,为旌科技正式发布了VS919系列芯片。该芯片有五大优势。一是高计算效率,为旌自研的NPU支持BEV+Transformer的加速,二是高集成度,三是高安全性,全芯片功能安全等级为ASIL-B,其中内置ASIL-D级别安全岛。四是低延时,我们的芯片支持低时延,从启动到出图小于0.5秒。第五大优势是低功耗,整体功耗小于10瓦,不需要加水冷和大风扇,只要通过散热片的自然散热就可以达到降低温度的目标。
为旌御行的产品目标是打造好用、易用和耐用的计算平台。好用主要体现在系列芯片是异构的,芯片内集成包括多核CPU,MCU、NPU、DSP和GPU,支持低功耗,有丰富的接口。
易用性体现在,我们的自研NPU工具链,支持两百多个AI算子加速,能够比较容易地把模型部署到芯片上。同时,我们也提供媒体相关的API,能够容易的对接三方的中间件,让大家能够很方便地把自己的模型和算法移植到芯片上做部署。
耐用性上,VS919已获得ISO26262功能安全产品认证,以及AECQ100认证,保证在整个芯片周期的质量。
从架构角度看,我们之所以将VS919称为极致性价比的单行泊一体芯片,是因为芯片中集成了安全岛,包括两核R5F,支持双核锁步,能达到最高功能安全等级ASIL-D。我们自研的为旌天权NPU支持24T算力。芯片内部集成了两核的GPU,能做3D渲染和快速出图。
从接口角度看,我们支持16路200万Sensor接入,即高达3200万的接入能力。还支持12路的CAN-FD总线,支持车载以太网、USB、PCIe的接口。另外还同步支持编码器和解码器,支持业务的数据回灌,能够助力合作伙伴快速进行迭代。我们内置的有4M SRAM,可以解决NPU访问的内存墙的问题,保证NPU能优先从cache,一级缓存,到片内的SRAM,最后才到DDR中获取数据。
图源:为旌科技
VS919单行泊一体的域控方案中,支持5R7V12U的方案,即2个800万前视,一个300万的后视和4个200万环视。支持基础的L2+智能驾驶功能和高速NOA,泊车支持APA等功能。
我们所提供的SDK方案中,与异构架构协同,在A核上支持linux,R核上支持实时操作系统,支持Autosar CP,并且提供了一层软件的基本library库。此外,我们也提供一些工具,包括对ISP做效果的优化,提供一些工具做profiling带宽分析等。 我们也有工具能够对NPU的性能做一些分析,方便快速定位问题。另外,支持基本的OTA方法,能够和T-box 一起协同做软件升级。
为旌的NPU中,主要支持端侧的BEV+ Transformer。天权NPU内核支持matrix和vector的计算单元。通过高灵活性的指令级编程,目前能够支持200多个加速算子。高性能主要体现在int8、int16和FP16的混合精度量化,支持Transformer模型的加速,特别是softmax/layernorm这些算子等。另外,我们也可以支持自定义算子,NPU直接和其他计算单元协同计算。
我们自研的工具链中,支持PTQ和QAT的量化,通过onnx导入训练后的模型,编译器进入模型进行一些timing或者高效的调度,最终把模型通过runtime直接部署到芯片上。目前行业内对端到端大模型讨论较多。特斯拉去年提出的端到端大模型,通过高效的智能芯片,把大模型算法部署在智能芯片上,加上高质量的数据闭环,打造出了极致的智驾体验。目前来看,传统模块化的架构有向端到端统一架构发展的趋势,但整体而言传统模块化仍是主流趋势。
我们认为,智能驾驶发展过程中,合作共赢是未来主要趋势。主机厂有数据、应用场景;Tier1有算法、软硬件解决方案;Tier2有算力平台。我们对公司的定位是Tier2的角色,通过平台型的芯片方案,支持Tier1和主机厂去做更多差异化方案。我们认为只有开放的商业模式,才能够支撑大模型时代快速迭代。