职责描述:
1. AI 算法(Convolution、Pooling等)在ARM CPU/GPU/DSP/NPU微架构上优化;
2. 实现算法的并行计算和低比特量化优化;
3. 参与推理框架的架构开发。
任职要求:
1. 深度掌握一种编程语言C/C++/python,数据结构和设计模式、具备良好的软件工程习惯;
2. 熟悉深度学习算法的基本概念和原理,掌握NN网络常见的优化策略和方法;
3. 熟悉NCNN、TFLite、MNN、QNNPACK等嵌入式开源框架之一;
4. 优秀的学习能力,责任心,良好的团队合作意识;
5. 具备以下条件之一优先考虑:
1) 在ARM平台上有丰富开发经验;
2) 有使用ARM 汇编(如ARMv7/v8-A、多线程编程,内存管理技术)或者Neon intrinsics, DSP或者Adreno/Mali等GPU的经验;
3) 有使用NNIE/SNPE/RKNN等硬件进行网络加速的经验。