职责描述:
1. 负责ARM架构,或其他微处理器上的算子开发;
2. 负责Tengine框架-前端/IR功能开发;
3. 各种训练框架模型适配,计算图/多线程/内存池性能调优。
任职要求:
1. 熟悉C或者C++,了解python;
2. 了解深度学习算法和算子定义(如Convolution、Pooling、BN、Activation)、layer计算方式、量化训练;
3. 熟悉至少一种深度学习训练框架及其模型文件的解析,如Caffe/MXNet/TensorFlow/PyTorch;
4. 了解一种开源的AI Compiler(AI编译器);
5. 用过ARM汇编(如ARMv7/v8-A、多线程编程,内存管理技术)或者intrinsics 优先。