MobileOne: red troncal móvil mejorada en un milisegundo

Las redes troncales de redes neuronales efectivas para dispositivos móviles a menudo se optimizan para métricas como FLOP o número de parámetros. Sin embargo, es posible que estas métricas no se correlacionen bien con la latencia de la red cuando se implementan en un dispositivo móvil. Por lo tanto, realizamos un análisis en profundidad de diferentes métricas mediante la implementación de múltiples redes compatibles con dispositivos móviles en un dispositivo móvil. Identificamos y analizamos cuellos de botella de arquitectura y optimización en redes neuronales eficientes recientes y brindamos formas de mitigar estos cuellos de botella. Con este fin, diseñamos una red troncal MobileOne eficiente, con variantes que logran un tiempo de inferencia inferior a 1 ms en un iPhone12 con una precisión del 75,9 % en el top 1 en ImageNet. Mostramos que MobileOne logra el máximo rendimiento en arquitecturas eficientes y es varias veces más rápido en dispositivos móviles. Nuestro mejor modelo logra un rendimiento similar en ImageNet a MobileFormer y es 38 veces más rápido. Nuestro modelo logra una precisión top-1 un 2,3 % mayor en ImageNet en comparación con EfficientNet con una latencia similar. Además, mostramos que nuestro modelo se generaliza a múltiples tareas: clasificación de imágenes, detección de objetos y segmentación semántica con mejoras significativas en latencia y precisión sobre las arquitecturas eficientes existentes cuando se implementa en un dispositivo móvil.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *