Inteligencia Artificial

Roles Clave en un Proyecto de Predicción de Fraude con Aprendizaje Automático | por Mahsa Ebrahimian

El papel del director de proyecto es a la vez crítico y desafiante. Son responsables del plan del proyecto y su ejecución. Al inicio del proyecto, participan en la definición del plan y el establecimiento de plazos en función de las solicitudes de los interesados y las capacidades del equipo técnico. A lo largo del proyecto, monitorean continuamente el progreso. Si el estado real de las tareas o entregas se desvía del plan, deberán levantar la bandera y coordinar con los equipos. Como resultado, pasan la mayor parte de su tiempo comunicándose con diferentes equipos, gerentes de alto nivel y partes interesadas del negocio. Dos grandes desafíos en su profesión son:

Interdependencia entre equipos técnicos: Esto hace que el rol sea desafiante porque los resultados de un equipo (por ejemplo, los ingenieros de datos que absorben los datos) sirven como entradas para otro equipo (por ejemplo, los científicos de datos que consumen los datos). Cualquier retraso o cambio en la primera etapa impacta la segunda etapa. Los jefes de proyecto, aunque generalmente no son muy técnicos, deben ser conscientes de estos cambios y garantizar una buena comunicación entre los equipos.
Prioridades comerciales en competencia: Las partes interesadas del negocio a menudo cambian sus prioridades, o puede haber prioridades en competencia dentro de diferentes equipos que deben alinearse. Los directores de proyecto deben gestionar estos cambios y alinear diferentes equipos para mantener el proyecto encaminado.

Al gestionar eficazmente estos desafíos, los gerentes de proyectos desempeñan un papel central en el éxito de los proyectos de aprendizaje automático.

La experiencia y el conocimiento de los analistas de fraude son cruciales para el desarrollo y evaluación de modelos de predicción de fraude. Desde el inicio del proyecto, brindan información sobre las tendencias de fraude activo, escenarios de fraude comunes y señales de alerta, así como excepciones o «señales de alerta verdes». Los científicos de datos integran este conocimiento durante la fase de creación/ingeniería de funciones. Una vez que el modelo se ejecuta en producción, se requiere un monitoreo constante para mantener o mejorar el rendimiento. En esta etapa, los analistas de fraude desempeñan un papel vital en la identificación de positivos verdaderos o falsos del modelo. Esta identificación puede resultar de una investigación exhaustiva del historial del cliente o de contactar al cliente para su confirmación. La retroalimentación de los analistas de fraude es una parte integral del proceso del ciclo de retroalimentación.

Los gerentes y ejecutivos de alto nivel desempeñan un papel crucial en el éxito de los proyectos de fraude de ML/IA. Su apoyo es fundamental para eliminar obstáculos y llegar a un consenso sobre la dirección estratégica del proyecto. Por lo tanto, deben ser informados periódicamente sobre el progreso del proyecto. Para que puedan respaldar las inversiones en los equipos, herramientas y procesos necesarios en función de los requisitos específicos del proyecto y garantizar que se asignen los recursos adecuados. Además, son responsables de responsabilizar a las partes internas y externas por la privacidad de los datos y el cumplimiento de los estándares de la industria. Al fomentar una cultura de responsabilidad y proporcionar un liderazgo claro, ayudan a garantizar que el proyecto logre sus objetivos y encaje armoniosamente en la estrategia general de la organización. Su participación es esencial para abordar cualquier inquietud regulatoria, gestionar los riesgos e impulsar el proyecto hacia una implementación exitosa y una sostenibilidad a largo plazo.

Los ingenieros de datos proporcionan los datos que nosotros (los científicos de datos) necesitamos para construir modelos, lo cual es un paso esencial en cualquier proyecto de ML. Son responsables de diseñar y mantener canales de datos, ya sean flujos de datos en tiempo real o procesos por lotes en almacenes de datos. Los ingenieros de datos, involucrados desde el inicio del proyecto, identifican los requisitos de datos, las fuentes, las necesidades de procesamiento y los requisitos de SLA para la accesibilidad de los datos.

Crean canales para recopilar, transformar y almacenar datos de diversas fuentes, esencialmente gestionando el proceso ETL. También gestionan y mantienen estos canales, cumpliendo con los requisitos de escalabilidad, monitoreando la calidad de los datos, optimizando consultas y procesos para mejorar la latencia y reducir costos.

Sobre el papel, los científicos de datos crean algoritmos de aprendizaje automático para predecir diferentes tipos de información para la empresa. En realidad, usamos muchos sombreros diferentes a lo largo del día. Comenzamos identificando el problema empresarial, comprendiendo los datos y recursos disponibles y luego definimos una solución, traduciéndola en requisitos técnicos.

Los científicos de datos trabajan en estrecha colaboración con los ingenieros de datos y los ingenieros de MLOps para implementar soluciones. También trabajamos con las partes interesadas del negocio para comunicar resultados y recibir comentarios. La evaluación del modelo es otra responsabilidad crítica, que implica seleccionar métricas apropiadas para evaluar el desempeño del modelo, monitorear e informar continuamente sobre el mismo, y monitorear cualquier degradación en el desempeño.

El proceso de mejora continua está en el centro del papel de un científico de datos, para garantizar que los modelos sigan siendo precisos y relevantes a lo largo del tiempo.

Una vez que los ingenieros y científicos de datos hayan construido los canales de datos y el modelo, es hora de poner el modelo en producción. Los ingenieros de MLOps desempeñan un papel crucial en esta fase al cerrar la brecha entre el desarrollo y las operaciones. En el contexto de la predicción del fraude, el tiempo lo es todo porque la empresa debe prevenir el fraude antes de que ocurra, lo que requiere un proceso en proceso que se ejecute en menos de un segundo. Por lo tanto, los ingenieros de Mlops se aseguran de que los modelos se integren perfectamente en los entornos de producción, manteniendo al mismo tiempo la confiabilidad y la escalabilidad. Los ingenieros de MLOps diseñan y administran la infraestructura necesaria para implementar el modelo, implementar canales de integración continua e implementación continua (CI/CD) y monitorear el rendimiento del modelo en tiempo real. También gestionan el control de versiones, automatizan las pruebas y gestionan los procesos de reciclaje de modelos para mantenerlos actualizados. Al abordar estos desafíos operativos, los ingenieros de MLOps permiten la implementación fluida y eficiente de modelos de aprendizaje automático, garantizando que brinden resultados consistentes y valiosos para el negocio.

Hablamos de los roles que identifiqué durante mi experiencia profesional. Estos roles interactúan de manera diferente dependiendo de la etapa del proyecto y de cada empresa específica. En mi experiencia, al inicio del proyecto, los analistas de fraude, los altos directivos y los científicos de datos trabajan juntos para definir la estrategia y los requisitos. Los científicos de datos desempeñan un papel importante en la identificación del problema empresarial. Están colaborando con Mlops e Ingeniería para traducirlo en una solución técnica. Los ingenieros de datos deberían venir y discutir los desarrollos necesarios en el proceso. Un desafío común surge cuando hay una discrepancia entre estos equipos y solo se hace evidente en tiempo de ejecución. Esto puede tener un impacto en los plazos y la calidad del entregable. Por lo tanto, cuanta más integridad tengan estos equipos, más fluida será la implementación y la entrega.

Comente a continuación sobre los roles en su empresa. ¿En qué se diferencian las cosas según tu experiencia?