Consejos de desarrollo profesional de un científico de datos sénior en Amazon


La ciencia de datos como disciplina, y las habilidades específicas en aprendizaje automático, análisis y algoritmos de entrenamiento, tienen una gran demanda.

Es un campo que ha explotado en popularidad en la última década y se espera que cree 11,5 millones más empleos nuevos solo en los EE. UU. para 2026.

Entonces, ¿cómo es trabajar como científico de datos y qué necesita saber si está pensando en comenzar su carrera allí (o hacer la transición más adelante en la vida)?

Yo pregunté Naveed Ahmed Janvekarun científico de datos sénior de Seattle que trabaja en el equipo de prevención de fraudes y abusos de Amazon, para compartir su trayectoria profesional.

Vea su historia y los consejos que tiene para aquellos interesados ​​en seguir una carrera en ciencia de datos.

Una chispa: uso del aprendizaje automático para dar con problemas del mundo real

¿Qué lo llevó a una carrera en ciencia de datos?

Naveed Janvekar: Mi interés en el aprendizaje automático creció cuando trabajaba para Fidelity Investments como desarrollador de software.

Tenía colegas que trabajaban como analistas con datos para identificar tendencias, lo que me despertó la curiosidad de explorar este campo. Así que comencé a analizar mis transacciones financieras personales para generar tendencias e información.

Esto llevó a dedicar más tiempo a investigar el aprendizaje automático y cómo se podía aprovechar para modelar patrones repetitivos para predecir resultados futuros y utilizarlo a nuestro favor para dar con problemas críticos a escala.

Para obtener una mejor experiencia en este dominio, decidí realizar mi Maestría en Ciencias de la Información con especialización en Aprendizaje Automático y Análisis.

Después de graduarme, trabajé en varias empresas con sede en EE. UU. en diferentes roles analíticos, como analista en Nanigans (una empresa emergente de AdTech con sede en Boston), desarrollador de inteligencia comercial en KPMG y científico de datos sénior en Amazon.

El papel de la IA en la seguridad de los datos

¿Qué papel juega el aprendizaje automático en su trabajo como científico de datos sénior en Amazon?

Naveed Janvekar: El aprendizaje automático y la ciencia de datos juegan un papel vital en mi trabajo en Amazon.

En el equipo de prevención de abusos, utilizamos varios algoritmos de clasificación y algoritmos de aprendizaje profundo para detectar fraudes y abusos en la plataforma.

El aprendizaje automático ayuda a lograr la escalabilidad y detección de alta precisión en comparación con la detección tradicional de exceso basada en reglas y/o heurística.

A medida que los comportamientos de exceso se vuelven complejos con el tiempo, el aprendizaje automático nos ayuda con este desafío, ya que volvemos a entrenar constantemente a los modelos con los patrones/comportamientos de exceso más recientes.

He presentado patentes de invenciones relacionadas con la detección de abusos emergentes en la plataforma utilizando aprendizaje automático.

Comunicar información basada en datos

¿Qué habilidad o experiencia inesperada sientes que te ha ayudado como profesional de la ciencia de datos?

Naveed Janvekar: La habilidad de adquirir experiencia en el dominio y poder comunicar de manera efectiva y simple los conocimientos a las partes interesadas del negocio me ha ayudado más como profesional de la ciencia de datos.

Cuando comencé mi viaje de ciencia de datos, puse mucho más énfasis en los detalles técnicos que en ser un narrador eficaz.

Pero en los últimos años, me di cuenta de que poder comunicar narrativas y conocimientos de la ciencia de datos o el aprendizaje automático es tan importante como implementar estrategias de aprendizaje automático.

Trabajar junto con algoritmos para crear cambios

¿Cómo deberían las empresas adaptar su enfoque en este espacio en el futuro?

Naveed Janvekar: En el pasado, la prevención del fraude se realizaba tradicionalmente mediante reglas heurísticas empresariales.

Si observó que un determinado patrón aparece con frecuencia a lo largo del tiempo, puede establecer una regla comercial para marcar el mismo patrón en el futuro.

Sin embargo, esta es una solución a corto plazo. No sigue el ritmo de la evolución de los patrones de fraude.

Aquí es donde el aprendizaje automático y la IA entran y tienen cambió el paisaje.

Ahora, los modelos se entrenan utilizando datos históricos en múltiples comportamientos de fraude, lo que hace que estos modelos sean sólidos y ayuden a los algoritmos a aprender comportamientos complejos, que son mucho más difíciles de hacer para los humanos.

Las empresas han comenzado a utilizar el aprendizaje automático en la detección de fraudes. Ahora deben centrarse en aspectos como el reentrenamiento automatizado de modelos para capturar los últimos comportamientos de fraude y hacer que los modelos sean muy precisos.

Esto ayuda a automatizar acciones como resultado de la salida del modelo, en lugar de tener auditores humanos necesarios para evaluar las entidades sospechosas que se marcan después del hecho.

Trabajar con datos y algoritmos puede ser un desafío

Pero, ¿qué lo hace emocionante y divertido?

Naveed Janvekar: He disfrutado de la ingeniería de funciones a partir de datos, lo que saca a relucir mi lado creativo.

Con base en la experiencia del dominio, los científicos de datos pueden modificar los datos de diferentes maneras para responder las preguntas de las partes interesadas del negocio, realizar análisis exploratorios de datos, encontrar correlaciones entre variables y realizar ingeniería de características para mejorar el rendimiento del modelo.

Con respecto a los algoritmos, siempre he experimentado entrenando diferentes tipos de conjuntos de datos de entrenamiento, realizando evaluaciones y profundizando en por qué ciertos algoritmos funcionan mejor que otros.

Esto me ayuda a comprender mejor estos algoritmos y las situaciones en las que funcionan y en las que no.

Todo esto hace que el trabajo sea divertido y emocionante para mí.

Convertirse en parte de la comunidad de ciencia de datos

¿Cuál es un consejo útil que le gustaría compartir con los principiantes en ciencia de datos que están interesados ​​en sus aplicaciones en marketing y comercio y pueden querer mejorar sus habilidades en este campo?

Naveed Janvekar: Una sugerencia útil sería participar en investigaciones e inventos dentro del aprendizaje automático y Ciencia de los datos dominio.

Forme parte de grupos de trabajo que intentan dar con problemas en su área de interés utilizando el aprendizaje automático.

Contribuya a su investigación, obtenga comentarios de sus colegas, publique artículos y presente patentes.

A través de estos mecanismos, está contribuyendo activamente a la comunidad científica, aprendiendo constantemente de sus compañeros y mejorarte a ti mismo.

También es una buena idea tener un mentor de ciencia de datos.

Mantenerse al día con las tendencias de SEO

¿Cómo se mantiene actualizado e informado un científico de datos en el campo del SEO?

Naveed Janvekar: En el campo del SEO, el aprendizaje automático ayuda a comprender las consultas, la búsqueda por voz y la personalización.

Los científicos de datos pueden explorar la aplicación de varios algoritmos de última generación para casos de uso de SEO para medir la eficacia de los algoritmos más nuevos.

Hacer esto mantendrá a los científicos de datos actualizados con las últimas tendencias en la industria, además de actualizar la pila de aprendizaje automático en las empresas relacionadas con SEO.

Hay varias revistas y congresos, como el Conferencia Internacional IEEEsobre aprendizaje automático y aplicaciones para ayudarlo a obtener más información sobre las últimas tendencias de aprendizaje automático.

No está sin rodeos relacionado con SEO, pero lo ayudará a comprender los avances tecnológicos que afectarán su espacio a continuación.

Más recursos:


Imagen destacada: Cortesía de Naveed Janvekar





Consultar el artículo en la publicación original

Consejos de desarrollo profesional de un científico de datos sénior en Amazon