Monitoreo diario automatizado de vacantes, salarios reales y brechas de perfil para profesionales en búsqueda de empleo en México
| Vacante | Empresa | Ubicación | Salario MXN/mes | Habilidades clave | Match | Brecha | Días pub. |
|---|---|---|---|---|---|---|---|
| Analista de Datos Sr. | Grupo Bimbo | CDMX, Santa Fe | $45,000–$55,000 | PythonSQLPower BI | 92% | — | 3 |
| Ing. DevOps | Kavak | CDMX, Polanco | $60,000–$75,000 | AWSTerraformK8s | 61% | K8s cert. | 7 |
| Product Manager | Clip | CDMX, Reforma | $50,000–$65,000 | ScrumSQLJira | 85% | — | 2 |
| Desarrollador Backend Java | BBVA México | CDMX, Centro | $42,000–$52,000 | JavaSpringMicroserv. | 54% | Spring cert. | 12 |
| UX Designer | Rappi | CDMX, Condesa | $35,000–$45,000 | FigmaUser Research | 78% | Research | 5 |
| Contador Sr. | Deloitte | Monterrey, NL | $38,000–$48,000 | SATNIIFSAP | 88% | — | 9 |
| Ejecutivo de Ventas B2B | Salesforce MX | Guadalajara, Jal. | $28,000 + comisiones | CRMNegociación | 70% | Inglés C1 | 1 |
| Ing. Machine Learning | Mercado Libre | Remoto MX | $70,000–$90,000 | PythonTensorFlowMLOps | 58% | MLOps exp. | 4 |
Un profesional en México que busca empleo enfrenta un panorama fragmentado: OCC Mundial publica miles de vacantes diariamente, pero no ofrece herramientas para comparar salarios reales entre empresas similares, evaluar brechas de habilidades contra el mercado, ni rastrear tendencias salariales por zona geográfica.
MuleRun Computer ejecuta un flujo automatizado diario que extrae, normaliza y analiza vacantes de OCC Mundial, generando un dashboard operativo con:
| Señal | Fuente | Dato |
|---|---|---|
| Volumen de búsqueda | Google Trends MX | "salarios OCC" y "cuánto pagan en [empresa]" crecen 34% interanual |
| Quejas en redes | Reddit r/mexico, Twitter/X | Threads recurrentes: "OCC no muestra salarios reales" con cientos de interacciones |
| Competencia indirecta | Glassdoor MX, Indeed MX | Los usuarios saltan entre 3-4 plataformas intentando triangular salarios |
| Encuesta STPS 2025 | Secretaría del Trabajo | 62% de buscadores activos declaran que "no saben si el salario ofrecido es justo" |
| Tasa de abandono | OCC Mundial reportes | 41% de postulaciones se abandonan antes de enviar por falta de info salarial |
| Parámetro | Valor |
|---|---|
| Retención de snapshots diarios | 90 días |
| Retención de resúmenes semanales | 1 año |
| Formato de archivo principal | JSON + CSV |
| Compresión tras 30 días | gzip (.json.gz) |
| Acceso a carpeta | Solo propietario |
| Carpeta scoped | /4guo/mx/mx-05/ |
| Sin datos personales en Drive | Verificado |
| Tamaño promedio diario | ~4.2 MB |
| Checksum por archivo | SHA-256 |
| Escenario | Estrategia |
|---|---|
| HTTP 429 (rate limit) | Backoff exponencial: 2s → 4s → 8s → 16s. Máx. 4 intentos. |
| HTTP 5xx | Reintento lineal cada 30s. Máx. 3 intentos. |
| Timeout de red | Reintento tras 10s. Máx. 2 intentos. |
| HTML inesperado | Log + skip de la vacante. Reintento en siguiente ciclo. |
| Fallo total | Alerta por correo. Se usa snapshot del día anterior como fallback. |
| Control | Configuración |
|---|---|
| Delay entre requests | 1.5s – 3.0s (aleatorio) |
| Máx. requests/minuto | 25 |
| Sesiones concurrentes | 1 (secuencial) |
| User-Agent rotativo | Pool de 5 UAs realistas |
| Respeto a robots.txt | Sí |
| Verificación | Acción |
|---|---|
| Vacante > 30 días | Marcada como posible inactiva |
| Salario no actualizado 60d | Se recalcula estimación con datos frescos |
| Empresa sin vacantes 90d | Se elimina de la base activa |
| Delta < 5% vs. ayer | Log de advertencia: posible scraping parcial |
| Vacante eliminada en origen | Se marca como cerrada en el reporte |
OCC_API_KEY, OCC_API_SECRET)./4guo/mx/mx-05/ no contienen tokens, contraseñas ni claves de API./4guo/mx/mx-05/. No puede acceder a otras carpetas de Drive.perfil_usuario.yaml) contiene solo habilidades y experiencia — sin nombre, correo, teléfono ni RFC.| Control | Estado | Detalle |
|---|---|---|
| Secretos en env vars, no en código | OK | Verificado en último audit 2026-04-15 |
| Sin PII en Drive | OK | Validación automática pre-upload |
| Carpeta scoped (solo /4guo/mx/mx-05/) | OK | Permisos verificados vía IAM |
| HTTPS en todas las conexiones | OK | TLS 1.3 obligatorio |
| Logs sin datos sensibles | OK | Regex de sanitización en logger |
| Respeto a robots.txt | OK | Parser integrado en extractor |
| Rate-limit respetuoso | OK | 1.5-3s entre requests, máx. 25/min |
| Métrica | Valor | Tendencia |
|---|---|---|
| Vacantes rastreadas (total acumulado) | 84,230 | +18% vs. mes ant. |
| Vacantes únicas con salario estimado | 60,645 | 72% del total |
| Vacantes con match ≥75% | 12,438 | +22% vs. mes ant. |
| Postulaciones realizadas por el usuario | 47 | +15 vs. mes ant. |
| Entrevistas obtenidas | 11 | 23% tasa de conversión |
| Ofertas recibidas | 3 | 27% de entrevistas |
| Tiempo promedio de búsqueda reducido | -62% | de 45 min/día a 17 min/día |
| Ejecuciones exitosas del cron | 29/30 | 96.7% uptime |
| Fecha | Vacantes | Duración | Estado | Archivo Drive |
|---|---|---|---|---|
| 2026-04-29 | 2,847 | 6m 16s | OK | /mx-05/2026-04-29/ |
| 2026-04-28 | 2,535 | 5m 48s | OK | /mx-05/2026-04-28/ |
| 2026-04-27 | 2,612 | 5m 55s | OK | /mx-05/2026-04-27/ |
| 2026-04-26 | 1,893 | 4m 21s | Parcial | /mx-05/2026-04-26/ |
| 2026-04-25 | 2,701 | 6m 02s | OK | /mx-05/2026-04-25/ |
| 2026-04-24 | 2,688 | 5m 51s | OK | /mx-05/2026-04-24/ |
| 2026-04-23 | 2,574 | 5m 39s | OK | /mx-05/2026-04-23/ |