Ver oferta completa

DATA ENGINEER SR - REMOTO

Descripción de la oferta de empleo

En Derevo empoderamos a las empresas y a las personas liberando el valor de los datos en las organizaciones ¡¡We are looking for your talent!! Data Engineer Senior El perfil deseado debe tener al menos 5 años de experiencia práctica en el diseño, establecimiento y mantenimiento de sistemas de gestión y almacenamiento de datos. Hábil en la recopilación, procesamiento, limpieza y despliegue de grandes conjuntos de datos, la comprensión de los modelos de datos ER, y la integración con múltiples fuentes de datos. Eficaz en el análisis, la comunicación y la propuesta de diferentes formas de crear almacenes de datos, lagos de datos, conductos de extremo a extremo y soluciones de Big Data para los clientes, ya sea en estrategias por lotes o en streaming. Será muy importante que tengas los siguientes conocimientos/experiencia: Inglés B2+ o más (llevarás proyectos 100% con el idioma, por lo que será indispensable el dominio hablado y escrito) Technical Proficiencies: SQL :Data Definition Language, Data Manipulation Language, Intermediate/advanced queries for analytical purpose, Subqueries, CTEs, Data types, Joins with business rules applied, Grouping and Aggregates for business metrics, Indexing and optimizing queries for efficient ETL process, Stored Procedures for transforming and preparing data, SSMS, DBeaver Python: Experience in object-oriented programming, Management and processing datasets, Use of variables, lists, dictionaries and tuples, Conditional and iterating functions, Optimization of memory consumption, Structures and data types, Data ingestion through various structured and semi-structured data sources, Knowledge of libraries such as pandas, numpy, sqlalchemy, Must have good practices when writing code Databricks / Pyspark: Intermediate knowledge in: Understanding of narrow and wide transformations, actions, and lazy evaluations How DataFrames are transformed, executed, and optimized in Spark Use DataFrame API to explore, preprocess, join, and ingest data in Spark Use Delta Lake to improve the quality and performance of data pipelines Use SQL and Python to write production data pipelines to extract, transform, and load data into tables and views in the Lakehouse Understand the most common performance problems associated with data ingestion and how to mitigate them Monitor Spark UI: Jobs, Stages, Tasks, Storage, Environment, Executors, and Execution Plans Configure a Spark cluster for maximum performance given specific job requirements Configure Databricks to access Blob, ADL, SAS, user tokens, Secret Scopes and Azure Key Vault Configure governance solutions through Unity Catalog and Delta Sharing Use Delta Live Tables to manage an end-to-end pipeline with unit and integrations test Azure: Intermediate/Advanced knowledge in Azure Storage Account: Provision Azure Blob Storage or Azure Data Lake instances Build efficient file systems for storing data into folders with static or parametrized names, considering possible security rules and risks Experience identifying use cases for open-source file formats like parquet, AVRO, ORC Understanding optimized column-oriented file formats vs optimized row-oriented file formats Implementing security configurations through Access Keys, SAS, AAD, RBAC, ACLs Azure Data Factory: Provision Azure Data Factory instances Use Azure IR, Self-Hosted IR, Azure-SSIS to establish connections to distinct data sources Use of Copy or Polybase activities for loading data Build efficient and optimized ADF Pipelines using linked services, datasets, parameters, triggers, data movement activities, data transformation activities, control flow activities and mapping data flows Build Incremental and Re-Processing Loads Understanding and applying best practices for Source Control with Azure Repos Git integration Apache Kafka, Azure Event Hubs or AWS Kinesis Intermediate/Advanced knowledge in Architecture and fundamental concepts of event streaming platforms, including producers, consumers, topics, partitions, and consumer groups Configuration, deployment, and management of event streaming clusters/services for high availability, scalability, and fault tolerance Developing producer and consumer applications using the respective SDKs for various programming languages such as Java or Python Performance tuning and optimization of event streaming clusters, including message retention, partition sizing, and data replication Implementing common usage patterns such as asynchronous messaging, real-time stream processing, and end-to-end data pipelines for real-time data ingestion and processing Security best practices for event streaming platforms, including encryption, authentication, and access control mechanisms. Qué beneficios tendrás? WELLNESS: Impulsaremos tu bienestar integral a través del equilibrio personal, profesional y económico, Nuestros beneficios de ley y adicionales te ayudarán a lograrlo. LET´S RELEASE YOUR POWER: Tendrás la oportunidad de especializarte de manera integral en diferentes áreas y tecnologías, logrando así un desarrollo interdisciplinario. Te impulsaremos a plantearte nuevos retos y superarte a ti mismo. WE CREATE NEW THINGS: Nos gusta pensar fuera de la caja. Tendrás el espacio, confianza y libertad para crear y la capacitación que se requiera para lograrlo. WE GROW TOGETHER: Participarás en proyectos tecnológicos punteros, multinacionales y con equipos extranjeros. Dónde lo harás? Somos un gran equipo trabajando en un esquema remoto, somos flexibles y estructurados; proporcionando el equipo necesario para trabajar y herramientas de comunicación interna que faciliten nuestra operación y la de nuestros clientes. Si cumples con la mayoría de los requisitos y te interesó el perfil no dudes en postularte, que nuestro equipo de Talent te contactará! Become derevian & develop your superpower!

Ver oferta completa

Detalles de la oferta

Empresa

Derevo SA de CV

Municipio

En todo México

Dirección

Sin especificar - Sin especificar

Fecha de publicación

26/03/2024

Fecha de expiración

24/06/2024

Cómo detectar ofertas falsas

Sr Data Scientist

Role: sr data scientistlocation: guadalajara & mexico city (remote)type of hire: full time job description: strong proficiency with r, sql,strong in python including the tensorflow, keras, and xgboost libraries... otros datos del puestorole: sr data scientistlocation: guadalajara & mexico city (remote)type......

Remote middle big data engineer

Kitrum

— межфункциональная работа с командами data science или content engineering для устранения неполадок, обработки или оптимизации критически важных для бизнеса данных... платформа размещает 60 миллионов документов на своей открытой издательской платформе... requisitos del puesto требуемые навыки — более......

Data scientist with azure machine learning - permanent

Cliecon solutions inc.

Role - data scientist with azure machine learning – technical support engineer location: guadalajara, mexico (remote) skills: · knowledge with azure machine learning and how it works with associated azure services... respond to inquiries, troubleshoot technical issues and provide solutions......

Data Scientist ( AzureML) - Full Time

Cliecon Solutions, Inc

Job title: azure machine learning – technical support engineer location: guadalajara, mx (remote to start with) duration: long-term skills : knowledge with azure machine learning and how it works with associated azure services... requisitos del puestojob title: azure machine learning –data scientist......

Project Engineer

Eficacia en consultoria

Importante empresa multinacional de origen suizo esta en búsqueda de tu talento como: project engineer escolaridad: ingeniero mecánico (titulado)... inglés avanzado (la entrevista es en inglés) edad: 26 a 30 años experiencia laboral de 3 a 4 años como mechanical engineer o en ingeniería de proyectos......

Becario Tableau Data Science

TURING INTELIGENCIA ARTIFICIAL

Sueldo de acuerdo a aptitudes zona: 100% remoto... competencias funcionales: extracción, transformación y carga de información para la realización y actualización de dashboards mediante el uso de tableau análisis e interpretación de base de datos modelado en base de datos intervención para el mejoramiento......

Desarrollador Java Sr

NA-AT Technologies

Experiencia demostrable mayor a 5 años trabajando con:java 8 y java 11openshiftmicroservicios y spring bootusando framework spring y sus diferentes módulos (core, mvc, data access, security)desarrollo y consumo de servicios web (rest/soap)experiencia con gradle y/o mavendiseño y creación de bases de......

Data scientist with azure cognitive services - permanent

Cliecon solutions inc.

Role - azure cognitive services – technical support engineer location – guadalajara, mexico (remote) job description: knowledge of azure cognitive services- luis, sdk app, ml model prediction accuracy strong python and c# coding skills, along with knowledge of c++ and/or java knowledge of debugging and......

Analista de procesos sr

Brainup systems

Descripción del empleo estamos buscando un analista de procesos sr para unirse a nuestro equipo dentro de la industria farmacéutica... responsabilidades: analizar y evaluar los procesos existentes para identificar oportunidades de mejora mapear, recopilar información, modelar y diseñar procesos analizar......

Buscamos a nuestro/a Sr web designer

ABCW Global

¿te gustaría ser parte del equipo? nuestro/a sr web designer se encarga de diseñar los proyectos web de nuestros clientes más importantes, dando visibilidad, seguimiento de cada uno y liderar al equipo de diseño web... la creatividad y el liderazgo son importantes para el éxito de esta posición......

Otras busquedas de empleo relacionadas

Big data remoto

Data remoto

Acceso remoto

Administrador oracle data

Analista big data

Analista sistemas remoto

Ap data warehousing bi

Big data

Big data developer

Big data ingles

DATA ENGINEER SR - REMOTO

Descripción de la oferta de empleo

Detalles de la oferta

Otras busquedas de empleo relacionadas

Forma parte de Jobatus