Arquiteto de Dados
Life Sciences - Health Care Services
São Paulo São Paulo Permanent Mar 3, 2020
Integre a equipe de Dados de uma das maiores empresas no ramo da Saúde.

Responsabilidades:


- Criar projetos pra sistemas de gestão de dados, avaliar potenciais fontes de dados da instituição (internas e externas), projetar planos para integrar, centralizar, proteger e manter os dados, permitindo que áreas clientes acessem informações críticas no lugar certo e na hora certa.
-Orquestrar ações de software selection a fim de determinar as tecnologia mais adequadas para resolução de problemas de negócio.
-Elaborar junto às áreas de negócio a especificação técnica, traduzindo suas necessidades em requisitos que a solução deverá atender;
-Planejar os componentes, relacionamentos e integrações que compõem as soluções de Big Data propostas as áreas de negócio;
-Analisar, do ponto de vista técnico, a viabilidade de projetos envolvendo a tecnologia de Big Data;
-Desenhar estruturas de ingestão e tratamento de dados para processamento analítico, em ferramentas do Ecossistema Hadoop/Cloudera. Assim como definição de políticas de atualização e segurança;

Requisitos: 

- Experiência em data wrangling: limpeza e manipulação de dados, extrair informações de arquivos, regula rexpressions, transformações matemáticas;
-Domínio de queries em banco de dados relacionais;
-Porgramação em linguagem de data engineering (tais como: Java, Python, Scala, Spark, MapReduce);
-Conhecimento em programação em linguagens de backend (tais como: Noje.Js, C#, Ruby, Go)/
-Outras ferramentas: Debugging, testingm controle de versão (Git) e CI/DI (Jekins);
-Experiência no funcionamento e manutenção de banco de dados NoSQL. (Tais Como: Cassandra, HBase, MongoDB, CouchDB, Giraffe, entre outros)
-Conhecimentos avançados do ecossistema Hadoop (tais como: HDFS, Spark, Kudu, Hive, Impala, Flume, Sqoop, Zookeeper, Oozie, Hue, Kafka);
-Conhecimento em Segurança em ambiente Hadoop/Cloudera. (Kerberos, Sentry, KMS/KTS);
-Data transformation, design de processos ETL;
-Conhecimento de integração de dados em tempo real (Storm, Kafka, Spark Stream);
-Banco de Dados Search Engine (Solr/ Elastic Serarch);
-Conhecimento de plataformas de BI (tais como: PowerBI, entre outros);
-Bom entendimento de Sistemas Operacionais (Unix/Linux), Redes e Administração de Sistemas;
-Conhecimento de funcionamento e manutenção de banco de dados relacionais, como MS SQL Server, Oracle, MySQL e PostgreSQL;
-Conhecimento e técnicas de levantamento de requisitos (tais como: caso de uso e método de síntese);
-Inglês Avançado.