Newsletter

5 lições (que você ainda não pratica) que vão te ajudar a se tornar um profissional de dados acima da média! 😉

Enviado em: July 19, 2021
View this email in your browser

5 lições (que você ainda não pratica)
que vão te ajudar a se tornar um
profissional de dados acima da média
 


E aí Data Hackers! Preparados para mais uma semana recheada de dados?

Machine Learning, Deep Learning, Python ou R, ETL's e SQL são alguns dos itens que não podem faltar no currículo de um bom profissional de dados, certo? Mas e se eu te disser que (infelizmente) não são essas habilidades que vão fazer com que você se destaque no mercado de trabalho?

Ficou confuso? (Lá vem os Data Hackers falando para eu aprender ainda mais coisas novas...) Pois fique tranquilo, hoje o conteúdo principal que vamos trazer é exatamente sobre isso, vamos compartilhar com você 5 lições práticas que podem aumentar consideravelmente o impacto de um profissional de dados nas empresas.

Mas não é só isso, vamos levantar uma polêmica sobre um "descasamento" entre o que os profissionais de ML sonham em fazer e o que as empresas realmente precisam; Vamos dar dicas de como utilizar o DBT para transformações de dados; Apresentar 2 competições de ML que acabaram de ser lançadas com prêmios incríveis e foco em brasileiros e latino-americanos; Compartilhar um livro (grátis) sobre como passar em entrevistas de Machine Learning e muito mais.

5 lições da área de negócios que vão te ajudar a se tornar um profissional de dados de maior impacto nas empresas

 

Eu já perdi as contas de quantas vezes vi profissionais de dados que tinham um excelente currículo e vastos conhecimentos técnicos mas que quando entraram para o mercado de trabalho não conseguiram agregar valor as empresas. Isso é bem mais comum do que pensamos.

O processo de análise de dados passa por diversas etapas que não são sequer abordadas nos cursos de tecnologia, como por exemplo técnicas de organização de ideias, comunicação, explicação do que foi analisado e "venda de ideias". Talvez por isso seja tão comum encontrar profissionais com sólidos conhecimentos técnicos, mas que na prática não conseguem provocar impactos nas empresas e se tornam analistas cada vez mais caros para os negócios.

Pensando nisso Tessa Xie escreveu um artigo bem interessante onde ela utiliza os aprendizados de negócios que teve como consultora da McKinsey e resolveu aplica-los nas principais rotinas de um profissional de dados. Ela resumiu tudo isso em 5 dicas imperdíveis que envolvem uma melhor organização de ideais, comunicação, defesa de pontos de vista e convencimento de outras pessoas envolvidas nos projetos. Além das lições ela apresenta algumas dicas de como praticar os pontos apresentados no dia a dia e se aperfeiçoar em cada um deles. (em Inglês)
 
Duas competições de Machine Learning onde os brasileiros já entram como favoritos aos prêmios

Meli Data Challenge 2021


Objetivo: Criar um modelo para prever quantos dias o estoque de itens do Mercado Livre vão durar com base nos dados históricos da empresa.

Premiação:
1º Lugar: NOTEBOOK LENOVO LEGION 5I + Monitor Samsung F390 27” + 100 USD credits for AWS/Google Cloud + Ticket for NeurIPS virtual conference

2º Lugar: NOTEBOOK ASUS ROG STRIX G512LI + Monitor Samsung F390 27” + 100 USD credits for AWS/Google Cloud + Ticket for NeurIPS virtual conference

3º Lugar: MONITOR SAMSUNG F390 27” + 100 USD credits for AWS/Google Cloud + Ticket for NeurIPS virtual conference

4º ao 10º Lugar: TICKET FOR NEURIPS VIRTUAL CONFERENCE

Obs: Prêmios apenas para residentes da Argentina, Brasil, Chile, Colômbia, México e Uruguai. 

Hackaton CER+BRASIL


Objetivo: Promover a ciência de dados para prover soluções e melhorias para as condições dos serviços de saúde da população com deficiência do Brasil.

Obs: As soluções desse Hackaton vão colaborar diretamente com a melhoria dos Centros de Reabilitação do Brasil, apoiando as oficinas ortopédicas, Sistema Único de Saúde (SUS) e Centros Especializados em Reabilitação (CER). 

Premiação:
1º Lugar: R$ 5.000,00
2º Lugar: R$ 2.000,00
3º Lugar: R$ 1.000,00

Todos: Certificado com horas de participação.

Polêmica: Na maioria das empresas Data Scientists e ML Engineers não passam de profissionais de luxo


Existe um claro "descasamento" entre as expectativas dos profissionais de dados e o que a maioria das empresas realmente precisa. Partindo dessa constatação, Adren Biarnes (ML Engineer no Dailymotion) publicou seu mais recente e polêmico artigo.

No post ele levanta alguns pontos muito importantes de reflexão, como por exemplo onde estão as maiores necessidades por dados das empresas (inclusive ele apresenta uma pirâmide das necessidades) e na outra ponta apresenta o que a maioria dos profissionais de ML realmente desejam fazer no dia a dia, nesse ponto fica bem claro esse descompasso entre necessidades e desejo dos profissionais. 

Diante disso, ele apresenta os principais pontos que os Data Scientists devem ficar atentos ao buscar por novas oportunidades de trabalho e assim aumentar as chances de terem as expectativas atendidas nessa busca. (em inglês)
 

Transformação de dados com DBT e AWS Athena


O Data Hacker Cícero de Moura deu show em seu mais recente post no blog do Data Hackers.

No artigo ele mostra um passo a passo de como criar um ambiente de Data Lakehouse dentro da AWS, utilizando o DBT + Athena.

Nesse tutorial ele explica os conceitos por trás de cada uma das ferramentas apresentadas e mostra como é possível ter mais eficiência e organização nos processos de transformação de dados, testes, documentação e construção de Data Warehouses. 

Por fim é apresentado um passo a passo, utilizando uma base de dados real disponível na internet para que você consiga aprender tudo com a "mão na massa". (em português)
OUTROS TÓPICOS
Uma breve introdução ao Shadow Mode em Machine Learning
Uma estratégia simples que pode mitigar riscos dos modelos em produção sem impactar negativamente usuários reais ao longo do caminho. (em Português)

Reorganizando as DAGs do Airflow de um time em crescimento
Veja como a equipe de dados do Ministério da Economia encarou o desafio de expandir o time de engenharia de dados e as DAGs do Airflow. (em Português)

Construí uma aplicação utilizando o GitHub Copilot e aqui está o resultado
Será que todo o buzz em torno do Github Copilot vai mesmo fazer sentido? Nesse post Simona Winnekes conseguiu acesso a ferramenta e mostrou com detalhes como ela funciona na prática.
Spoiler: Parece que essa ferramenta ainda não vai roubar seu emprego. (em Inglês)

Conheça o Deepnote, o futuro dos Notebooks
A ideia é simples e genial, um Notebook (compatível com o Jupyter) rodando na nuvem e com a possibilidade de colaboração em tempo real. (em Inglês)
Dica de Livro

Se você se sente despreparado para os desafios e testes envolvendo técnicas de Machine Learning em entrevistas de emprego não deixe de dar uma olhada nesse livro. É um livro totalmente gratuito e disponibilizado online, com dicas e exercícios práticos que vão te ajudar a se preparar melhor para essas entrevistas. (em Inglês)
VAGAS DA SEMANA
  • Experiência em Computer Vision ou Machine Learning (ou Doutorado ou Mestrado concluído com pesquisa em área relacionada à Computer Vision);
  • Experiência no desenvolvimento e otimização de modelos de Machine Learning;
  • Experiência com bibliotecas como OpenCV, SKlearn, PyTorch e frameworks como TensorFlow e Keras;
Data Engineer com o foco em DataOps - Hotmart
Belo Horizonte-MG, São Paulo-SP, Brasília-DF ou Remoto
  • Configuração de ambientes Cloud para Big Data (EMR, Lambda, Glue, Athena, Step Functions e SageMaker);
  • Programação em Java e/ou Python e/ou Scala;
  • Conhecimento em Orquestradores de dados (Airflow, Luigi, Astronomer, Argo, Step Functions, Kube Flow);
  • Conhecimentos de Docker e Kubernetes;
  • Automação de Infraestrutura com Terraform;
MEME DA SEMANA
Tradução:

Pesquisa: 
Opção 1 - 99,8% - Sim, eu adoro responder pesquisas
Opção 2 -   0,2% - Não, eu descarto todas as pesquisas que recebo
Conclusão: "Recebemos 500 respostas e descobrimos que as pessoas adoram responder pesquisas"

E você? Já cometeu esse mesmo tipo de viés em pesquisas?
DATA VISUALIZATION DA SEMANA
O site "Visual Capitalist" nunca fez tanto jus à seu próprio nome. Nesse artigo repleto de visualizações de dados incríveis eles decidiram comparar o valor de mercado de gigantes de tecnologia como Amazon, Microsoft, Apple e Facebook com o PIB anual de diversos países do globo. A comparação é surpreendente e chega a causar muita reflexão sobre o tamanho e valor de mercado dessas empresas. (em inglês)
PRÓXIMOS EVENTOS E MEETUPS [100% ONLINE]
29 de Julho - Evento Gratuito e 100% Online
  26 de Julho a 04 de Agosto - Evento Gratuito e 100% Online

DataOps Summit 2021
28 a 30 de Setembro - Evento Gratuito e 100% Online
Facebook
Site
LinkedIn
Twitter
Medium
Copyright © *|CURRENT_YEAR|* datahackers.com.br.

Want to change how you receive these emails?
You can update your preferences or unsubscribe from this list.

©2018-2021 - Data Hackers, Todos os direitos reservados.

Site por Kaordica