Newsletter

Uma semana bem mão na massa em dados! 👏

Enviado em: 2020 M06 15
View this email in your browser

Uma semana bem mão na massa em dados!


Fala, Data Hacker! Nessa quarentena, nada melhor do que arrumar coisas relevantes pra ocupar a cabeça, não é mesmo? Pra desbancar as lives sertanejas, a news dessa semana vai te trazer um monte de tutorial, guias e projetos pra você desenvolver aí no conforto da sua casa e aprender mais sobre Ciência, Engenharia de Dados, Auto ML e mais!

Hoje trouxemos: como criar um bot para monitorar investimentos, como fazer webscrapping de gráficos interativos em Python, várias dicas sobre Apache Airflow em produção, além de lives e eventos imperdíveis de dados, pra dar um up na sua semana!

Bora conferir?

Auto ML - O guia completo: O que é, como funciona e quais limitações

Auto-ML é um assunto que sempre estamos falando, tanto nos podcasts, quanto no nosso chat no Slack. Porém muita gente ainda não entende bem como funciona, quando usar e se vale mesmo a pena substituir o bom e velho toque humano no processo de modelagem.

O nosso parceiro Flávio Clésio, Machine Learning Engineer na My Hammer, escreveu um guia completaço sobre Auto-ML no nosso blog. Dividido em 3 partes, o Flavio passa por todos os pontos essenciais para quem quer entender de vez o que é esse hype.

Fazendo um bot inteligente com ML para monitorar investimentos


Imagina você, enquanto trabalha tranquilamente, recebe uma mensagem em seu celular sobre uma compra imperdível de uma ação na Bolsa. Pois é, isso já é realidade e pode ser feito por você mesmo! Fellipe Gomes, Cientista de Dados na FGV, passa por todo o passo-a-passo de como criar um bot de ML para monitorar investimentos em tempo-real! (em Português)
 

Webscrapping em gráficos interativos em Python


É muito comum que informações hoje sejam disponibilizadas em gráficos interativos. Um bom exemplo é a busca sobre Dolar no Google. Em um post bem bacana pro blog do DH, Otávio Simões fez um tutorial de como coletar dados de gráficos interativos, como o do Dolar, usando Selenium e Python. Bacana demais! (em Português)
 
TÓPICOS AVANÇADOS
Open-source: Auto-Scalling de Airflow para AWS ECS
Quem usa Apache Airflow em produção já deve ter passado vários apertos para escalar a infra na hora que as jobs se acumulam. O Data Hacker, André Sionek, Data Engineer na Gousto, liberou o código de um projeto que vai facilitar nossa vida! Esse projeto contém toda configuração pra deploy de clusters auto-escaláveis do Airflow no gerenciador de containeres da AWS, o ECS.  (em Português)

Monitoramento do Apache Airflow com Grafana
Seguindo na pegada do orquestrador de ETL mais famosos dos últimos meses, agora trouxemos um guia do Diego Lopes, sobre como monitorar sua plataforma utilizando o Grafana, outro open-source. Diego também disponibiliza os códigos de configuração usados em seu github. Imperdível! (em Português)

Como servir modelos de Machine Learning em Produção?
Um dos maiores desafios em Data Science é produtizar os modelos inteligentes. Nesse post incrível, Bugra Akyildiz, Senior Data Science Manager e Mestre pela NYU, resume 3 formas mais comuns de se servir os modelos, quais são os prós e contras de cada um e dicas de como aplicar cada modelo! Sensacional! (em Inglês)
 
VAGAS DA SEMANA
  • Formação nas áreas de Estatística, Matemática, Computação, Física ou correlatas
  • Experiência com programação em Python ou R
  • Experiência com modelagem de crédito e técnicas de machine learning
  • Conhecimento sobre o negócio de Crédito
  • Python ou R
  • Bibliotecas de visualização (matplotlib, plotly, seaborn, etc)
  • Bibliotecas de Estatística, Machine Learning  (Ex.: scikit-learn, statsmodels, shiny, dplyr, etc)
  • Experiência com modelagem SQL
  • Experiência com Cloud (de preferência AWS)
DICA DE LIVE

Essa live do Data Council é imperdível! Vão trazer para falar do Amundsen, open-source amado na comunidade que faz de forma majestosa o Catálogo e Discovery de Dados, ninguém menos que Mark Grover, criador e product manager da plataforma. Inscreva-se pra não perder. Recomendamos também seguir o canal do Data Council, só evento top! (em Inglês)
DATA VISUALIZATION DA SEMANA
Página no Instagram sobre Data Viz
Dica do nosso querido Marlesson Santana, uma página só para visualizações e storytellings de dados no Instagram: a @storytellingcomdados. Com dicas bacanas sobre quais cuidados tomar quando for criar gráficos, posts com visualizações legais, como as que publicamos aqui semanalmente, além de uma dosezinha de humor. Siga lá! (em Português)
PRÓXIMOS EVENTOS E MEETUPS [100% ONLINE]

Open Space by DataSprints: Como começar a trabalhar com IA
17 de Junho de 2020 - 19:00

Meetup ML Ops: ML Engineering no Nubank
17 de Junho de 2020 - 13:00
 
Facebook
Site
LinkedIn
Twitter
Medium
Copyright © *|CURRENT_YEAR|* datahackers.com.br.

Want to change how you receive these emails?
You can update your preferences or unsubscribe from this list.

©2018-2020 - Data Hackers, Todos os direitos reservados.

Site por Kaordica