Newsletter

O que é um Data Lake? 🌊

Enviado em: 2020 M09 8
View this email in your browser

O que é e pra que serve um Data Lake? 🤔🌊


Fala, Data Hacker! Seja bem-vindo a nossa newsletter! Logo depois do feriadão estamos trazendo AQUELE compilado especial pra vocês, com destaque pra esse episódio do podcast do DH sonhado pelos engenheiros de dados que nos acompanham: O que é, pra que serve e como construir um Data Lake? Sim, dessa vez trouxemos 2 data engineers feras no assunto pra explicar essa hype pra nós.

E tem bem mais: como mentir com Data Science, dicas de Jupyter, de Redshift e de prototipagem de dashboards, vagas muito tops e aquele meme da semana pra descontrair. Bora ver?!

O que é um Data Lake?

No tão esperado episódio onde voltamos a discutir temas de engenharia de dados, vamos falar do que talvez seja o maior assunto de interesse na área atualmente: Data Lakes! Nesse papo, além de mim, Allan Sene - cara que adora esse assunto - estão André Sionek, que é Data Engineer na Gousto, na Inglaterra; e Maikel Penz, Senior Data Engineer na Spidertracks, na Nova Zelândia.

Lembre-se que o Data Hackers é um podcast quinzenal que você pode ouvir gratuitamente em qualquer player de podcast, como SpotifyiTunesGoogle PodcastCastbox e muitos outros (em Português)
 



Ah! Lembrando que esse episódio é trazido pelos nossos parceiros da DataSprints, que estão lançando esse mega curso Data Lakes na Prática ONLINE!
 

datalakes datasprints

Clique aqui para conferir!


Nele você vai aprender, desde do básico, como construir, modelar e produtizar Data Lakes, utilizando as melhores ferramentas de mercado: Dremio e Power BI. Tudo que você precisa pra resolver de vez por todas a bagunça nos dados da sua organização, entregando valor de maneira rápida e relevante.

Como mentir com Data Science!


Você já mentiu? Claro né... mas, e usando dados? Sim, isso é totalmente possível e está cada vez mais comum de se ver por aí, seja por vontade própria da galera ou mera ignorância. É sobre isso que Paulo Vasconcellos discorre nesse artigo incrível!

A partir de embasamentos em livros muito bacanas, nosso co-fundador se aprofunda nos viéses que existem nos indivíduos e como isso afeta diariamente nossa análise de dados. IMPERDÍVEL! (em Português)
 


5 Hacks de Jupyter Lab para te deixar fera!


Já tem um pessoal fazendo guerra entre Jupyter e IDEs como Visual Code. Como bom programador, sempre fui um IDE-guy, mas confesso que com essas 5 dicas aqui eu poderia repensar em usar um Jupyter de vez em quando.

Nesse post breve, porém MUITO ÚTIL, a cientista de dados Meirav Ben traz 5 dicas bem legais pro nosso server de notebooks do dia a dia. Desde atalhos salvadores, até dark-mode no Jupyter Lab. Veja! (em Inglês)
 
TÓPICOS AVANÇADOS
5 Ferramentas para prototipar seus dashboards antes de sair gambiarrando!
Esse post bem bacana da Nathalia Mazo traz um compilado de 5 ferramentas pra prototipar dashboards. Com análise de preço, prós e contras, a Nathalia vai te ajudar a parar de ficar gambiarrando dashboard antes de ver direitinho como que as informações vão ficar na telinha do seu chefe. (em Inglês)

10 Dicas para melhorar a performance do seu Amazon Redshift
Pode reclamar de ser caro, de ser copia de um Postgres parrudo ou de o copy from S3 ser uma carroça com roda velha, mas um Redshift bem tunado resolve MIL problemas que nos anos 2000 precisavam de pelo menos 10 especialistas Hadoop para resolver. Esse post incrível no blog da AWS compila 10 dicas imperdíveis para deixar seu cluster nos trinques! (em Inglês)

LGPD: vai ou não vai?!
A LGPD - Lei Geral de Proteção de Dados - acabou de passar pelo Congresso Nacional e segue para sanção presidencial. Já estão discutindo a criação da ANPD - Agencia Nacional de Proteção aos Dados - e tudo mais. Mas: já é pra valer ou não?! Nesse ótimo texto, Cristina Terra dá um overview sobre tudo no que se refere essa lei tão importante para nosso cenário no Brasil.
(em Português)
 
VAGAS DA SEMANA
  • Inglês e Português/Espanhol fluente
  • 10 anos de exp. na área de dados
  • Exp. em liderança de times
  • Grande entendimento em Estatistica, DataScience, SQL e modelagem
  • Formação em Computação ou relatadas
  • Proeficiência em SQL
  • Exp. em Data Lakes e DWs
  • Conhecimento em Python, Scala, Spark, Flink ou Airflow é diferencial
DICA DE VIDEO
 
Rapaz, o que tem de if-else enganando a galera por aí que é IA, não tá escrito! Pra nos ajudar na identificação do que é realmente Inteligência Artificial, a nossa colega Kizzy, do Canal Programação Dinâmica, fez esse video muito bacana comentando e traduzindo um fluxograma do pessoal do MIT Technology Review. Ah, não vem reclamar comigo depois que a gente tá desfazendo hype não hein! hahaha (em Português)
MEME DA SEMANA
Mestre Ng só me enrolando no saudoso curso de ML no Coursera...
DATA VISUALIZATION DA SEMANA
Explorando Iowa com mapas e lindas fotos
Imagina você poder ter um album totalmente imersivo, com fotos e diversos mapas e visualizações de dados de cada viagem sua? É com esse gostinho que o Allen Carrol, engenheiro da ESRI - criadora do ArcGIS - fez esse storymap incrível cruzando fotos e mapas de Iowa, pacato estado do interior dos EUA. (em Português)
PRÓXIMOS EVENTOS E MEETUPS [100% ONLINE]


São Paulo Kafka Meetup by Confluence
22 de setembro de 2020 - 15:30 até 16:30 - Online Gratuito

NLP Summit
06 a 16 de outubro de 2020 - Online Gratuito

AWS re:Invent 2020
30 de Novembro a 18 de Dezembro de 2020 - Online gratuito
Facebook
Site
LinkedIn
Twitter
Medium
Copyright © *|CURRENT_YEAR|* datahackers.com.br.

Want to change how you receive these emails?
You can update your preferences or unsubscribe from this list.

©2018-2020 - Data Hackers, Todos os direitos reservados.

Site por Kaordica