Newsletter

As trolagens do Python 🐍

Enviado em: February 16, 2021
View this email in your browser

As Trolagens da linguagem Python!


Ohayô, Unidos do Data Hackers! Não tem carnaval nas ruas, pra muitos não tem feriado, mas a newsletter mais amada da sua segunda, não falta!

Nessa edição trouxemos um conteúdo bem engraçado e divertido no destaque: como que o Python pode nos pregar peças de cair o queixo! Sim, nossa linguagem tão amada, apesar de simples e fácil de aprender, pode nos enganar, justamente pelas facilidades, como tipagem fraca, interpretação e passagem de parâmetros por referência.

E mais: Cortando 85% de custos no pipeline com AWS Athena, usando Jupyter no Docker, como o Samba é visto como dados, vagas muito legais, o meme da semana e muito mais! 

WTF, Python! Pegadinhas da linguagem que você ama!


O Python é uma linguagem muito divertida e fácil de aprender, isso ninguém discute. Mas, como várias linguagens interpretadas com tipagem mais fraca - pra quem ouve podcast, já sabe que pego no pé do javascript nesse sentido -, o Python tem suas "loucuras"! Dica do Data Hacker Fernando Talietta, aka Adamastor, no nosso Slack, esse repositório compila as peças que a linguagem que mais amamos - dirão que há divergências, né Lages? -  (em Português)

Como o Airbnb tem feito do Superset uma extensão do seu Dataportal


O Airbnb há anos tem dado grandes contribuições para mundo open-source dos dados. Dois projetos muito famosos, Superset e Airflow, foram criados lá e eles continuam como grandes contribuidores. Nesse artigo, o time de analytics do Airbnb mostra as features como cache de dados e - o mais legal, na minha opinião - a inclusão de widgets para dashboards! Que, por sua vez, são "embedados" dentro do Dataportal, o grande catálogo de dados da empresa. Muito bacana! (em Inglês)
 


Como o QuintoAndar usa Clean Code em seus pipelines


Manter um pipeline de dados durante anos é uma tarefa árdua. Nos últimos anos, ao invés de pipelines gráficos ou as famosas Stored Procedures, vimos um grande crescimento de pipelines usando código, principalmente Java, Python e Scala. Nesse post sensacional, a galera do time de Eng. de Dados do QuintoAndar, resume como tem aplicado os conceitos do Clean Code, livro épico do Uncle Bob, em seus ETLs, garantindo facilidade em manutenção e entendimento. Imperdível para qualquer time de Data Engineering. (em Inglês)
TÓPICOS AVANÇADOS

Como a EMX reduziu em 85% os gastos com seu pipeline de dados
Um pipeline de dados em uma grande empresa, mesmo com todos as features de uma cloud! Nesse post muito interessante do Blog da AWS, a EMX conta como ela utilizou Airflow com Athena para reduzir drasticamente seus gastos com seu pipeline, dando de quebra escalabilidade e facilidade de uso. (em Inglês)

Criando um ambiente personalizado no Jupyter com Docker
É comum ter que ter vários ambientes, com diferentes configurações para cada projeto que você tem no Jupyter. Nesse post muito bacana, o Data Hackers Augusto Herrmann ensina como usar o nosso amigo Docker para controlar tais ambientes e ter seus ambientes facilmente separados para desenvolver em Python no Jupyter. (Em Português)
 
VAGAS DA SEMANA
  • Experiência relevante em SQL e Python;
  • Conhecimentos Avançados em ML e Estatística;
  • Domínio de PySpark;
  • XP com versionamente de código (Github); 
  • Nuvem Azure;
  • Inglês intermediário.
  • Ensino superior em exatas e/ou engenharia
  • Experiência relevante com alguma linguagem de programação
  • Conhecimento intermediário/avançado de SQL
  • Desejável XP em ETL e Python
MEME DA SEMANA
Gradiente descendente? Nunca nem vi...
DATA VISUALIZATION DA SEMANA
Quem viu o samba passar?

O Carnaval não está nas ruas e a Sapucaí está vazia. Mas que tal dar uma olhada no que as letras do samba tem nos passado durante esses anos de música e cultura? O site Léxico do Samba compilou anos de letras em belas visualizações de dados, que dão um descritivo de como os sambistas aproveitam a riqueza de nossa linguagem para se manifestarem musicalmente. (em Português)

PRÓXIMOS EVENTOS E MEETUPS [100% ONLINE]

ODSC East: Opens Data Science Conference
30 de Março a 01 de Abril de 2021 -  Evento Pago e 100% Online

Ai4 2021: Exploring Artificial Intelligence Across Industry
17 a 19 de Agosto de 2021 -  Evento Pago e 100% Online
Facebook
Site
LinkedIn
Twitter
Medium
Copyright © *|CURRENT_YEAR|* datahackers.com.br.

Want to change how you receive these emails?
You can update your preferences or unsubscribe from this list.

©2018-2021 - Data Hackers, Todos os direitos reservados.

Site por Kaordica