Newsletter

10 truques de Pandas para aumentar sua produtividade¬†ūüźľ

Enviado em: 2019 M03 18
View this email in your browser

10 truques de Pandas para aumentar sua produtividade

Fala, Data Hacker. Seja bem-vindo a mais uma newsletter! Nessa semana, n√≥s iremos te dar dicas sobre como aumentar sua produtividade utilizando Pandas, apresentar o que √© o Amazon DeepRacer e at√© lhe dizer quem √© o melhor cantor de m√ļsica pop da atualidade. Vamos l√°?

Meetup + Bootcamp do Data Hackers em Curitiba!
Na √ļltima semana, aconteceu na sede do EBANX o Meetup e Bootcamp do Data Hackers! Foi um evento incr√≠vel, com uma turma sensacional que acompanhou durante dois dias seguidos um treinamento que ensinou as principais t√©cnicas de Data Science e Machine Learning. Voc√™ pode conferir um pouco como foi o evento nas fotos acima.

10 truques de Pandas para aumentar a produtividade


O Pandas é uma mão na roda quando o assunto é tratamento e manipulação de estruturas de dados. Nesse tutorial, você irá aprender alguns truques fará seu trabalho com essa ferramenta ser cada ver mais produtivo. (em Inglês)
 

Como fazer Web Scraping em Python?
 

Web Scraping (ou Raspagem de Dados, ou Raspagem Web) é uma técnica que permite que você colete e transforme páginas web. Por exemplo, com essa técnica, você conseguirá extrair tabelas diretamente de páginas web, ou selecionar apenas alguns elementos que queira coletar, etc.

O Data Hacker Luis Felipe Bueno fez esse artigo irado no Medium do Data Hackers que ir√° te ensinar a utilizar essa t√©cnica. (em Portugu√™s) 

Você já conhece o Amazon DeepRacer?


Durante o Amazon re:Invent do ano passado (evento anual da Amazon para anunciar novos produtos) eles apresentaram o DeepRacer: um carro aut√īnomo que voc√™ pode programar com Intelig√™ncia Artificial. Durante nossa visita a sede do EBANX, n√≥s conhecemos o primeiro "carrinho" do Brasil, e foi incr√≠vel ver de perto essa ideia t√£o promissora. Se voc√™ quiser saber um pouco mais sobre o DeepRacer e seu potencial (vai rolar at√© liga de corrida), confira esse post da Amazon que conta tudo sobre ele. (em Ingl√™s)
 
T√ďPICOS AVAN√áADOS
Se correlação não implica em causalidade, o que implica?
√Č bem prov√°vel que voc√™ j√° tenha ouvido essa frase em algum lugar, certo? Pois agora voc√™ pode entender um pouco mais sobre isso. Nesse post escrito pelo Prof. Adam Kelleher, ele explica que Testes AB n√£o s√£o a √ļnica forma de validar essa ideia. (em ingl√™s)


A Hierarquia de necessidades de Machine Learning

J√° ouviu falar em Hierarquia de Necessidades de Maslow? √Č aquela pir√Ęmide que mostra todas as necessidades que o ser humano tem, que v√£o desde necessidades fisiol√≥gicas (comer, dormir,...) at√© coisas abstratas, como criatividade e realiza√ß√£o pessoal. J√° parou para pensar como essa mesma hierarquia poderia ser aplicada a projetos de Machine Learning? Foi exatamente o que o Data Hacker Pedro Tabacof fez nesse post irado! Ele detalha todas as necessidades de um projeto de ML, que v√£o desde entendimento de regras de neg√≥cio at√© a cria√ß√£o do modelo em si. (em Portugu√™s)
 

Entendendo Logloss de uma vez por todas

Logloss √© uma m√©trica utilizada para avaliar modelos de Machine Learning. Diferente de outras m√©tricas, uma das caracter√≠sitcas do Logloss √© penalizar modelos que fazem previs√Ķes erradas. Nesse caso, um acerto tem um peso diferente no c√°lculo da acur√°cia do que um erro. Contudo, as vezes pode ser um pouco dif√≠cil de interpretar os resultados, mas esse post promete te ajudar nisso. (em Ingl√™s)
DICA DE LIVRO
Building Data Science Teams (Gratuito)
Essa √© uma dica de livro para √†queles que querem saber como estruturar um time de Data Science. Escrito por ningu√©m menos que Dj Patil (criador do termo "Data Scientist" e Cientista que ajudou Obama em sua campanha), esse livro ir√° te mostrar n√£o s√≥ todas as aplica√ß√Ķes poss√≠veis de um time de Ci√™ncia de Dados (Marketing, Produtos, Suporte, Decision Science, etc.), mas tamb√©m quais tipos de atribui√ß√Ķes designar para cada profissional. (em Ingl√™s)
VAGAS DA SEMANA
  • Tableau
  • T√©cnicas de estrutura√ß√£o de Data Lakes
  • SQL
  • Python
  • Gerenciamento de cat√°logo de servi√ßos
  • Ingl√™s fluente
Data Engineer II - AWS
S√£o Paulo - SP
  • Superior Completo
  • Modelagem de dados
  • SQL
  • Data Warehouse
  • AWS
  • Ingl√™s Fluente
  • Ferramentas de BI (QuickSight, por exemplo)
DATA VISUALIZATION DA SEMANA
Quem é a maior estrela do pop?
Segundo o Billboard (uma das maiores e mais antigas revistas sobre ind√ļstria musical), m√ļsicos como Ed Sheeran e Taylor Swift foram os m√ļsicos mais populares de 2018. O problema √© que nenhum deles lan√ßaram um album em 2018. Ser√° que esse ranking realmente representa a cultura musical? √Č isso que esse post do The Pudding quer responder. (em Ingl√™s)
PR√ďXIMOS EVENTOS E MEETUPS

Code, Beer, Repeat - Spark com Zeppelin e Data Products
20 de Março de 2019
Social Miner - S√£o Paulo/SP - Gr√°tis

2¬ļ Meetup de Engenharia de Dados
21 de Março de 2019
MaxMilhas - Belo Horizonte/MG - Gr√°tis (Lista de espera)

1¬ļ Hacka do Maraca
29 e 30 de Abril de 2019
Maracan√£ - Rio de Janeiro/RJ - Gr√°tis
Facebook
Site
LinkedIn
Twitter
Medium
Copyright © *|CURRENT_YEAR|* datahackers.com.br.

Want to change how you receive these emails?
You can update your preferences or unsubscribe from this list.