Newsletter

Saiu o resultado da pesquisa de mercado do DATA HACKERS! 🎉🎊

Enviado em: 2020 M05 11
View this email in your browser

Finalmente: o resultado da pesquisa de mercado do Data Hackers

Fala, Data Hacker. Seja bem-vindo a mais uma newsletter! Hoje é um dia especial, porque estamos finalmente publicando o resultado dessa que pode ser uma das mais completas pesquisas de Data Science no Brasil!

Mais de 1700 pessoas responderam nossa pesquisa, compartilhando dados que vão desde faixa salarial até quais as ferramentas que mais usam no trabalho. Claro que, como vocês devem imaginar, prezamos pela anonimização e descaracterização de todas as respostas, mas muita análise legal deve sair desse dataset.

Muito obrigado a todos pela participação, confiança e paciência. Aprendemos muito durante essa que foi nossa primeira pesquisa, e prometemos melhorar para as próximas e deixar os resultados bem mais fáceis de acessar. Queria aproveitar e deixar um agradecimento ao Dourival Pimentel, que nos ajudou muito na limpeza e tratamento dos dados.

Mas, não é só disso que falaremos na news de hoje! Você conhecerá o repositório definitivo para aprender Deep Learning; o motivo pelo qual você não precisa temer robôs; e até como fazer um detector de poses.

A pesquisa de Ciência de Dados no Brasil do Data Hackers

 

É claro que não poderíamos divulgar nosso dataset em uma plataforma diferente do nosso querido Kaggle. Isso mesmo, você já pode começar a criar seus kernels usando nosso dataset (não esquece de compartilhar seu trabalho no nosso Slack), quem sabe não aparece até aqui na news! Eu estou bem curioso em saber que tipo de análises vocês irão fazer. Que tal começar respondendo algumas dessas perguntas?
 

  • Pessoas que começam na área, geralmente ganham quanto? A regra vale para todas as regiões e estados?
  • Todo mundo que trabalha com DS está usando Machine Learning?
  • Como está o gender gap no Brasil? Há diferença salarial entre homens e mulheres na área?
  • Há muitas pessoas de áreas não-exatas trabalhando com Data Science?
  • Cargos de gestão ganham mais do que cargos técnicos?
Um último pedido: ajude a gente a ter mais visibilidade clicando no "upvote" (setinha pra cima) do dataset para que ele tenha um ranking melhor no Kaggle datasets e que mais pessoas possam utilizar.

Detectando poses usando apenas o seu browser e o TensorFlow.js


O Data Hacker Hugo Zanini fez esse post bem legal falando sobre como usar o TensorFlow.js (versão para browser do famoso framework do Pai Google) mostrando como fazer pose estimation para detectar a pose de pessoas em exercícios físicos. E você pode conferir todo o código usado no projeto no Github do Hugo (em Português)
 

Você não precisa ter medo de robôs (segundo o criador de um dos mais famosos)


Tanto na cultura pop quanto nos papos que temos, sempre surge o assunto sobre o futuro das máquinas e̶ ̶c̶o̶m̶o̶ ̶e̶l̶a̶s̶ ̶v̶ã̶o̶ ̶n̶o̶s̶ ̶e̶s̶c̶r̶a̶v̶i̶z̶a̶r̶  e o futuro do trabalho.

Dessa vez, o criador do Roomba - aquele robô aspirador da iRobot - conta os desafios de criar um "simples" robô com uma tarefa única, e como a ideia de que eles vão estar em todos os lugares está longe de acontecer. Desculpe, mas não vai ser hoje que teremos nossa própria Skynet (em Inglês)
 
TÓPICOS AVANÇADOS
Uma thread explicando como o Prophet do Facebook funciona
Sean Taylor - Pesquisador na Lyft - conta como o Facebook Prophet (uma as mais famosas bibliotecas de Time Series Forecasting) funciona. (em Inglês)

O repositório definitivo para você aprender Deep Learning
Alguém teve a excelente ideia de reunir em um repositório no Github dezenas de conteúdos relacionados a Deep Learning, a grande maioria com vídeos gratuitos no Youtube. Tem curso sobre Reinforcement Learning, NLP e até aulas com os fundamentos de Machine Learning. Curtiu a ideia? Não esqueça de deixar um Star no repositório do autor. (em Inglês)

Como criar um classificador de texto baseado em cinco competições no Kaggle
Problemas de NLP geralmente possuem dezenas de abordagens diferentes, mas podemos aprender com os melhores. O pessoal da Neptune.ai reuniu nesse post as melhores dicas para lidar com datasets com pouco ou muito dado, como limpar dados para NLP, como treinar modelos, e muito mais. (em Inglês)
VAGAS DA SEMANA
Data & ML Engineer - AWS
São Paulo - SP
  • Python, Java ou Javascript
  • 5+ anos de experiência
  • Experiência com Flink, Spark, Flume
  • Experiência com Kinesis, Kafka ou Storm
  • Python ou R
  • SQL
  • Git
  • Machine Learning
DICA DE LIVROS
Quando está na hora de enfrentar problemas de Machine Learning no mundo real, é muito importante sabermos como vamos abordar um problema. Não estou falando sobre você já pensar se vai usar Keras ou PyTorch, mas sim dar alguns passos antes disso, como estimar o tamanho do escopo e complexidade do problema; como você irá monitorar sua solução; e, principalmente, como você pode entregar o modelo o mais simples possível. Esse livro da O'Reilly traz esses e muitos outros pontos que podem te ajudar. (em Inglês)
DATA VISUALIZATION DA SEMANA
A estrutura de um show de comédia stand-up
Do que é feito um show de stand-ups? Piadas e risadas, você diria. Mas, como você chega no clímax do show, arrancando o máximo de risadas possíveis do público? O pessoal do The Pudding fez um estudo completíssimo sobre o show de stand-up da comediante Ali Wong, que possui um especial na Netflix, analisando como é feita a construção de suas piadas e como elas refletem nas risadas do público. (em Inglês)
PRÓXIMOS EVENTOS E MEETUPS [100% ONLINE]

#05 Open Space by DataSprints - Airflow: Organizando Data Pipelines
14 de Maio de 2020 - 19:00
Gratuito - 100% Online - Português
Facebook
Site
LinkedIn
Twitter
Medium
Copyright © *|CURRENT_YEAR|* datahackers.com.br.

Want to change how you receive these emails?
You can update your preferences or unsubscribe from this list.

©2018-2020 - Data Hackers, Todos os direitos reservados.

Site por Kaordica