Newsletter

Como a Uber, Airbnb e Linkedin lidam problemas de dados

Enviado em: 2019 M08 26
View this email in your browser

Data Science nas gigantes da indústria

A medida que o mercado amadurece, gigantes da tecnologia buscam e criam soluções para resolver desafios que Data Science e Machine Learning trazem, como descoberta, exploração, e gerenciamento de bases de dados. Na edição de hoje, você irá entender como empresas como Netflix, Linkedin e Uber vem lidando com esse desafio.

Além disso, você irá entender como trabalhar com datasets pequeno, o que é p-value (segundo um Cientista de Dados), e irá conferir o relato de um Data Hacker que conseguiu seu primeiro emprego na área.

Como Uber, Airbnb, Linkedin e Netflix lidam com Data Management

Entenda nesse post como empresas como Airbnb, Lyft e Netflix estão fazendo para lidar com problemas de catálogo e gestão de dados. O interessante desse assunto é que muitas das ferramentas utilizadas são de código aberto para você implementar e utilizar em seus projetos. (em Inglês)


Como eu consegui meu primeiro emprego como Engenheiro de Dados


Confira esse relato do Data Hacker Danilo Polo sobre como ele conseguiu seu primeiro emprego como Data Engineer na Tembici. Danilo salienta seu background como empreendedor e como ele tomou a iniciativa para mudar de area, mesmo em meio a tantos "nãos" recebidos em processos seletivos. Vale muito a pena conferir! (em Português) 

7 formas de lidar com datasets pequenos


Nem sempre aquele dataset limpinho e cheio de data points vai estar disponível para treinarmos nossos modelos. É muito comum encontrar em projetos de Machine Learning uma limitação (e, em alguns casos, até uma ausência) de dados para treinar. Nesse artigo de Kateryna Koidan, da Vertabelo, ela salienta alguns desses desafios e como podemos lidar com eles. (em Inglês)
 
TÓPICOS AVANÇADOS
Estimando probabilidades com modelagem bayesiana e Python
As vezes, usar probabilidade frequentista não é o suficiente para um determinado problema. Nesses casos, considerar a incerteza pode ser uma grande vantagem em sua solução. E, nesse cenário, utilizar a modelagem bayesiana pode ser sua melhor escolha. Entenda nesse tutorial como utilizar essa modelagem utilizando Python em um projeto bem prático. (em Inglês)

O que é p-value, segundo um Cientista de Dados
Mais do que saber que seu p-value tem que ser menor que 0,01 ou 0,05 para fortalecer as evidências de rejeição da hipótese nula, é saber, de fato, o que é e como interpretá-lo. Nesse artigo do Towards Data Science, você irá entender melhor o p-value, através da visão de um Cientista de Dados. (em Inglês)
DICA DE PODCAST
DeepMind: The Podcast
A DeepMind, empresa de pesquisa em AI da Google, está lançando uma série de 8 episódios para seu podcast. Focado em salientar desafios e avanços em pesquisas de Inteligência Artificial, o programa já possui alguns episódios lançados, e conta com grandes referências da indústria e academia.  (em inglês)
VAGAS DA SEMANA
  • Ensino superior completo;
  • +2 anos de experiência;
  • Data visualization;
  • Python e/ou R;
  • Hadoop ou Spark
  • SQL (diferencial);
  • Inglês avançado;
  • Excel;
  • Autodidata;
  • Resiliência
DATA VISUALIZATION DA SEMANA
Homens estão cantando mais alto em músicas pop?
Grandes hits do pop de 2019 possuem uma característica em comum: artisitas homens estão buscando notas mais altas em suas músicas. Entre um falsete e outro, o pessoal do The Pudding traz mais uma análise incrível onde eles analisam as maiores músicas cantadas por homens na história e entendem se isso é realmente uma tendência ou não! (em inglês)
PRÓXIMOS EVENTOS E MEETUPS

Mulheres & Ciência de Dados: carreira e oportunidades
29 de agosto de 2019
São Paulo/SP - Gratuito

Dojo de Big Data em Belo Horizonte
30 de agosto de 2019
MaxMilhas - Belo Horizonte/MG - Gratuito
Facebook
Site
LinkedIn
Twitter
Medium
Copyright © *|CURRENT_YEAR|* datahackers.com.br.

Want to change how you receive these emails?
You can update your preferences or unsubscribe from this list.