Como a Uber, Airbnb e Linkedin lidam problemas de dados

Como eu consegui meu primeiro emprego como Engenheiro de Dados

A medida que o mercado amadurece, gigantes da tecnologia buscam e criam soluções para resolver desafios que Data Science e Machine Learning trazem, como descoberta, exploração, e gerenciamento de bases de dados. Na edição de hoje, você irá entender como empresas como Netflix, Linkedin e Uber vem lidando com esse desafio.Além disso, você irá entender como trabalhar com datasets pequeno, o que é p-value (segundo um Cientista de Dados), e irá conferir o relato de um Data Hacker que conseguiu seu primeiro emprego na área.

Entenda nesse post como empresas como Airbnb, Lyft e Netflix estão fazendo para lidar com problemas de catálogo e gestão de dados. O interessante desse assunto é que muitas das ferramentas utilizadas são de código aberto para você implementar e utilizar em seus projetos. (em Inglês)

Confira esse relato do Data Hacker Danilo Polo sobre como ele conseguiu seu primeiro emprego como Data Engineer na Tembici. Danilo salienta seu background como empreendedor e como ele tomou a iniciativa para mudar de area, mesmo em meio a tantos "nãos" recebidos em processos seletivos. Vale muito a pena conferir! (em Português)

 

Nem sempre aquele dataset limpinho e cheio de data points vai estar disponível para treinarmos nossos modelos. É muito comum encontrar em projetos de Machine Learning uma limitação (e, em alguns casos, até uma ausência) de dados para treinar. Nesse artigo de Kateryna Koidan, da Vertabelo, ela salienta alguns desses desafios e como podemos lidar com eles. (em Inglês)

As vezes, usar probabilidade frequentista não é o suficiente para um determinado problema. Nesses casos, considerar a incerteza pode ser uma grande vantagem em sua solução. E, nesse cenário, utilizar a modelagem bayesiana pode ser sua melhor escolha. Entenda nesse tutorial como utilizar essa modelagem utilizando Python em um projeto bem prático. (em Inglês)

Mais do que saber que seu p-value tem que ser menor que 0,01 ou 0,05 para fortalecer as evidências de rejeição da hipótese nula, é saber, de fato, o que é e como interpretá-lo. Nesse artigo do Towards Data Science, você irá entender melhor o p-value, através da visão de um Cientista de Dados. (em Inglês)

DICA DE PODCAST

DeepMind: The PodcastA DeepMind, empresa de pesquisa em AI da Google, está lançando uma série de 8 episódios para seu podcast. Focado em salientar desafios e avanços em pesquisas de Inteligência Artificial, o programa já possui alguns episódios lançados, e conta com grandes referências da indústria e academia.  (em inglês)

VAGAS DA SEMANA

  • Ensino superior completo;

  • +2 anos de experiência;

  • Data visualization;

  • Python e/ou R;

  • Hadoop ou Spark

  • SQL (diferencial);

  • Inglês avançado;

  • Excel;

  • Autodidata;

  • Resiliência

Homens estão cantando mais alto em músicas pop?Grandes hits do pop de 2019 possuem uma característica em comum: artisitas homens estão buscando notas mais altas em suas músicas. Entre um falsete e outro, o pessoal do The Pudding traz mais uma análise incrível onde eles analisam as maiores músicas cantadas por homens na história e entendem se isso é realmente uma tendência ou não! (em inglês)

PRÓXIMOS EVENTOS E MEETUPS

29 de agosto de 2019

São Paulo/SP - Gratuito

30 de agosto de 2019

MaxMilhas - Belo Horizonte/MG - Gratuito