Newsletter

Kaggle vai pagar US$ 30 mil pelo melhor storytelling

Enviado em: December 7, 2020
View this email in your browser

Quer ganhar 30 mil bidens? Pergunte-me como

Fala, Data Hacker. Estamos de volta com mais uma newsletter! O destaque dessa edição vai para a pesquisa de 2020 do Kaggle, onde eles não só nos mostram o novo panorama de data science e machine learning no mundo, mas que também vai premiar a melhor história com nada mais de US$ 30 mil. Saiba mais abaixo.

E mais: falaremos sobre como a DeepMind resolveu um problema de 50 anos da Biologia; o que está por trás da demissão de Timnit Gebru da Google; e a nova biblioteca do Prophet do Facebook.

A competição do Kaggle que vai pagar US$ 30 mil para o melhor storytelling

Nem só de competições de Machine Learning é feito o Kaggle. Saiu recentemente a nova pesquisa anual deles sobre o mercado de DS e ML ao redor do mundo, e como já fizeram em outras edições, esse ano eles irão premiar a melhor história com os dados da pesquisa.

Os storytellings serão avaliados em diferentes quesitos, como originalidade, a composição da história e documentação da solução, onde o vencedor irá embolsar 30 mil Bidens. E aí, quem vai participar? (em Inglês)

AlphaFold: como a DeepMind resolveu um problema de 50 anosd a Biologia usando AI



Uma das notícias mais comentadas na última semana foi o feito da DeepMind, que conseguiu resolver um problema de 50 anos, chamado de Protein Folding, que tenta entender a estrutura 3D de uma proteína e, consequentemente, entender o que ela faz.

Uma das coisas que mais me chamaram a atenção foi o fato da solução utilizar mais ou menos o equivalente a 200 GPUs, uma quantidade, segundo a DeepMind, "modesta" em relação aos feitos anteriores. Queria ter essa modestia. (em Inglês)
 

O que está por trás da demissão de um dos maiores nomes de ética em AI da Google


A Google aparece de novo da nossa news, mas dessa vez em uma notícia ruim. Timnit Gebru é um dos maiores nomes quando o assunto é ética em AI, e ela criou e liderou um dos maiores times do mundo na Google, além de contribuir com diversos papers que salientaram os problemas de viéses e ética em algoritmos.

Nessa semana, Gebru compartilhou no Twitter a sua demissão pela Google, depois de tentativas de publicar um novo paper sobre os problemas que grandes modelos de linguagem como o BERT podem causar. O pessoal do MIT Technology Review teve acesso ao paper e mais sobre o caso, detalhando mais nesse post. (em Inglês)
TÓPICOS AVANÇADOS
Nova falha no Ministério da Saúde expõe dados de 240 milhões de brasileiros
Segundo a própria notífica, "Uma grave falha nos sistemas digitais do Ministério da Saúde levou à exposição dos dados pessoais de cerca de 243 milhões de brasileiros. A brecha foi encontrada no sistema de notificações da Covid-19, disponibilizado no primeiro semestre pelo governo, e permitia a consulta às informações de qualquer brasileiro cadastrado no SUS (Sistema Único de Saúde) ou que seja beneficiário de um plano de saúde no país." (em Português)

A nova biblioteca do Facebook para lidar com séries temporais
Provavelmente você já ouviu falar no Facebook Prophet: uma biblioteca aberta em R e Python para previsão de séries temporais. Eu mesmo sou muito fã dela, sendo uma ótima opção para primeiros protótipos de modelos de previsão.
Contudo, a empresa do Markinhos Zuck divulgou recentemente uma nova biblioteca baseada no Prophet: a Neural Prophet, que utiliza muitas das APIs e comandos da já conhecida biblioteca, mas que agora possui suporte a redes neurais em PyTorch para calibrar as previsões. Com certeza vale a pena investir uma horinha pra testá-la. (em Inglês)

Como o Google está usando AutoML para prever séries temporais
Não é só o Facebook que está avançando nas suas abordagens a problemas de previsão de série temporais. Em um post publicado essa semana, a Google demonstrou como está usando AutoML para resolver problemas de Time Series Forecasting. Segundo a publicação, a solução deles conseguiu atingir resultados impressionantes em competições de Machine Learning especializadas, como o M5 Forecasting, além de algumas outras competições do Kaggle, chegando a ficar entre os melhores 2,5% dos competidores. (em Inglês)
VAGAS DA SEMANA
Data Engineer - Amaro
São Paulo - SP (Remote OK)
  • +2 anos de experiência como Data Engineer
  • Modelagem de dados
  • Python
  • SQL
  • Inglês intermediário/avançado
  • Python
  • SQL
  • Ferramentas de BI (Metabase, Looker, Tableau)
  • Comunicação
  • Storytelling
DICA DE VÍDEO
Analistas deveriam aprender AI?
Nesse novo vídeo da Cassie Kozyrkov, ela explica o quanto de AI um analista precisa saber. O segredo, segundo ela, é sempre imaginar o que te deixará mais ágil para criar análises poderosas em menos tempo. Separe 2 minutinhos do seu dia para ver esse vídeo, vale a pena. (em Inglês)
MEME DA SEMANA
DATA VISUALIZATION DA SEMANA
As empresas que mais cresceram durante a pandemia
Um dado interessante é sobre o Alibaba, que esse ano bateu um novo recorde no Dia dos Solteiros, faturando mais de R$ 302 bi. Se a visualização considerasse os dados de novembro, provavelmente estaria em uma posição mais alta ainda.
PRÓXIMOS EVENTOS E MEETUPS [100% ONLINE]

AWS re:Invent 2020
30 de Novembro a 18 de Dezembro de 2020 - Evento online gratuito

Meetup de ML do Nubank: Especial Fim de Ano
8 de Dezembro - Evento online gratuito
Facebook
Site
LinkedIn
Twitter
Medium
Copyright © *|CURRENT_YEAR|* datahackers.com.br.

Want to change how you receive these emails?
You can update your preferences or unsubscribe from this list.

©2018-2021 - Data Hackers, Todos os direitos reservados.

Site por Kaordica