Newsletter

Quais as maiores tendências na área de Dados em 2021? 😏🔮

Enviado em: February 22, 2021
View this email in your browser

Fique por dentro das principais tendências em Data Science, Machine Learning e Data Engineering em 2021!


Fala Data Hackers!

Preparados para descobrir as maiores tendências que vão acontecer (ou não) no mundo de dados em 2021? Respeitando a tradição gravamos maus uma edição do podcast sobre esse tema!

Além disso vamos dar dicas imperdíveis de produtividade no Jupyter Notebook, explicar um passo a passo para quem ainda está começando na linguagem R, discutir sobre o tradeoff envolvendo bias-variance, mostrar como funciona uma regressão linear e muito mais. Além dos posts incríveis feitos pela nossa própria comunidade vamos divulgar eventos e vagas de emprego na área de dados.
 
Vamos começar?

Tendências na área de Dados em 2021

O Podcast do Data Hackers voltou com tudo em 2021!

Para manter a tradição de 3 anos, vamos ver o que os fundadores da comunidade Data Hackers e Community managers acreditam que serão as maiores tendências na área de dados no ano de 2021.

No episódio de tendências que rolou no ano passado nós acertamos vários pontos (quem aí ainda vê bikes da Yellow e patinetes elétricos nas ruas?) mas erramos alguns pontos importantes também (não previmos nem mesmo a pandemia...). O objetivo nesse novo episódio é tentar acertar o que vai ser tendência de fato em no ano de 2021 num papo divertido, regado a muita informação relevante do mundo dos dados, piadas e muita futurologia!

Além dos fundadores (Allan, Lages e Paulo) esse episódio conta com a participação do Mario Filho, Marlesson Santana e Pietro Oliveira, community managers do Data Hackers. 

Lembrando que você pode encontrar o podcast do Data Hackers no SpotifyiTunesGoogle PodcastCastbox e muitas outras plataformas (em português)

R e RStudio: começando do zero


Se você está por dentro do que se passa na área de dados certamente já ouviu falar da linguagem R. Para tentar ajudar as pessoas que estão começando a utilizar o R o Data Hacker Ronaldo Baltar fez um post muito legal onde ele mostra todos os passos iniciais na linguagem R.

Além disso ele fez um tutorial de instalação e uso da IDE RStudio que permite que os cientistas de dados sejam muito mais produtivos. Se você nunca utilizou essa ferramenta eu recomendo fortemente que você acesse o post e a conheça melhor.

Obs: Antes de começar o debate R x Python saiba que é possível utilizar o RStudio para criar projetos em Python também, ok?
Abra sua mente, essa IDE conta com excelentes recursos para facilitar o dia a dia de qualquer Cientista de Dados.
(em Português)
 

O que é bias-variance tradeoff


Você sabe o que é bias-variance tradeoff e como isso impacta o seu modelo de Machine Learning? Não?

Independentemente da resposta acima, acredito que você tenha se deparado com alguns comportamentos inesperados depois da validação dos seus modelos, mais conhecidos como "overfitting" ou "underfitting".

Para entender melhor os como os conceitos de bias-variance afetam os modelos de Machine Learning o Data Hacker Carlos Alberto Bonfim
fez um post bem interessante mostrando visualmente esses conceitos e dando dicas de como ajustar melhor os modelos.
(em Português)
TÓPICOS AVANÇADOS
Como funciona uma Regressão Linear?
Se você ainda é novo na área de dados o conceito de regressão linear é um dos mais importantes quando pensamos em modelos de classificação. Para facilitar a vida de quem ainda está iniciando, o Data Hacker Carlos Alberto Bonfim resolveu demonstrar os conceitos por trás dessa técnica e fez um tutorial de como usar Regressão Linear em Python.
(em Português)

Hackeando o Xadrez com Decision Making Deep Reinforcement Learning
Pode falar que depois que você assistiu a série "O gambito da rainha" veio aquela vontade de aprender a jogar Xadrez tão bem quanto a Beth Harmon (mas você falhou miseravelmente nas primeiras tentativas de jogar contra o computador). Bem, o Data Hacker Octavio Bomfim Santiago escolheu outra alternativa e decidiu utilizar técnicas de Deep Reinforcement Learning para hackear o tabuleiro de Xadrez. O resultado (e o passo a passo) de tudo isso você vê nesse post incrível.
(em Português)

Indo Além da Acurácia: Entendo a Acurácia Balanceada, Precisão, Recall e F1 score
Você ainda acha que a acurácia é uma boa forma de avaliar a eficiência de um modelo de Machine Learning? Nesse post o Data Hacker Clébio Oliveira, mostra outras alternativas para serem utilizadas quando você estiver em busca das melhores métricas para validação de modelos de ML.
(em Português)

4 dicas simples e úteis do Jupyter Notebook
Se você busca ser sempre mais produtivo no dia a dia não deixe de acessar esse post. Ele apresenta 4 dicas simples, porém valiosas para deixar os notebooks mais eficientes.
(em Inglês)
 
Dica: Vários posts divulgados aqui hoje foram feitos por membros da nossa própria comunidade e você também pode participar!
Desde a criação da comunidade um dos canais mais relevantes que temos é o nosso blog/medium. Nele a própria comunidade escreve os conteúdos e fazemos questão de impulsionar através da nossa newsletter.

Com o crescimento da comunidade resolvemos mudar um pouco a forma com que as pessoas contribuem para o nosso blog mas fique tranquilo, a publicação continua super fácil.
 
Guia para enviar posts para o blog do Data Hackers
  1. Temos uma planilha com sugestões de temas relevantes para a comunidade - Link da planilha 
  2. Você vai precisar criar uma conta no medium (caso não tenha)
  3. Escrever o post e submeter
  4. Enviar um email para escreva@datahackers.com.br com o assunto Proposta de post: [TÍTULO DO SEU POST], no corpo do email, coloque o link do rascunho do post.
  5. Vamos avaliar o post e te tornar um Escritor do Data Hackers
  6. Post Publicado!

Observações:
¹ Os temas sugeridos na planilha são opcionais, você continua podendo publicar sobre qualquer assunto que julgar relevante no mundo dos dados, a ideia das sugestões é para ajudar pessoas que querem contribuir mas não sabem sobre o que escrever
² Os posts da planilha serão divulgados na newsletter garantindo um engajamento ainda maior

Se quiser entender mais temos esse post explicando o passo a passo
VAGAS DA SEMANA
  • Conhecimentos em R ou Python;
  • Entender conceitos estatísticos, incluindo testes e distribuições;
  • Noção aprofundada em Matemática, Estatística, Machine Learning e Ciência da Computação.
  • Experiência em Geoestatística (diferencial)
  • Conhecimento em Informações Geográficas (diferencial)
  • Experiência com ciência de dados/machine learning
  • Programação em Python e SQL
  • Conhecimento de nuvem (preferencialmente Azure e AWS)
Obs: Vaga exclusiva para mulheres mas no site da XP tem diversas outras vagas nas áreas de de tecnologia e dados.
Dica de Livro
Se você pretende utilizar Data Science para analisar o comportamento dos usuários que deixam de utilizar algum produto ou serviço, comece por este livro. Além de explicar detalhadamente como utilizar o poder dos dados para combater o "Churn" de usuários, o livro disponibiliza exemplos de códigos para você tentar replicar as mesmas técnicas nos seus projetos. No link acima, é possível ter acesso ao conteúdo do livro online de maneira gratuita e também é possível adquirir uma cópia física ou ebook. (em inglês)
MEME DA SEMANA
DATA VISUALIZATION DA SEMANA
Será que a Amazon arruinou o nome Alexa?
 Post interessante diretamente do Instagram do Statista, com os dados referente a nomes de recém nascidos nos USA decidiram partir para uma análise interessante: "Será que a Amazon acabou com a popularidade do nome Alexa, após dar esse nome para sua assistente virtual?". O que dá pra ver é que ano após ano a escolha do nome Alexa para as filhas tem sido cada vez mais rara por lá. (em Inglês)
PRÓXIMOS EVENTOS E MEETUPS [100% ONLINE]

Healthcare NLP Summit
06 e 07 de Abril - Evento Gratuito e 100% Online

ODSC East: Opens Data Science Conference
30 de Março a 01 de Abril de 2021 -  Evento Pago e 100% Online

Ai4 2021: Exploring Artificial Intelligence Across Industry
17 a 19 de Agosto de 2021 -  Evento Pago e 100% Online
Facebook
Site
LinkedIn
Twitter
Medium
Copyright © *|CURRENT_YEAR|* datahackers.com.br.

Want to change how you receive these emails?
You can update your preferences or unsubscribe from this list.

©2018-2021 - Data Hackers, Todos os direitos reservados.

Site por Kaordica