Newsletter

Tendências em Data Science para 2020 ↗👀

Enviado em: 2020 M02 3
View this email in your browser

Quais as mais aguardadas tendências em Data Science para o ano de 2020?


Fala, Data Hacker! Estamos de volta com mais uma edição da sua newsletter favorita!

Você por acaso já parou para imaginar quais serão as principais tendências em Data Science em 2020? Qual será a próxima hype? Teremos muitas novas "modinhas"? Será que aquela velha promessa relacionada a inteligência artificial vai finalmente ganhar o mercado ou será descontinuada?

Pois é exatamente esse o assunto que vamos falar na volta de mais uma temporada do Podcast do Data Hackers!

Mas tem muito mais, quer ver?
Vamos mostrar como uma garota que ainda não sabia programar conseguiu dar a volta por cima e se tornar uma cientista de dados em seis meses; vamos apresentar como problema "muilti-armed bandits" pode ser utilizado para otimizar soluções de machine learning; nessa edição vamos falar um pouco de web scraping e dar dicas para quem quer utilizar essa técnica; compartilharemos o que há de novo no Pandas 1.0.0 e no RStudio 1.3; além disso tudo ainda temos conteúdos relevantes de NLP e sobre os desafios de colocar em produção modelos complexos.

E aí o que está esperando? Bora pros conteúdos?
 

O Podcast do Data Hackers está de volta!
Conheça quais são as principais tendencias
em Data Science para 2020

O grande anúncio dessa semana é que o Podcast do Data Hackers está de volta! E para voltar com força total convidamos duas pessoas incríveis para o bate papo: Os Community Managers da comunidade Data Hackers - Marlesson Santana e Mario Filho.

Dessa vez o objetivo foi discutir a fundo quais serão as principais tendências da área de Data Science, Machine Learning, Data Engineering e Big Data em 2020. 

Se você também está curioso para descobrir o que esses malucos acreditam que será tendência nesse ano corra logo para ouvir esse episódio! (em Português)

*Lembrando que você também pode ouvir nosso podcast no SpotifyItunesGoogle PodcastCastbox ou no agregador de podcasts de sua preferência.

Como a Kate se tornou Data Scientist em 6 meses sem ter nenhum conhecimento em programação anteriormente


Calma, esse post não é um clickbait. Não vamos falar que 6 meses é o tempo necessário para uma pessoa que não sabe nada se tornar um Cientista de Dados desejado pelo mercado, mas a história da Kate Marie Lewis merece destaque. Ela era phd em neurociência (sem conhecimentos em programação) e durante 6 meses trabalhou duro para se tornar uma Data Scientist. No post ela mostra quais foram os passos para encarar o medo da tecnologia e se desenvolver. (em Inglês)
 

Entenda como o problema "Multi-armed Bandits" pode te ajudar a otimizar as escolhas do seu modelo de Machine Learning


Fique atento pois é bem raro encontrar um post com um conteúdo tão relevante em português! O Data Hacker Marlesson Santana, escreveu esse post incrível explicando detalhadamente os conceitos por trás do problema "multi-armed bandits", um clássico desafio de Reinforcement Learning. No fim, ele mostra quais as principais aplicações dessa técnica na solução de problemas do mundo real. CONTEÚDO IMPERDÍVEL. (em Português)
TÓPICOS AVANÇADOS
Web Scraping: aquisição de dados em páginas web com Python
O Data Hacker K. Delphino fez uma introdução muito legal sobre Web Scraping para quem ainda é novo no assunto. No post ele mostra algumas das principais técnicas e ferramentas utilizadas em Python para a extração automatizada de dados de páginas da internet. (em Português)

A justiça decidiu: Web Scraping NÃO é ilegal (mas existem exceções)
Desde os primórdios da internet o uso de Web Scraping (utilizar algorítimos para extrair dados de websites de forma automatizada)  gera muita polêmica e questionamentos. Mas após uma longa discussão, a justiça americana decidiu que em geral o uso de Web Scraping não é ilegal em muitos casos (mas existem exceções). (em Inglês)

O que há de novo no Pandas 1.0
Veja as novidades dessa biblioteca que é amada por Cientistas de Dados do mundo todo. (em Inglês)

O que há de novo no RStudio 1.3
Veja as novidades dessa IDE incrível, que foi desenvolvida para atender as mais diversas necessidades dos Cientistas de Dados.

Obs: Já é possível utilizar Python no RStudio, vale a pena testar conhecer as possibilidades dessa ferramenta. (em Inglês)

Melhores práticas de NLP de acordo com a Microsoft
O NLP (natural language processing) é um conjunto de técnicas que estuda os problemas da geração e compreensão automática de línguas humanas naturais. Nesse repositório o time da Microsoft reuniu diversas dicas de boas práticas com exemplos reais sobre o assunto. (em Inglês)

Conheça o GPT-2 e entenda os desafios de se colocar modelos de alta complexidade em produção
O avanço das técnicas de Machine Learning tem aumentado consideravelmente a complexidade dos modelos que precisam ser colocados em produção. Criado pela OpenAI, o modelo GPT-2 promete se comunicar de forma muito semelhante ao ser humano, mas para isso ele possui mais de 1,5 bilhões de parâmetros o que exige um auto poder computacional para seu funcionamento. Daí surge o grande desafio, como colocar em produção super-modelos como esse? (em Inglês)
VAGAS DA SEMANA
Data Scientist - Hotmart
Belo Horizonte - MG
  • SQL
  • Machine Learning ou Modelagem Estatísica (GLM)
  • Python ou R
  • Ter atuado em projetos de Data Science
  • Conhecimento em ferramentas de BI ou Visualização de Dados (PowerBI, Tableau, Metabase ou Qlik)
Obs: Se você mora em outra cidade e tem interesse em se mudar para BH a Hotmart tem diversos incentivos para ajudar na mudança.
  • Experiência com o desenvolvimento de modelos de Machine Learning
  • Testes AB com modelos de ML
  • Experiência com modelos em produção
  • ETL e pipeline de dados
DICA DE VIDEO
As 5 etapas que garantem o sucesso de um projeto de Data Science
Nosso community manager Mario filho está de volta, e dessa vez ele vai apresentar quais as 5 etapas essenciais para garantir o sucesso em um projeto de Data Science. Vale a pena aprender com esse vídeo que é uma verdadeira aula!
 (em Português)
DATA VISUALIZATION DA SEMANA
Qual o destino do lixo plástico no mundo?
E mais uma vez a equipe do Nexo Jornal trás uma análise incrível sobre um tema altamente relevante para o cenário que vivemos atualmente. Nesse post, eles utilizaram muitas técnicas de visualização de dados para explorar o destino do plástico que consumimos e descartamos. Vale a pena conferir! (em Português)
PRÓXIMOS EVENTOS E MEETUPS

Semana de Ciência de Dados da UFPR
03 a 07 de Fevereiro de 2020
Curitiba/PR - 1 kg de alimento não perecível

Data Talks - Quero Educação
06 de Fevereiro 2020
São José dos Campos/SP- Gratuito
Facebook
Site
LinkedIn
Twitter
Medium
Copyright © *|CURRENT_YEAR|* datahackers.com.br.

Want to change how you receive these emails?
You can update your preferences or unsubscribe from this list.

©2018-2020 - Data Hackers, Todos os direitos reservados.

Site por Kaordica