Newsletter

Se eu tivesse que aprender Data Science novamente, começando do zero, como eu faria? 😯

Enviado em: 2020 M08 31
View this email in your browser

Se eu tivesse que aprender Data Science novamente, como eu faria?


Fala Data Hacker! Preparado para mais uma semana repleta de dados?

Em mais uma edição da sua newsletter preferida escolhemos um tema que sempre volta. Roadmaps de aprendizados em Data Science, afinal a pergunta que muita gente faz todos os dias é... Por onde começar a aprender dados?

Além disso tem muito mais! Vamos mostrar pra vocês as melhores práticas para aplicar metodologias ágeis em projetos de Data Science, falaremos um pouco sobre governança de dados apresentando um comparativo das principais ferramentas de catálogos de dados de 2020, teremos dicas de quem está passando pela primeira experiência profissional na área de dados, falar sobre tidymodels em R, algoritmos de grafos e sobre como um profissional júnior pode se organizar para ganhar experiência mais rápido.

Como você já está acostumado, teremos dicas incríveis e muito conteúdo feito pelos próprios integrantes da comunidade, não deixe de prestigiar e fazer perguntas nos comentários dos posts!

Se eu tivesse que começar a aprender Data Science novamente (do zero), como eu faria?

Nada melhor que contar com a sabedoria de quem já é experiente para pegar alguns atalhos para não precisar passar pelos mesmos perrengues que essas pessoas passaram, certo?

Para quem está entrando na área de dados esse tipo de orientação pode ajudar muito, afinal todos os dias somos bombardeados com diversos conteúdos, artigos, cursos, papers, bootcamps, livros e por aí vai.

Resultado: Quem está começando na área fica cada vez mais perdido e acaba se enrolando muito nesse início. 

Pensando nisso, Santiago Víquez Segura (que já é um cientista de dados bem experiente) repensou toda sua trajetória parar responder a seguinte pergunta: "Se eu tivesse que começar a aprender Data Science novamente (do zero), como eu faria?"

Sua reflexão se tornou um post bem interessante onde ele cria um roadmap cheio de materiais gratuitos para quem está começando, partindo do zero com dicas de cursos, livros e análises.

É um conteúdo muito legal e vale a leitura tanto para quem está começando e quer um direcionamento mais claro, quanto para quem já é mais experiente mas acabou deixando algo pra trás, ficando com alguns gaps de aprendizado na área. (em Inglês)

Usufruindo de técnicas Agile para entregar valor com dados


Com o aumento da complexidade e do volume dos projetos de dados surgem sempre as perguntas: "Como podemos ter um processo mais organizado e produtivo? Como ser mais ágil?".

Pensando nisso a Data Hacker Manuele Ferreira fez um post incrível mostrando como o uso de técnicas difundidas de Agile, na medida certa podem ajudar a equipe a ser muito mais eficiente.

O artigo conta com dicas de livros, processos, conceitos e ferramentas e mostra que tudo isso combinado pode ter um impacto muito positivo para os projetos. (em Português)
 

Catálogo de Dados: Um comparativo das principais ferramentas open-source utilizadas pela Uber, Netflix, Lyft, Linkedin e Air Bnb


Um dos maiores desafios das equipes de dados que lidam com um enorme volume de informação é organizar toda a bagunça. Afinal, são milhares de microservices gerando e armazenando terabytes de dados e todo esse amontoado de informação precisa fazer sentido e ser auditável, para que seja validado e agregue valor para a tomada de decisão.

É nessa parte que entram os catálogos de dados, ferramentas que auxiliam na organização e documentação dos dados das empresas.

Nesse post são listadas e comparadas várias soluções open-source criadas e utilizadas por gigantes da tecnologia como Linkedin, Uber, AirBnB, Netflix e Lyft. (em Inglês)
TÓPICOS AVANÇADOS
O que aprendi no meu primeiro emprego na área de dados
O Data Hacker Vinícius Galvão resolveu compartilhar com a comunidade seus principais aprendizados no primeiro emprego na área de Data Science, o resultado foi um post bem legal que pode ajudar muita gente. Vale a pena conferir! (em Português)

Como um cientista de dados júnior pode ganhar experiência rápido?
Certo, você já tem um emprego na área de dados e já fez vários cursos, mas como ganhar experiência mais rápido? Nesse post + video Daniel Bourke compartilha algumas dicas para quem está nesse momento de carreira, abordando aspectos relacionados a com obter mais visibilidade no trabalho, como comunicar melhor suas ideias e como lidar com projetos mais complexos. (em Inglês)

Introdução ao tidymodels em R
Se você é um heavy user da linguagem R, certamente já se beneficiou do pacote tidyverse (%>%) em alguns momentos. Nesse post o Data Hacker Gustavo santos apresenta uma introdução a biblioteca tidymodels que utiliza os conceitos do tidyverse para quem precisa criar modelos de Machine Learning. (em Português)

Explicando passo a passo (e visualmente) 10 algoritmos de Grafos
Algoritmos de grafos podem ser a solução para diversos problemas complexos na área de dados e seu uso vai desde o entendimento de redes sociais até detecção de anomalias. O problema é que os conceitos por trás da análise de grafos costumam ser igualmente complexos, e nem sempre são fáceis de serem compreendidos. Para tornar essa tarefa um pouco mais fácil esse post apresenta visualmente (e com gifs) 10 diferentes algoritmos de grafos mostrando suas principais aplicações na solução de problemas reais. (em Inglês)
 
VAGAS DA SEMANA
  • Experiência em projetos de governança de dados
  • Gestão de dados mestres
  • Gestão de qualidade dos dados e metadados
  • Arquitetura de dados e curadoria de dados
  • Possuir uma ou mais dessas certificações: [CISM; COBIT 5 Foundation; ITIL 4; CIPM; CIPT; CIPP; CISA; EXIM; CISSP]
  • Ferramentas de BI (Power BI, Tableau, Pentaho, Alteryx, ou SAP Hana)
  • Experiência em métodos ágeis: Scrum e Kanban;
  • Conhecimento em tecnologias e ferramentas de DW
  • Experiência em Modelagem Dimensional, OLAP, Data Prep, ETL, Catálogo de Dados
  • Conhecimentos em Bancos de Dados Relacionais e Colunares
  • Experiência em Dashboards/Self-Service Analytics;
DICA DE LIVRO

Esse livro é tudo o que você precisava para aprofundar seus conhecimentos em Deep Learning, um material completo, online e cheio de matemática. Os 19 capítulos ensinam detalhadamente toda a base por trás dos modelos de Deep Learning, partindo de modelos lineares básicos e chegando a modelos avançados e complexos. O livro acompanha scripts em Python organizados em Jupyter Notebooks para auxiliar na parte prática. É um material essencial para quem quer entrar mais a fundo nessa área. (em Inglês)
MEME DA SEMANA
Dica do Data Hacker Carlos Timoteo no nosso Slack.
DATA VISUALIZATION DA SEMANA
Tentando entender o machismo em filmes e se estamos evoluindo com o passar do tempo
Esse post recheado de Dataviz (com direito a um tutorial hands-on), aborda um tema muito importante o machismo no cinema. Para explorar esse tema foi utilizado o teste de Bechdel que avalia se um filme possui três condições básicas:
 
1 - Ao menos duas mulheres
2 - Que conversam entre si
3 - Falando sobre algo que não seja homem 
 
No post a equipe do Curso-R analisou a aplicação desse teste em diversos filmes de diferentes países e  tirou conclusões muito interessantes sobre o assunto. (em Português)
PRÓXIMOS EVENTOS E MEETUPS [100% ONLINE]

Prêmio Mercosul de Ciência e Tecnologia
Concurso para estudantes e pesquisadores com prêmios de até R$ 40 mil
Inscrições até 11 de Setembro de 2020


Flink Forward -The Apache Flink ® Conference
19 a 22 de Outubro de 2020 - Evento online gratuito

AWS re:Invent 2020
30 de Novembro a 18 de Dezembro de 2020 - Evento online gratuito
Facebook
Site
LinkedIn
Twitter
Medium
Copyright © *|CURRENT_YEAR|* datahackers.com.br.

Want to change how you receive these emails?
You can update your preferences or unsubscribe from this list.

©2018-2020 - Data Hackers, Todos os direitos reservados.

Site por Kaordica