Newsletter

Github Copilot: seu ajudante ou seu substituto?

Enviado em: July 5, 2021
View this email in your browser

Github Copilot: seu ajudante, ou seu substituto?


Fala, Data Hacker! Seja bem-vindos a mais uma newsletter!

Uma das grandes novidades dessa semana foi o lançamento do Github Copilot: uma AI capaz de gerar código a partir de linguagem natural. Resumidamente, é uma Inteligência Artificial em que você pode dizer, literalmente: "Quero uma função pra treinar uma Árvore de Decisão e retornar a acurácia", e ela irá retornar essa função pra você na linguagem que quiser.

Mas, quando uma notícia assim sai na mídia, parece que uma barata começou a voar e todo mundo ficou assustado, se perguntando: "Será que agora os programadores vão ser substituídos?". Essa não é uma discussão nova e reflete o medo das pessoas em perder seus empregos. Na newsletter de hoje, vamos compartilhar um artigo bem completo explicando não só o que é o Github Copilot, mas como ele funciona, suas aplicações e, principalmente, por que você não precisa ficar preocupado em ser substituído.

E mais na edição de hoje: como um dos maiores grupos de beleza do mundo está usando dados; Machine Learning no Espaço; como o DoorDash usa Forecasting, e muito mais.

EDIÇÃO ESPECIAL: GRUPO BOTICÁRIO
Essa edição é trazida a vocês pelo Grupo Boticário, a gigante brasileira dona de uma das maiores plataformas de beleza do mundo. Nos últimos meses, o Grupo Boticário tem feito um trabalho incrível de estratégia de dados, trazendo insights, e aplicando data science e machine learning em seus times e suas mais de 4 mil lojas. Saiba mais sobre o Grupo Boticário ainda nessa edição.

Como o Grupo Boticário está executando sua estratégia de dados

O pessoal do Grupo Boticário compartilhou com a gente a sua estratégia de dados para o grupo, falando sobre o desafio de organizar, analisar e gerar inteligência e produtos a partir de seu grande volume de dados gerados diariamente. 

Um dos pontos mais interessantes da estratégia que eles montaram está em seus pilares, que abrange desde a cultura do grupo até tecnologia e governança de dados. Lembrando que o GB nos últimos tempos vem comprando empresas de dados e tecnologia, como a GAVB e a Casa Magalhaes, além de criar novas empresas, como a fintech Mooz. Ou seja, um desafio bem legal de integrar dados e inteligências, além de criar produtos de machine learning em um grupo que lida com toda a cadeia de produtos de beleza.

Leia o artigo completo que eles fizeram pro Data Hackers e já aproveita pra seguir o blog deles no Medium e conferir suas vagas abertas em dados!

Github Copilot foi lançado. Deveríamos ficar preocupados?


O Copilot é uma AI que é capaz de gerar código, uma versão do GPT-3 da OpenAI feita especificamente pra esse propósito. E é claro que já tem muita gente perguntando se isso vai substituir programadores e data scientists. Nesse artigo no Towards Data Science, você pode conferir mais detalhes sobre sua implementação, suas aplicações, e porque você não precisa se preocupar com uma AI roubando seu emprego. (em Inglês) 

Como o DoorDash usa Machine Learning para Forecasting


O DoorDash é a maior empresa de delivery dos EUA e, como você pode imaginar, eles tem um grande desafio de prever oferta e demanda. Nesse artigo, eles dão mais detalhes sobre a abordagem usada com XGBooost e os resultados alcançados. Vale muito a pena conferir. (em Inglês)
TÓPICOS AVANÇADOS
Oxford e SpaceX lançam modelo de Machine Learning no espaço
Essa semana uma tecnologia criada por pesquisadores de Oxford foi lançada ao espaço em um foguete Falcon 9 da SpaceX (empresa de exploração espacial do Elon Musk). Trata-se de um modelo de Machine Learning que detectará inundações para ajudar em planos de atuação. Confira mais no artigo, com direito até a vídeo do lançamento do foguete. (Em Inglês)

Seria o Facebook Prophet o "Messias" das time series, ou ele é só um safadinho?
Se você já mexeu com previsão de séries temporais, com certeza já ouviu falar do famoso Prophet, do Facebook. Eu mesmo adoro esse modelo e acho muito poderoso, mas você sabe como ele funciona por debaixo dos panos? Nesse artigo super completo, você iá entender não só como ele funciona, mas também suas limitações e algumas das escolhas técnicas que o time do Facebook fez. (Em Inglês)

A forma mais simples de explicar Big O Notation (sim, é clickbait)
Saber o quão eficiente é o seu algoritmo é crucial para entregarmos soluções de qualidade, e um dos conceitos mais fundamentais sobre algoritmos é a Notação Big O. Embora o título do artigo seja um clickbait, ele explica o conceito de forma bem didática e simples de acompanhar, com exemplos em código Python. (Em Inglês)

Um comparativo de diferentes ferramentas de Feature Store
O pessoal da comunidade MLOps Community deu uma reformulada no site deles e estão com uma seção bem legal de comparativo de ferramentas. Confira esse que eles fizeram sobre diferentes opções de Feature Store disponíveis. (Em Inglês)
VAGAS DA SEMANA
 
  • Proficiência em programação (exemplo: Python ou Java)
  • SQL
  • Exp. com ferramentas de ETL
  • Exp. com extração de dados via API
  • Exp. com ferramentas de workflow (Composer, Airflow, Luigi, Kubeflow e etc.)
  • Conhecimento em DataOps e CI/CD
  • SQL
  • Exp. com Cloud Computing (ex.: GCP)
  • Alto conhecimento em pipelines de ingestão de dados Streaming
  • Experiência em arquitetura e processos de cargas para DataLake
  • Revisão de modelos de arquitetura para garantir a qualidade e conformidade com os padrões de arquitetura de dados da plataforma
DICA DE VÍDEO
AI do Google melhora iluminação com base no plano de fundo
Sabe quando você faz aquela reunião no Google Meet e troca seu plano de fundo por uma imagem? O Google agora quer melhorar essa experiência, adaptando a iluminação do seu rosto de acordo com a imagem que você escolheu. Nesse vídeo do canal Two Minute Papers, eles detalham esse último trabalho da Google. (Em Inglês)
MEME DA SEMANA
Há quem diga que conflito no merge dói mais que fim de relacionamento.
DATA VISUALIZATION DA SEMANA
Evolução de gêneros musicais no Lollapalooza

A visualização da semana vai pro Data Hacker Adauto Braz que fez uma análise bem legal de dados do Lollapalooza e nos presenteou com essa visualização incrível mostrando a participação de cada gênero em diferentes edições do Lolla. Perceba como Rock aparecem menos nos lineups do festival, enquanto Pop cresce ao longo do tempo. Leia toda a análise aqui. (em Português)

PRÓXIMOS EVENTOS E MEETUPS [100% ONLINE]
 
A Nvidia irá fazer na próxima terça-feira (6 de julho) às 9h um webinar falando sobre AI Conversacionais, e eu (Paulo Vasconcellos) e o Allan Sene iremos participar. Vamos falar sobre como empresas estão usando NLP, casos de usos e o futuro desse tipo de aplicação. Inscreva-se e vem trocar uma ideia com a gente! (em Português)
DataBeer: Desafios na construção e gestão de time de dados
05 de Julho - Evento Gratuito e 100% Online
(Participação do Allan Sene co-founder do Data Hackers)

Supletivo Data Hackers - Dremio
08 de Julho 20h - Evento Gratuito e 100% Online

Airflow Summit 2021
08 a 16 de Julho - Evento Gratuito e 100% Online

Ai4 2021: Exploring Artificial Intelligence Across Industry
17 a 19 de Agosto de 2021 -  Evento Pago e 100% Online
Copyright © *|CURRENT_YEAR|* datahackers.com.br.

Want to change how you receive these emails?
You can update your preferences or unsubscribe from this list.
Facebook
Site
LinkedIn
Twitter
Medium

©2018-2021 - Data Hackers, Todos os direitos reservados.

Site por Kaordica