Github Copilot: seu ajudante ou seu substituto?

O pessoal do Grupo Boticário compartilhou com a gente a sua estratégia de dados

Fala, Data Hacker! Seja bem-vindos a mais uma newsletter!Uma das grandes novidades dessa semana foi o lançamento do Github Copilot: uma AI capaz de gerar código a partir de linguagem natural. Resumidamente, é uma Inteligência Artificial em que você pode dizer, literalmente: "Quero uma função pra treinar uma Árvore de Decisão e retornar a acurácia", e ela irá retornar essa função pra você na linguagem que quiser.Mas, quando uma notícia assim sai na mídia, parece que uma barata começou a voar e todo mundo ficou assustado, se perguntando: "Será que agora os programadores vão ser substituídos?". Essa não é uma discussão nova e reflete o medo das pessoas em perder seus empregos. Na newsletter de hoje, vamos compartilhar um artigo bem completo explicando não só o que é o Github Copilot, mas como ele funciona, suas aplicações e, principalmente, por que você não precisa ficar preocupado em ser substituído.E mais na edição de hoje: como um dos maiores grupos de beleza do mundo está usando dados; Machine Learning no Espaço; como o DoorDash usa Forecasting, e muito mais.

Essa edição é trazida a vocês pelo 

, a gigante brasileira dona de uma das maiores plataformas de beleza do mundo. Nos últimos meses,

o Grupo Boticário tem feito um trabalho incrível de estratégia de dados, trazendo insights, e aplicando data science e machine learning

em seus times e suas mais de 4 mil lojas. Saiba mais sobre o Grupo Boticário ainda nessa edição.

O pessoal do Grupo Boticário compartilhou com a gente a sua estratégia de dados para o grupo, falando sobre o desafio de organizar, analisar e gerar inteligência e produtos a partir de seu grande volume de dados gerados diariamente. Um dos pontos mais interessantes da estratégia que eles montaram está em seus pilares, que abrange desde a cultura do grupo até tecnologia e governança de dados. Lembrando que o GB nos últimos tempos vem comprando empresas de dados e tecnologia, como a GAVB e a Casa Magalhaes, além de criar novas empresas, como a fintech Mooz. Ou seja, um desafio bem legal de integrar dados e inteligências, além de criar produtos de machine learning em um grupo que lida com toda a cadeia de produtos de beleza.Leia o artigo completo que eles fizeram pro Data Hackers e já aproveita pra seguir o blog deles no Medium e conferir suas vagas abertas em dados!

O Copilot é uma AI que é capaz de gerar código, uma versão do GPT-3 da OpenAI feita especificamente pra esse propósito. E é claro que já tem muita gente perguntando se isso vai substituir programadores e data scientists. Nesse artigo no Towards Data Science, você pode conferir mais detalhes sobre sua implementação, suas aplicações, e porque você não precisa se preocupar com uma AI roubando seu emprego. (em Inglês)

 

O DoorDash é a maior empresa de delivery dos EUA e, como você pode imaginar, eles tem um grande desafio de prever oferta e demanda. Nesse artigo, eles dão mais detalhes sobre a abordagem usada com XGBooost e os resultados alcançados. Vale muito a pena conferir. (em Inglês)

Essa semana uma tecnologia criada por pesquisadores de Oxford foi lançada ao espaço em um foguete Falcon 9 da SpaceX (empresa de exploração espacial do Elon Musk). Trata-se de um modelo de Machine Learning que detectará inundações para ajudar em planos de atuação. Confira mais no artigo, com direito até a vídeo do lançamento do foguete. (Em Inglês)

Se você já mexeu com previsão de séries temporais, com certeza já ouviu falar do famoso Prophet, do Facebook. Eu mesmo adoro esse modelo e acho muito poderoso, mas você sabe como ele funciona por debaixo dos panos? Nesse artigo super completo, você iá entender não só como ele funciona, mas também suas limitações e algumas das escolhas técnicas que o time do Facebook fez. (Em Inglês)

Saber o quão eficiente é o seu algoritmo é crucial para entregarmos soluções de qualidade, e um dos conceitos mais fundamentais sobre algoritmos é a Notação Big O. Embora o título do artigo seja um

clickbait,

 ele explica o conceito de forma bem didática e simples de acompanhar, com exemplos em código Python. (Em Inglês)

O pessoal da comunidade MLOps Community deu uma reformulada no site deles e estão com uma seção bem legal de comparativo de ferramentas. Confira esse que eles fizeram sobre diferentes opções de Feature Store disponíveis. (Em Inglês)

VAGAS DA SEMANA

  • Proficiência em programação (exemplo: Python ou Java)

  • SQL

  • Exp. com ferramentas de ETL

  • Exp. com extração de dados via API

  • Exp. com ferramentas de workflow (Composer, Airflow, Luigi, Kubeflow e etc.)

  • Conhecimento em DataOps e CI/CD

  • SQL

  • Exp. com Cloud Computing (ex.: GCP)

  • Alto conhecimento em pipelines de ingestão de dados Streaming

  • Experiência em arquitetura e processos de cargas para DataLake

  • Revisão de modelos de arquitetura para garantir a qualidade e conformidade com os padrões de arquitetura de dados da plataforma

AI do Google melhora iluminação com base no plano de fundoSabe quando você faz aquela reunião no Google Meet e troca seu plano de fundo por uma imagem? O Google agora quer melhorar essa experiência, adaptando a iluminação do seu rosto de acordo com a imagem que você escolheu. Nesse vídeo do canal Two Minute Papers, eles detalham esse último trabalho da Google. (Em Inglês)

Há quem diga que conflito no merge dói mais que fim de relacionamento.

A visualização da semana vai pro Data Hacker Adauto Braz que fez uma análise bem legal de dados do Lollapalooza e nos presenteou com essa visualização incrível mostrando a participação de cada gênero em diferentes edições do Lolla. Perceba como Rock aparecem menos nos lineups do festival, enquanto Pop cresce ao longo do tempo. Leia toda a análise aqui. (em Português)

PRÓXIMOS EVENTOS E MEETUPS [100% ONLINE]

A Nvidia irá fazer na próxima terça-feira (6 de julho) às 9h um webinar falando sobre AI Conversacionais, e eu (Paulo Vasconcellos) e o Allan Sene iremos participar. Vamos falar sobre como empresas estão usando NLP, casos de usos e o futuro desse tipo de aplicação. Inscreva-se e vem trocar uma ideia com a gente! (em Português)

DataBeer: Desafios na construção e gestão de time de dados05 de Julho - Evento Gratuito e 100% Online(Participação do Allan Sene co-founder do Data Hackers)Supletivo Data Hackers - Dremio08 de Julho 20h - Evento Gratuito e 100% OnlineAirflow Summit 202108 a 16 de Julho - Evento Gratuito e 100% OnlineAi4 2021: Exploring Artificial Intelligence Across Industry17 a 19 de Agosto de 2021 -  Evento Pago e 100% Online