O Dia Internacional do Vazamento de Dados

A nova versão do Kubeflow vai te fazer ficar apaixonado por MLOps

Fala, Data Hacker! Seja muito bem-vindo a mais uma newsletter! Esperamos que estejam bem e seguros. Essa semana foi marcada por muita exposição de dados de usuários das maiores plataformas sociais do mundo. Teve dado exposto do Facebook (incluindo do próprio Markinho Zucks), Linkedin e até Clubhouse.O que marcou essa leva de dados expostos foi o fato deles terem sido adquiridos através de técnicas de web scraping. Ou seja, a maioria dos dados adquiridos estavam expostos publicamente (como seu perfil aberto do Facebook) e tiveram seus dados combinados e enriquecidos com fontes externas. Muito se é discutido sobre o uso de técnicas de raspagem de dados para coletar informações sobre sites, como definir a linha que separa a coleta entre o legal e o ilegal. Esses dados expostos podem acender novamente esse debate.E mais na edição de hoje: como quebrar um modelo de ML em 20 dias; um repositório cheio de dicas de MLOps, e o novo documentário da Netflix sobre viéses em reconhecimento facial.

Milhões de usuários do Linkedin, Facebook e Clubhouse tem seus dados expostos online

A Evidently é uma empresa que oferece soluções open-source de monitoramento e análise, e elas também  fizeram esse post muito interessante sobre os desafios que é colocar ML no mundo real e a importância de estar sempre monitorando sua performance. (em Inglês)

 

Se você está procurando por uma boa fonte para consultar e começar a implementar MLOps na sua empresa, você está no lugar certo! Esse repositório incrível contém dicas sobre ferramentas, blog posts, palestras e muito mais pra você consumir. (em Inglês)

Feedback Loop é um dos conceitos mais importantes quando estamos modelando produtos de ML, principalmente quando tais modelos podem ser muito enviesados por features sociais, como algoritmos de análise de crédito ou reincidência criminal. Esse artigo explica em detalhes o que é Feedback Loop e alerta para os perigos que eles podem trazer. (em Inglês)

Se você, assim como eu, é muito fã do canal do 

, com certeza já ficou fascinado pelas

que eles fazem com fórmulas matemáticas. A boa notícia é que você também pode começar a fazer essas animações imediatamente e, melhor de tudo, usando Python. A biblioteca Manim foi criada pelo próprio Grant Sanderson (criador do canal) e forkeada pela comunidade, que deixou ela mais estável. Esse tutorial te ensinará como baixar e usar essa linda ferramenta. (em Inglês)

O Kubeflow é um poderoso toolkit para Machine Learning e sua nova versão vem com diversas novidades. Se você nunca mexeu com Kubeflow, mas tem interesse, aproveite esse artigo para conhecer as últimas novidades e como começar a utilizá-lo. (em Inglês)

VAGAS DA SEMANA

  • Perfil analítico

  • Excel intermediário;

  • Habilidades de comunicação e apresentação;

  • Interesse em aprender SQL e usar no dia a dia;

  • Estar se graduando em área técnica (Tecnologia, Negócios, Matemática, Economia, etc).

Community Assistant - Data Hackers (última  semana)Belo Horizonte - MG ou RemotoPart-time Job - 20h semanais Sim! Essa é uma oportunidade para trabalhar no Data Hackers de forma remunerada A função será ajudar na organização da comunidade, tarefas administrativas, contato com os parceiros e fornecedores etc Ou seja, atuar em diversas frentes que vão ajudar a comunidade a crescer ainda mais rápido 

Essa semana a Netflix lançou um documentário incrível em parceria com a Joy Buolamwini sobre os viéses e falhas que tecnologias de reconhecimento facial possui. Pra quem não conhece, a Joy foi responsável por um dos artigos mais incríveis que já li: Algoritmos não são racistas. Sua pele que é muito escura, contando um pouco da sua própria experiência com esses modelos enviesados. (Legendado em Português)

Dica do Data Hacker Flávio Clésio no nosso 

.

Como fluem os rios brasileiros (GIF)Esse trabalho da página do Arvoreagua no Instagram e compartilhado pelo perfil Geopizza no Twitter mostra como os principais rios brasileiros fluem. O destaque na imagem fica pro Rio Doce, cujo a cor marrom é devido ao desatre ambiental pela Samarco (joint venture da Vale e BHP) que houve em Mariana, em 2015. (em Português)

PRÓXIMOS EVENTOS E MEETUPS [100% ONLINE]

Estarei palestrando nessa edição do Data Train. Nos vemos lá!

15 de Abril - 19h - Evento Gratuito e 100% Online

21 e 22 de Abril - 9 AM (PDT) - Evento Gratuito e 100% Online

29 de Abril - Evento Gratuito e 100% Online

08 a 16 de Julho - Evento Gratuito e 100% Online

17 a 19 de Agosto de 2021 -  Evento Pago e 100% Online