Newsletter

SELECT "quanto foi nosso faturamento?" FROM vendas

Enviado em: August 30, 2021
View this email in your browser

SELECT "Quanto foi nosso faturamento no ano passado?" FROM vendas


Fala, Data Hacker! Seja bem-vindo a mais uma newsletter! Geralmente, quando juntamos as palavras "dados não-estruturados" e "Query", já sobe aquele calafrio nas costas, não é? Que atire a primeira pedra quem nunca mandou aquele LIKE no meio das queries. Contudo, o Facebook parece que quer mudar isso, ao apresentar essa semana o que eles chamam de "Neural databases": bancos de dados que usam NLP como seu motor de busca, ao invés do famigerado SQL. Confira mais sobre essa novidade ainda nessa edição.

E mais na news de hoje: AutoML do Google Sheetsum guia sobre monitoramento de modelos em produção; o jeito mais rápido de visualizar correlação, e muito mais.

Pesquisa de feedback da newsletter do Data Hackers

Queremos criar uma newsletter cada vez melhor para você, e para isso, seu feedback é muito importante. Clique aqui e separe 2 minutinhos do seu dia para responder nossa pesquisa.

Neural databases: como o Facebook quer usar AI + NLP em dados não-estruturados

O Facebook anunciou essa semana as Neural Databases, sua nova abordagem para queries em dados não-estruturados. A ideia principal é eliminar o gap que existe hoje em linguagens como SQL, que são muito dependentes da semântica, onde apenas resultados exatos são retornados. Segundo o time de pesquisa, será possível utilizar linguagem natural para buscar por resultados nos bancos de dados com perguntas como "Qual o percentual de reviews positivos em filmes de terros dos anos 70?". Saiba mais sobre o assunto clicando aqui. (em Inglês)

Um guia para monitoramento de modelos de ML em produção

Há quem diga que o verdadeiro trabalho de Machine Learning começa quando você precisa colocar o modelo em produção. Hoje ainda é muito obscuro para algumas pessoas como essas aplicações devem ser monitoradas no mundo real, para identificarmos falhas, envelhecimento de modelos, e antecipar problemas. Nesse guia traduzido pelo Toni Esteves você entenderá não só por que você deve monitorar seus modelos, mas também os desafios e até como começar. (em Português) 

O que empresas data-driven tem em comum

O pessoal da Tableau realizou uma pesquisa com mais de mil lideres de negócios (técnicos e não-técnicos) em 10 países para entender as cinco tendências que direcionam uma cultura de dados eficiente. Dentre as tendências, estão a Confiança, Talento, e o Comprometimento dos times de dados. (em Inglês)
OUTROS TÓPICOS
O jeito mais rápido de visualizar correlação em Python
Correlação é muito importante para entender como suas variáveis se relacionam, e existem diversas formas de você visualizar e entender esse relacionamento. Nesse post feito por Roman Orac, ele mostra como em apenas uma linha de código você pode criar um correlograma, usando nada mais que nosso famoso Pandas. (em Inglês)

Como o Slack lida com Data Lineage
Basicamente, Data Lineage é entender e rastrear de onde dados vem e como e onde eles são utilizados. A medida que os dados da sua empresa crescem, fica ainda mais difícil entender e controlar isso. O pessoal do Slack criou esse post para explicar como eles estão lidando com esse desafio. (em Inglês)

Google lança recurso de sugestão inteligente de formulas e funções para o Sheets
O "Copilot" chegou ao Google Sheets? Essa semana o Google anunciou sua novidade que estará disponível nos próximos dias: uma ferramenta de sugestão inteligente de fórmulas e funções direto na sua planilha. Confira esse post para ver a funcionalidade em ação. (em Inglês)

A diferença entre Machine Learning Engineers e Data Scientists
Sempre surge a discussão sobre a diferença entre papéis em Data Science e Machine Learning que compartilham de algumas responsabilidades (Cientistas vs Analistas, Engenheiros de Dados vs Analytics Engineer, etc.) e uma delas é a diferença entre os Engenheiros de Machine Learning e Data Scientists. Enquanto, na verdade, essa diferença vai variar de empresa para empresa, o pessoal do KDNuggets trouxe sua versão sobre algumas diferenças comuns entre esses dois papéis. (em Inglês)
VAGAS DA SEMANA
  • Python
  • SQL
  • Machine Learning
  • API REST
  • Cloud computing
  • Ter atuado de ponta-a-ponta em projetos de ML
  • Expertise em Python, SQL e Machine Learning
  • Experiência com AWS
  • Boa comunicação
DICA DE VÍDEO
Explicando Machine Learning em 5 níveis de dificuldade
Como você explicaria Machine Learning para uma criança? Nessa série da WIRED, eles chamam um especialista na área e pedem para explicar um conceito bem complexo para uma audiência diversa, como uma criança, um adolescente, um estudante e para outro especialista da área. Para esse episódio, eles chamaram Hilary Mason (ex-Cloudera e Bitly) para explicar. (Em Inglês)
MEME DA SEMANA
Se o seu computador for um PC da Xuxa, não vai ser mais rápido não.
DATA VISUALIZATION DA SEMANA
Onde programadores de Fortran trabalharam ao longo dos tempos?

Uma visualização bem legal mostrando onde programadores Fortran tem trabalhado ao longo do tempo. Você imaginava que havia gente mexendo com Fortran na Apple? (em Inglês)

PRÓXIMOS EVENTOS E MEETUPS [100% ONLINE]
VHOL: Snowflake Data Cloud - Laboratório Prático
21 de Setembro- Evento Gratuito e 100% Online

DataOps Summit 2021
28 a 30 de Setembro - Evento Gratuito e 100% Online
Copyright © *|CURRENT_YEAR|* datahackers.com.br.

Want to change how you receive these emails?
You can update your preferences or unsubscribe from this list.
Facebook
Site
LinkedIn
Twitter
Medium