Trilha BigData e NoSQL In God, we trust. All others, must bring Data: Ter a capacidade de armazenar e processar quantidades imensas de dados traz conhecimentos imensuráveis!

NoSQL e Big Data vivem um em função do outro. A ascensão contínua de novas tecnologias, incentivam o armazenamento de maiores volumes de dados. Que por sua vez, trazem novos e novos desafios.

Todo o processo de conscientização e tomada de decisão com base em dados, depende da estruturação da base: como meus dados chegam? Como são armazenados? Como catalogo e facilito a descoberta deles pelos profissionais da minha organização?

De Data Lakes a Bancos colunares. De tratamento da informação à análises de dados massivos. É o que você vai encontrar na trilha Big Data & NoSQL!

Coordenação

Eduardo Hahn

Marlon Rodrigues Martin

TODAS AS TRILHAS

Programação / Palestras TODAS AS TRILHAS

Importante: A grade de palestras está sujeita a alterações sem prévio aviso.

	Conteúdo
08:00 às 09:00	Credenciamento e recepção dos participantes Todas as pessoas inscritas, palestrantes, coordenadores e de imprensa, devem retirar seus crachás e kit do congressista nos balcões de credenciamento localizados na entrada do evento, para obterem acesso às salas e Auditório Principal.
09:00 às 10:00	Abertura do evento no Auditório Principal Após o credenciamento, convidamos os participantes a comparecerem ao auditório para receberem as boas vindas por parte dos realizadores e patrocinadores. Neste keynote de abertura, todos serão orientados sobre o funcionamento do evento, destaques e outras novidades.
10:10 às 11:00	Big Data sem servidores Rafael Barbosa Quando pensamos em big data o que pensamos é que seja necessário vários servidores muito grandes! E se eu te mostrar como fazer sem nenhum servidor e entregar valor e organização para seu cliente. O que levar em consideração antes de montar uma arquitetura utilizando essas tecnologias? É isso que irá ser apresentado nesta palestra incluindo perguntas a qualquer momento, e uma demo interativa construída durante o tempo de apresentação. Buscas poderosas em bilhões de documentos? Seu sistema pode prover isso de forma escalável e resiliente com o Elasticsearch Matheus de Faria Moraes SLIDES Atualmente o Elasticsearch é a principal engine de buscas do mercado. Com ele, o GitHub, por exemplo, fornece poderosas buscas em 8 milhões de repositórios e 2 bilhões de documentos. Além de performáticas buscas textuais e complexas, o Elasticsearch também provê escalabilidade horizontal, resiliência e alta disponibilidade. Na palestra serão abordados todos esses conceitos, as melhores práticas e algumas demonstrações.
11:10 às 12:00	Ambiente Exploratório e Operacional de Ciência de Dados Ronaldo Bernardi SLIDES Apresentar uma arquitetura de referência, baseada em cloud(aws), que habilita o time de ciência de dados a realizar a exploração e operação do seus modelos, com uma necessidade minima de engenharia de dados.
12:10 às 13:00	Desempate de cluster usando AWS sa-east-1 Everton Martins SLIDES Nesta palestra trataremos de um problema comum com clusters de banco de dados em CloudComputing. Em caso de indisponibilidade de uma zona precisamos garantir que o cluster tenha 50% +1 votos, evitando o que chamamos de Split-brain. Então, como desempatar o cluster, se temos apenas duas zonas na AWS sa-east-1? Nesta palestra será apresentado uma arquitetura de mongodb com alta disponibilidade, performance, e baixo custo, implementados por nós do Agibank. O material apresentado e scripts de montagem do cluster, serão disponibilizados no repositório do apresentador (github), de forma que todos que assistirem a esta palestra serão capazes de implementar facilmente esta solução em suas empresa SQL em múltiplos formatos no HDFS com uma unica ferramenta, Apache Drill Jonatas Vargas Nesta talk vou apresentar uma ferramenta fantástica capaz de fazer SQL em cima de múltiplos data sources como JSON, Parquet, CSV, Kafka e HBase, projeto open-source chamado Apache Drill, utilizando sistemas distribuídos ele é capaz de resolver consultas de forma instantânea com comandos triviais em SQL.
13:10 às 14:00	Intervalo para Almoço Uma excelente oportunidade de todas as pessoas no evento interagirem e trocarem ideias, colaboradores, empresas patrocinadoras e apoiadoras, palestrantes e coordenadores.
14:10 às 15:00	Ecossistema de ingest de dados na Globo.com Leonardo Alves Neuwald / André Diniz O Grupo Globo possui os maiores portais de notícia e entretenimento do Brasil onde aproximadamente quatro bilhões de eventos diários de interação dos usuários com os nossos produtos passam pela nossa plataforma de ingest de dados. Nessa palestra mostraremos os desafios relacionados a arquitetura para suportar breaking news e cobertura de grandes eventos. Mostraremos soluções propostas, evoluções arquiteturais realizadas e tecnologias utilizadas para tornar a plataforma cada vez mais escalável e resiliente.
15:10 às 16:00	7 passos para o Dataops Rafael Barbosa Vivemos na era do Big Data, mas você já entende quais os controles que fazem tudo isso possivel e escalável? Venha ver quais são os passos que permitem você e sua empresa a ficarem sempre a frente da evolução garantindo bons resultados. E ainda por cima tem uma demo live no final. Beam: como escrever ETL agnóstico de dados Leonardo Alves Miguel SLIDES Um modelo de programação que processa um arquivo txt, uma fila, milhões de arquivos na nuvem, e a maior tabela do seu banco de dados... com o mesmo código. Nessa talk vou provar que batch e streaming é a mesma coisa usando Apache Beam.
16:00 às 16:30	Coffee-break e Networking Durante o intervalo de coffee-break, serão entregues kits contendo suco e biscoitos. Um delicioso intervalo para relaxar, conhecer novas pessoas e estreitar contatos. Neste tempo, também surge a oportunidade de todas as pessoas no evento interagirem entre sí, participantes das trilhas, empresas patrocinadoras e apoiadoras, palestrantes e coordenadores.
16:40 às 17:30	Recomendação Content-Based na Globo.com Rodrigo Kassick SLIDES A Globo produz mais de 4 mil novos vídeos e matérias diariamente, ofertados para os mais de 30 Milhões de usuários que acessam os nossos portais. Para melhorar a descoberta de conteúdo, utilizamos algoritmos de recomendação, ofertando, a cada dia, 146 Mil itens que impactam mais de 9,5 Milhões de usuários. Nessa palestra, vamos explorar como algoritmos de recomendação descobrem os assuntos de um texto, áudio ou vídeo, e como eles usam estas informações para encontrar itens de interesse dos usuários. Discutiremos as maneiras como como avaliamos, quantitativa e qualitativamente, o resultado da recomendação. O que a Cambridge Analytica nos ensinou sobre a relação entre Big Data, Privacidade e Democracia? Anderson Camargo O escândalo da Cambridge Analytica impactou e interferiu diretamente em processos democráticos. Mas qual o aprendizado tivemos diante deste cenário? A privacidade na era digital está realmente perdida? O que está sendo feito para garantir os direitos de cidadania no cyberespaço e como alinhar Big Data e a utilização de dados em consonância com privacidade e proteção de dados?
17:40 às 18:30	Desafio: A arte de processar 8 milhões de queries simultaneamente em SQL e NoSQL Henrique Luiz da Silva / Ronaldo Andrade Silva Falaremos dos desafios encontrados e o planejamento para montar uma arquitetura para processar 8 milhões de queries em múltiplos bancos de dados. Mostraremos como saber se o retorno é performático ou não de acordo com o estudo de normalização dos resultados de performance, auxiliando os devs a obter uma melhor experiencia com os insights gerados e assim, agregando valor ao produto.
18:40 às 19:00	Encerramento e Sorteios No horário de encerramento, todas as trilhas serão direcionadas de suas salas para o Auditório Principal, mesmo local da abertura. Após a apresentação de resultados do dia, muitos sorteios fecharão o dia.

Data e Local

Sexta-feira, 29 de Novembro de 2019

10 às 19 h

UniRitter

Rua Orfanotrófio, 555
Alto Teresópolis | Porto Alegre - RS

Informações sobre Data e Local

Público Alvo

Engenheiros de Dados, Administradores de Bancos de Dados, Analistas de Dados, Desenvolvedores e Arquitetos de plataformas de alto-desempenho, Analistas DevOps e SRE e entusiastas da área de Dados e Infraestrutura.

Investimento

presencial:R$ 290,00

Fazendo sua inscrição presencial, você terá acesso a esta trilha e no mesmo dia também:
TDC Expo: Venha conversar com pessoas e conhecer empresas incríveis.
Trilha Carreiras: Você poderá assistir às palestras da trilha Carreiras do mesmo dia.
Trilha Stadium: Você poderá assistir às palestras da trilha Stadium do mesmo dia.