Python Brasil 2025
25/10/2025
Palco 2
pt-br
Elasticsearch - um banco para quem lida com textos
Iniciante
A escolha do banco de dados é essencial no desenvolvimento. Vou apresentar Elasticsearch , um banco visado para pesquisa de texto e para grande quantidade de dados

Details

Ao longo dos anos, o Python demonstrou ser extremamente versátil, sendo utilizada em multiplas tarefas - de IA ate calculos simples. Tais tarefas, apesar de parecerem áreas distintas, possuem em comum a *utilização e manipulação de dados*. Manipular dados se tornou um grande desafio devido à imensa variedade e quantidade de informações disponíveis. Por conta disso, a escolha da melhor forma de armazenar esses dados tornou-se um passo essencial para o sucesso de qualquer solução tecnológica.

Para encaminhar solucoes desse problema, Eric Redmond e seus colegas lançaram o famoso livro 7 Databases in 7 Weeks (7 Bancos de Dados em 7 Semanas), em que abordam as aplicaçoes desses 7 bancos de dados open-source em diferentes cenários. Inspirado por este livro, gostaria de discutir um banco que não é tratado no livro : Elasticsearch.

O Elasticsearch, semelhante ao MongoDB, é um banco que armazena documentos , porém possui ferramentas especializadas de busca textual , graças ao apache lucene. É possível fazer diversas configurações de buscas, como configurar termos semelhantes; busca por bigrama e até mesmo busca utilizando correlação de cosseno (busca muito utilizado em aplicações de LLM).

Esta palestra apresentará o propósito de cada um desses bancos de dados, explicará como instalá-los e será demonstrado como conectá-los a uma aplicação Python - seja ela uma aplicação web (Django/FastAPI), de engenharia de dados (Airflow/Prefect) ou até mesmo um simples script. Com essa abordagem,