Details
Ao longo dos anos, o Python demonstrou ser extremamente versátil, sendo utilizada em multiplas tarefas - de IA ate calculos simples. Tais tarefas, apesar de parecerem áreas distintas, possuem em comum a *utilização e manipulação de dados*. Manipular dados se tornou um grande desafio devido à imensa variedade e quantidade de informações disponíveis. Por conta disso, a escolha da melhor forma de armazenar esses dados tornou-se um passo essencial para o sucesso de qualquer solução tecnológica.
Para encaminhar solucoes desse problema, Eric Redmond e seus colegas lançaram o famoso livro 7 Databases in 7 Weeks (7 Bancos de Dados em 7 Semanas), em que abordam as aplicaçoes desses 7 bancos de dados open-source em diferentes cenários. Inspirado por este livro, gostaria de discutir um banco que não é tratado no livro : Elasticsearch.
O Elasticsearch, semelhante ao MongoDB, é um banco que armazena documentos , porém possui ferramentas especializadas de busca textual , graças ao apache lucene. É possível fazer diversas configurações de buscas, como configurar termos semelhantes; busca por bigrama e até mesmo busca utilizando correlação de cosseno (busca muito utilizado em aplicações de LLM).
Esta palestra apresentará o propósito de cada um desses bancos de dados, explicará como instalá-los e será demonstrado como conectá-los a uma aplicação Python - seja ela uma aplicação web (Django/FastAPI), de engenharia de dados (Airflow/Prefect) ou até mesmo um simples script. Com essa abordagem,
