Details
Na Shape Digital, embora tenhamos milhares modelos de machine learning em produção, muitos deles requerem um pré-processamento de dados customizado. Para reduzir o atrito de exigir que o código que implementa cada um desses pré-processamentos seja mantido em um repositório, o que fazemos é embutir “a função em si” no modelo que será enviado para produção.
Mas o que é “a função em si”? Nessa palestra, apresentaremos o ciclo de vida de uma função no CPython. Para quem não sabe, “Python” é o nome da linguagem de programação, mas o interpretador que lê o código que a gente escreveu em Python e o executa se chama “CPython” (porque é escrito em C).
Vamos explorar como funciona a definição de uma função via código-fonte, como elas são compiladas para bytecode, como são representadas internamente pelo interpretador, como funciona exatamente o processo de execução do bytecode, e como podemos inspecionar o interpretador “ao vivo” (em tempo de execução) para ter acesso a todos esses “internals.”
Por fim, vamos mostrar como interagimos com todas essas etapas para executar em produção, de forma segura e portável, a função que foi definida pelo cientista de dados em um notebook Databricks.
