Todas as revoluções que tivemos até hoje, tanto as tecnológicas quanto industriais, possuem uma semelhança: elas estão ligadas à forma como os seres humanos lidam com as máquinas. Antes, os processos eram feitos de forma muito manual e, com o tempo, acabaram sofrendo uma evolução natural voltada para a automação. Com o aprendizado de máquinas não é diferente. No início, muitas tarefas relacionadas ao aprendizado de máquina eram manuais, justamente por estarem em uma fase de experimentação.
Porém, quando falarmos em aprendizado de máquina automatizado, popularmente conhecido como AutoML, estamos falando de um processo de evolução do aprendizado de máquina. O programador, quando bastante sagaz, vai dar um jeito de automatizar as tarefas repetitivas e manuais para otimizar o seu tempo. Normalmente, isso é feito através da criação de scripts, templates ou até mesmo bibliotecas que reúnem um compilado de todas as principais funções que ele necessita para poder desenvolver uma determinada tarefa e, consequentemente, facilitar a sua vida. É assim que funciona com o AutoML. Como qualquer framework ou linguagem de programação, é uma ferramenta que será utilizada em benefício do usuário que está desenvolvendo o modelo.
Com o intuito de desmistificar algumas questões relacionadas ao AutoML, destacamos abaixo alguns pontos importantes e que costumam gerar muitas dúvidas. Inclusive, vale lembrar que a desmistificação do AutoML também foi pauta da live que gravamos juntos no Linkedin e no Twitter da H2O.ai mês passado (vocês podem conferir o vídeo na íntegra ao fim deste post).
Criou-se um mito, uma crença equivocada não só do AutoML, como também do aprendizado de máquina em geral e da Inteligência Artificial de que eles iriam, em algum momento, substituir o usuário. Na realidade não é isso que acontece. O AutoML é apenas mais uma ferramenta que veio para auxiliar e facilitar o trabalho do desenvolvedor de modelos de aprendizado de máquina, com o objetivo de otimizar o seu tempo, e não para substituí-lo.
Ao utilizar uma ferramenta de AutoML, muitas das tarefas com as quais o cientista de dados teria que se preocupar (como feature engineering , selecionar o melhor transformador para extração de características a partir de um determinado conjunto de dados, selecionar o melhor modelo, etc.), acabam sendo definidas pela ferramenta e, com isso, ele acaba tendo mais tempo para focar no que realmente interessa para o negócio, utilizando os seus conhecimentos matemáticos e estatísticos de análise para gerar melhores insights para a empresa.
Um dos principais desafios da utilização do AutoML é cultural. Com a falsa impressão de que o AutoML representa uma ameaça, os usuários acabaram se tornando resistentes à ideia da automação.
Outro ponto é que, muitas vezes, a ferramenta de AutoML mais engessa o cientista de dados do que lhe dá liberdade. Por isso, é fundamental que o usuário considere uma boa ferramenta de AutoML e a possibilidade que ele tem de poder estender e expandir essa plataforma para adequá-la às necessidades com o seu caso de uso real. Por exemplo, muitas ferramentas de AutoML dão um determinado conjunto de modelos “x” e um conjunto de feature engineering “y”. O cientista de dados então tem que adaptar o seu caso de uso para ser aplicado na ferramenta e não é assim que deveria funcionar. A ferramenta precisa ser flexível e extensível a ponto de se adaptar às necessidades do usuário e não o contrário.
Além disso, existem algumas outras limitantes, como o fato de que os modelos precisam ser supervisionados, ou seja, a criação de modelos a partir de um conjunto de dados que possui uma variável-alvo. Mas isso é algo que tem evoluído e é possível que em breve tenhamos a oportunidade de trabalhar com modelos não supervisionados dentro de uma plataforma de AutoML também. Inclusive, esse é um campo de estudo contínuo e já existem aplicações de técnicas com a finalidade de alcançar esse objetivo .
Um caso bem interessante que a H2O.ai está trabalhando e que podemos citar é o de um modelo de classificação de imagens para detecção de corrosão. Os cientistas de dados da empresa que nos procurou estava trabalhando nesse conjunto de imagens há uns 2 meses, 2 meses e meio nessa atividade, e com o Driverless AI trazendo o dataset correto, o nosso time na H2O.ai conseguiu resolver o problema em praticamente um dia. E é gratificante ver a reação das pessoas quando recebem os resultados muitas vezes mais precisos e gerados em um tempo significativamente mais curto.
Para concluir, é fundamental enxergarmos o AutoML como peça-chave no processo de democratização da Inteligência Artificial porque ele empodera todo o tipo de usuário – desde o analista de negócios, que necessita utilizar os conhecimentos do aprendizado de máquina e inteligência artificial para gerar novos insights para seus negócios, até o cientista de dados mais conhecimento mais avançado.
Se interessou e quer assistir à gravação da live na íntegra? Clique aqui .