ALGORITMOS
DE REGRESSÃO

ALGORITMOS DE REGRESSÃO

AGRICULTURA 4.0

Nos dois últimos artigos, eu expliquei a diferença entre inteligência Artificial e Aprendizado de Máquina. Destaquei que os algoritmos descritos nesta subárea da inteligência artificial são inspirados em métodos da Estatística. Expliquei o funcionamento dos Algoritmos de Classificação, usados para identificar a classe de novos indivíduos de uma amostra, através de um processo de aprendizado supervisionado. E também expliquei o funcionamento dos algoritmos de Agrupamento, usados para identificar as relações existentes entre os indivíduos de uma amostra através de um processo de aprendizado não supervisionado, no qual não há nenhuma indicação da forma como esses indivíduos estão conectados.

Neste artigo, irei escrever sobre os Algoritmos de Regressão, em especial os Algoritmos de Regressão Logística, e Regressão Linear, sendo o primeiro usado para classificar indivíduos de uma amostra, e o segundo para a análise preditiva, ou seja, para estimar o valor de algo.

O Algoritmo de Regressão Logística permite estimar a probabilidade de um evento ocorrer por meio da análise dos valores das variáveis que indicam as características de um fenômeno qualquer. Como exemplo, podemos responder qual a probabilidade de uma variedade de semente de soja apresentar tolerância a um novo tipo de praga, com base em valores numéricos que indicam a reação dessa variedade a doenças, a sua resistência a pragas, a sua produtividade e a sua adaptabilidade nas macrorregiões. Ao inserir esses dados em um modelo baseado em Regressão Logística, obtém-se como resultado um valor entre 0 e 1 que representa essa probabilidade. E, dessa forma, podemos classificar esta variedade de semente, para participar de um processo de cruzamento genético como uma candidata boa ou ruim.

Já o Algoritmo de Regressão Lincar gera uma equação que descreve a relação entre uma ou mais características de um fenômeno qualquer. Entre as características, podemos citar a área total de uma propriedade rural, o número de edificações e benfeitorias, a sua área produtiva total, bem como outros dados relevantes para a avaliação deste tipo de imóvel.

Quando inserimos esses dados em um modelo baseado em Regressão Linear, adicionando a variável resposta, neste caso os valores conhecidos de um conjunto de propriedades
rurais previamente avaliadas, obtemos como resultado a estimativa do valor desta nova propriedade.

Vale destacar que a Regressão Linear é chamada assim, pois considera a criação de uma equação que descreve a relação estatística de um problema que apresenta um comportamento linear. No exemplo citado acima, o valor de mercado de um imóvel rural tende a subir de forma linear com o aumento da sua área total, do número de edificações e benfeitorias ou da sua área produtiva total, sendo, então, possível aplicar esse tipo de algoritmo na solução desse problema.

“Como exemplo, podemos responder qual a probabilidade de uma variedade de semente de soja apresentar tolerância a um novo tipo de praga, com base em valores numéricos que indicam a reação desta variedade a doenças, a sua resistência a praga, a sua produtividade e sua adaptabilidade nas macrorregiões”

Portanto, podemos dizer que os algoritmos de regressão fazem parte dos algoritmos de aprendizado supervisionado e, assim como os algoritmos de classificação, também podem classificar indivíduos. Mas a principal diferença deste tipo de algoritmo está na variável resposta, a qual não apresenta somente as classes que indicam como os indivíduos se organizam, como acontece nos algoritmos de classificação tradicionais, mas apresenta valores numéricos que
variam em função das características que cada indivíduo da amostra possui.

São diversas as aplicações no agronegócio que poderiam se beneficiar deste tipo de algoritmo. Mas é necessário que os profissionais diretamente ligados ao agronegócio entendam o suficiente sobre tecnologias disponíveis para, assim, se protegerem de propostas apresentadas por leigos e evitarem gastos desnecessários. Somente o profissional do campo que entende o potencial dos recursos que ele tem à disposição pode dizer quais problemas podem ser resolvidos através do uso desses tipos de algoritmo.

Finalizo este artigo agradecendo a todos os leitores que acompanham a coluna e que encontram nesta série informativa os esclarecimentos sobre o tema “Aprendizado de
Máquina” que procuram. Reforço que o tema “Aprendizado de Máquina” tem a fama de ser uma área de conhecimento difícil e complexa, mas posso afirmar, com propriedade, que muitas das soluções presentes nessa área de conhecimento são simples e práticas e podem contribuir de forma significativa com as atividades que cercam o seu dia a dia. Nós nos encontraremos de novo daqui a três meses com mais um artigo sobre “Aprendizado de Máquina”.

Fonte: Revista A Granja – Total Agro – Outubro/2022 nº886 Ano 78

Luís Hilário Tobler Garcia

Graduado em Ciência da Computação, mestre e doutor em Engenharia Mecânica, professor e coordenador do curso superior de Tecnologia em Big Data no Agronegócio do FATEC Shunji Nishimura