Machine Learning (ML) ou aprendizado de máquina é uma área que evoluiu do estudo de reconhecimento de padrões e da teoria do aprendizado computacional em inteligência artificial. O aprendizado de máquina explora o estudo e construção de algoritmos que podem aprender com seus erros e fazer previsões sobre dados. Tais algoritmos operam construindo modelos a partir de entradas amostrais a fim de realizar previsões ou decisões guiadas pelos dados, ao invés de simplesmente seguindo instruções programadas estaticamente. O ML tem como objetivo principal extrair regras e padrões de grandes conjuntos de dados.

As tarefas de aprendizado de máquina são tipicamente classificadas em três amplas categorias. Essas categorias são:

  1. Aprendizado supervisionado: São apresentados ao computador exemplos de entradas e saídas desejadas, fornecidas por um especialista. O objetivo é aprender uma regra geral que mapeia as entradas para as saídas.
  2. Aprendizado não supervisionado: Nenhum tipo de rótulo é fornecido ao algoritmo de aprendizado, fazendo com que ele procure por padrões de forma autônoma.
  3. Aprendizado por reforço: Um programa de computador interage com um ambiente dinâmico, no qual deve desempenhar determinado objetivo. É fornecido feedback na forma de premiações e punições na medida em que o espaço do problema é navegado.

Entre o aprendizado supervisionado e o não supervisionado, está o aprendizado semi-supervisionado, no qual o especialista fornece um sinal de treinamento incompleto: um conjunto de dados de treinamento com algumas das saídas desejadas ausentes.

Para o objetivo proposto (fenotipagem em larga escala com imagens aéreas) são utilizados algoritmos da primeira categoria, isto é, algoritmos de aprendizado supervisionado. Há quatro estágios do ciclo de decisão na fenotipagem de plantas e atividades de melhoramento onde abordagens de ML podem ser implantadas. São elas:

  • Identificação;
  • Classificação;
  • Quantificação; e
  • Predição.

Os algoritmos utilizados nos trabalhos resultantes do mapeamento sistemático se encontram na tabela a seguir.

IEEE1 Aprendizado de Múltipla Instância
EIC3 Regressão de Floresta Aleatória; e Regressão de Suporte Vetorial
EIC4 Árvore de Decisão
EIC6 Regressão Parcial dos Mínimos Quadrados
EIC7 Rede Neural Convolucional de Super-Resolução
EIC8 Floresta Aleatória
SCD14 Utiliza diversos algoritmos diferentes

A grande maioria desses estudos utiliza algoritmos de ML com o intuito de identificar e classificar suas respectivas plantações.

Assim, através do treinamento e subsequente execução do algoritmo desenvolvido, será possível contemplar os estágios descritos e, portanto, automatizar o processo de fenotipagem.