A aplicação de algoritmos de Aprendizado de Máquina (“ML”) requer a existência de uma vasta quantidade de dados para desencadear a tomada de decisão em diversos processos industriais.
Nesse sentido, a implementação de novos paradigmas tecnológicos, como a IoT (Internet das Coisas), possibilita a geração de diferentes tipos de estruturas de dados, como tem sido observado em trabalhos com foco em Big Data Analytics.
Em geral, os dados têm um ciclo de vida específico como: origem, coleta, armazenamento, processamento, visualização, transmissão e aplicação.
No entanto, na maioria das vezes, os dados coletados que serão processados nas etapas subsequentes, são confundidos com dados ruidosos gerados no ambiente circundante, tornando difícil separar o conjunto de dados original do ruído.
Por outro lado, ambientes dinâmicos com rápida mudança e diferentes estados de funcionamento da máquina impõem desafios significativos à detecção de falhas baseada em ML.
No geral, surge a necessidade de transmissão e computação confiáveis e precisas e em tempo real, enquanto os problemas de segurança estão se tornando cada vez mais sérios, devido ao aumento do nível de interconexão entre os diferentes subsistemas.
Os algoritmos de ML podem ser categorizados em algoritmos de aprendizado supervisionado, aprendizado não supervisionado, aprendizado por reforço (RL) e aprendizado profundo (DL).
Cada categoria é brevemente descrita abaixo:
Aprendizagem supervisionada é um método onde o especialista insere saídas conhecidas para entradas específicas para treinar o algoritmo e é amplamente usado para classificação e regressão. Assim, ML supervisionado é geralmente empregado em cenários com disponibilidade de dados rotulados. Algoritmos populares incluem redes neurais artificiais (ANNs) e máquinas de vetores de suporte (SVMs)
Aprendizagem não supervisionada é quando não há fornecimento de feedback e o algoritmo encontra padrões em conjuntos de dados desconhecidos (agrupamento, regras de associação, mapas auto-organizados) e, portanto, dados não rotulados são usados para fins de treinamento. O algoritmo não supervisionado mais popular e conhecido é a análise de componentes principais (PCA), usada principalmente para fins de monitoramento.
Aprendizagem por reforço refere-se à operação de ML não supervisionada, examinando se uma ação escolhida resultou em uma recompensa, para uma métrica de desempenho específica. A RL exige ações sequenciais e testa seus resultados, selecionando aquelas que melhor se adaptam ao problema em questão. Portanto, RL se distancia significativamente de outras categorias de aprendizagem que são baseadas no aproveitamento de dados históricos, criando inteligência a partir de decisões e recompensas anteriores.
Aprendizado profundo é quando múltiplas camadas foram empregadas para construir uma ANN, capaz de tomar decisões inteligentes, manipulando grandes quantidades de dados com alta complexidade, sem qualquer intervenção humana. Alguns algoritmos de DL são redes neurais convolucionais (CNNs), máquina de Boltzmann restrita (RBM) e codificadores automáticos (AE).
É evidente que, conforme a era da Indústria 4.0 está chegando, o nível de adoção de algoritmos de ML é cada vez maior para satisfazer as necessidades de diferentes aspectos de ambientes industriais. Isso inclui monitoramento de processo e controle de qualidade, detecção e diagnóstico de falhas, bem como monitoramento da integridade da máquina e manutenção preditiva. Além disso, as capacidades do ML, no que diz respeito ao processamento oportuno de uma abundância de dados, são fundamentais para salvaguardar a cibersegurança da Internet das Coisas Industrial (IIoT) habilitada para ambientes de manufatura interconectados, detectando e mitigando com precisão as ameaças