Eixo I — Dados

Estruturação e curadoria de dados industriais para Inteligência Artificial

Coordenador: Prof. André Wyzykowski (UFBA)

Prof. André Wyzykowski

Universidade Federal da Bahia (UFBA)

Coordenador do Eixo I — Dados, responsável pelas pesquisas em estruturação, curadoria e modelagem de dados industriais no CPA-IA.

Sobre este Eixo Temático

O Eixo I do CPA-IA está focado na estruturação e manipulação eficiente dos dados, que são fundamentais para qualquer aplicação de Inteligência Artificial. O escopo deste Eixo abrange o desenvolvimento de métodos e mecanismos para aquisição, processamento, limpeza, padronização e curadoria de grandes volumes de dados multivariados provenientes de diversas fontes da indústria.

A indústria moderna lida com uma variedade de dados brutos — tanto estruturados quanto não estruturados — e a metodologia adotada visa transformar esses dados em um formato acessível e utilizável para modelos de IA. Esse processo inclui a criação de ontologias e a construção de metadados, que permitem estabelecer uma estrutura semântica robusta para classificar e organizar os dados de acordo com os domínios industriais específicos, facilitando sua aplicação futura.

Além disso, a abordagem do Eixo de Dados envolve o uso de técnicas avançadas de geração de dados sintéticos e aumento de dados, essenciais para lidar com a escassez de dados rotulados em muitas situações industriais. A geração de dados sintéticos permite criar conjuntos de dados adicionais para treinar modelos de IA, enquanto o aumento de dados aprimora a diversidade do conjunto original, melhorando a robustez dos modelos.

Outro foco importante é o desenvolvimento de técnicas de pré e pós-processamento de dados, utilizando ferramentas de matemática computacional para resolver problemas de regressão e classificação. Essas técnicas visam otimizar a qualidade dos dados antes que sejam alimentados nos modelos de IA, garantindo que os resultados produzidos sejam precisos, consistentes e confiáveis.

Linhas de Pesquisa

Curadoria de DadosOntologias IndustriaisDados SintéticosPré e Pós-ProcessamentoBig Data Industrial

Resultados Esperados

Qualidade de Dados

Melhoria significativa na confiabilidade e padronização de dados industriais.

Modelos Robustos

Modelos de IA treinados com dados sintéticos e diversificados, garantindo desempenho aprimorado.

Integração Industrial

Adoção de processos de curadoria e tratamento de dados nas indústrias parceiras do CPA-IA.

Conheça os outros Eixos do CPA-IA

Ver todos os Eixos