Eixo I — Dados
Estruturação e curadoria de dados industriais para Inteligência Artificial.
Coordenador: Prof. Ricardo Rios (UFBA) - Junte-se a nós na inovação.
Pesquisador Principal
Prof. Ricardo Rios
Universidade Federal da Bahia (UFBA)
Coordenador do Eixo I — Dados, responsável pelas pesquisas em estruturação, curadoria e modelagem de dados industriais no CPA-IA.
Pesquisadores Associados
Dr. Davidson Moreira
SENAI CIMATEC
Profa. Solange Rezende
Universidade de São Paulo (USP)
Dr. Franco Vieira
HP Brasil
Dr. Guilherme Bragança
Intel Brasil
Sobre este Eixo Temático
O Eixo I do CPA-IA está focado na estruturação e manipulação eficiente dos dados, que são fundamentais para qualquer aplicação de Inteligência Artificial. O escopo deste Eixo abrange o desenvolvimento de métodos e mecanismos para aquisição, processamento, limpeza, padronização e curadoria de grandes volumes de dados multivariados provenientes de diversas fontes da indústria.
A indústria moderna lida com uma variedade de dados brutos — tanto estruturados quanto não estruturados — e a metodologia adotada visa transformar esses dados em um formato acessível e utilizável para modelos de IA. Esse processo inclui a criação de ontologias e a construção de metadados, que permitem estabelecer uma estrutura semântica robusta para classificar e organizar os dados de acordo com os domínios industriais específicos, facilitando sua aplicação futura.
Além disso, a abordagem do Eixo de Dados envolve o uso de técnicas avançadas de geração de dados sintéticos e aumento de dados, essenciais para lidar com a escassez de dados rotulados em muitas situações industriais. A geração de dados sintéticos permite criar conjuntos de dados adicionais para treinar modelos de IA, enquanto o aumento de dados aprimora a diversidade do conjunto original, melhorando a robustez dos modelos.
Outro foco importante é o desenvolvimento de técnicas de pré e pós-processamento de dados, utilizando ferramentas de matemática computacional para resolver problemas de regressão e classificação. Essas técnicas visam otimizar a qualidade dos dados antes que sejam alimentados nos modelos de IA, garantindo que os resultados produzidos sejam precisos, consistentes e confiáveis.
Linhas de Pesquisa
Resultados Esperados
Qualidade de Dados
Melhoria significativa na confiabilidade e padronização de dados industriais.
Modelos Robustos
Modelos de IA treinados com dados sintéticos e diversificados, garantindo desempenho aprimorado.
Integração Industrial
Adoção de processos de curadoria e tratamento de dados nas indústrias parceiras do CPA-IA.