CPA-IA

Eixo I — Dados

Estruturação e curadoria de dados industriais para Inteligência Artificial.

Coordenador: Prof. Ricardo Rios (UFBA) - Junte-se a nós na inovação.
Prof. Ricardo Rios

Pesquisador Principal

Prof. Ricardo Rios

Universidade Federal da Bahia (UFBA)

Coordenador do Eixo I — Dados, responsável pelas pesquisas em estruturação, curadoria e modelagem de dados industriais no CPA-IA.

Pesquisadores Associados

Dr. Davidson Moreira

SENAI CIMATEC

Profa. Solange Rezende

Universidade de São Paulo (USP)

Dr. Franco Vieira

HP Brasil

Dr. Guilherme Bragança

Intel Brasil

Sobre este Eixo Temático

O Eixo I do CPA-IA está focado na estruturação e manipulação eficiente dos dados, que são fundamentais para qualquer aplicação de Inteligência Artificial. O escopo deste Eixo abrange o desenvolvimento de métodos e mecanismos para aquisição, processamento, limpeza, padronização e curadoria de grandes volumes de dados multivariados provenientes de diversas fontes da indústria.

A indústria moderna lida com uma variedade de dados brutos — tanto estruturados quanto não estruturados — e a metodologia adotada visa transformar esses dados em um formato acessível e utilizável para modelos de IA. Esse processo inclui a criação de ontologias e a construção de metadados, que permitem estabelecer uma estrutura semântica robusta para classificar e organizar os dados de acordo com os domínios industriais específicos, facilitando sua aplicação futura.

Além disso, a abordagem do Eixo de Dados envolve o uso de técnicas avançadas de geração de dados sintéticos e aumento de dados, essenciais para lidar com a escassez de dados rotulados em muitas situações industriais. A geração de dados sintéticos permite criar conjuntos de dados adicionais para treinar modelos de IA, enquanto o aumento de dados aprimora a diversidade do conjunto original, melhorando a robustez dos modelos.

Outro foco importante é o desenvolvimento de técnicas de pré e pós-processamento de dados, utilizando ferramentas de matemática computacional para resolver problemas de regressão e classificação. Essas técnicas visam otimizar a qualidade dos dados antes que sejam alimentados nos modelos de IA, garantindo que os resultados produzidos sejam precisos, consistentes e confiáveis.

Linhas de Pesquisa

Curadoria de Dados Ontologias Industriais Dados Sintéticos Pré e Pós-Processamento Big Data Industrial

Resultados Esperados

Qualidade de Dados

Melhoria significativa na confiabilidade e padronização de dados industriais.

Modelos Robustos

Modelos de IA treinados com dados sintéticos e diversificados, garantindo desempenho aprimorado.

Integração Industrial

Adoção de processos de curadoria e tratamento de dados nas indústrias parceiras do CPA-IA.

Conheça os outros Eixos do CPA-IA

Ver todos os Eixos