Diversidade cultural brasileira ainda não aparece emdados que treinam IA

Sistemas treinados com dados de fora do país podem deixar de lado referências de estudantes, ampliando apagamentos históricos, aponta análise

Ana Clara Machado, *, Ylana Siqueira, , São Paulo

Em meio à discussão da Lei nº 11.645/2008, que determina a inclusão obrigatória da história e da cultura afro-brasileira e indígena nos currículos da educação básica, surge uma provocação: a Inteligência Artificial conhece a cultura e a pluralidade do Brasil?

A Bamboo Data, datatech brasileira especializada em datasets culturais, trouxe à tona o debate sobre a representatividade na IA. Amplamente utilizada por estudantes, a tecnologia continua sendo treinada, em sua maioria, com dados produzidos fora do país, o que amplia a discussão sobre a representatividade cultural no ambiente da inteligência artificial.

O cenário evidencia que os principais modelos de IA foram treinados com dados produzidos na Europa e na América do Norte, deixando à margem territórios, línguas, referências culturais e formas de organização social que fazem parte da realidade de grande parcela dos estudantes brasileiros.

Recomendamos para você

Segundo estudos da University of Southern California (USC), 38,6% dos “fatos” utilizados para treinar sistemas de IA apresentam distorções que afetam grupos não ocidentais, por exemplo.

Nesse contexto, o debate se insere em uma pauta global que questiona a governança da inteligência artificial, a diversidade algorítmica e a soberania digital, além de discutir como essas questões podem ser abordadas a partir dos contextos e das particularidades brasileiras.

No ambiente educacional, a discussão é ainda mais relevante, uma vez que é fundamental valorizar as diversidades étnico-culturais dos estudantes, evitando apagamentos históricos que a educação busca superar.

A Bamboo Data é uma datatech brasileira dedicada à estruturação e ao licenciamento de datasets culturais para o treinamento de Inteligência Artificial. A empresa atua na coleta, organização e anotação de dados multimodais voltados ao treinamento de sistemas de IA, com foco em comunidades historicamente sub-representadas nos ambientes digitais.



Fonte: https://www.cnnbrasil.com.br/nacional/brasil/diversidade-cultural-brasileira-ainda-nao-aparece-emdados-que-treinam-ia/