Uma equipe de cientistas da Universidade de Nova York se inspirou na maneira como os bebês aprendem a falar, a andar e a processar informações para criar um método de ensino de linguagem a uma ferramenta de inteligência artificial (IA). Sam, o bebê, começou a usar um capacete equipado com uma câmera especial aos 6 meses. O dispositivo foi usado até que ele completasse 25 meses.
A ideia era que a câmera captasse o mundo na perspectiva visual e auditiva da criança, registrando imagens e sons, enquanto ela realizava diversas atividades cotidianas. Assim, haveria uma visão completa e não filtrada do ambiente real e de como uma criança em crescimento interage com ele.
Durante o período do estudo, Sam precisava usar o capacete por cerca de uma hora, duas vezes por semana. No total, o projeto obteve 61 horas de gravações e cerca de 250 mil palavras compiladas, com as respectivas imagens. Entre as atividades registradas nas filmagens estava brincadeiras, leituras, a hora de comer… Quanto mais variados fossem os contextos, melhor.
Os pesquisadores queriam observar a maneira como as crianças adquirem a linguagem ao longo dos primeiros meses de vida, para entender se esse processo poderia ser imitado com precisão também para treinar modelos de IA. O sistema desenvolvido a partir do aprendizado com Sam foi denominado Child Vision Contrastive Learning (CVCL).
O diferencial do modelo é a associação das palavras às imagens, em vez de usar apenas bases de dados pré-concebidas e limitadas, como acontece com a maior parte das ferramentas de IA existentes atualmente.
Os resultados, publicados na revista Science, mostram avanços significativos. O modelo CVCL conseguiu identificar corretamente os objetos em 62% dos casos, uma percentagem notavelmente elevada em comparação com os 25% do que se esperaria que estivessem corretos por acaso. A taxa de sucesso é até equivalente a de outros modelos de IA. No entanto, eles costumam requerer uma quantidade muito maior de dados para atingir níveis semelhantes de precisão.
Embora os modelos tradicionais de IA dependam de grandes quantidades de dados pré-processados, a nova abordagem demonstra que o contexto de aprendizagem, refletido nas experiências da vida real dos seres humanos nos seus primeiros anos, tem um impacto significativo nos resultados.
Porém, apesar das descobertas promissoras, o estudo tem algumas limitações. A pesquisa foi realizada com uma única criança e no âmbito de uma única língua, o inglês. Os pesquisadores apontaram a necessidade de expandir os estudos para incluir uma variedade maior de assuntos e culturas, para que seja possível validar os resultados iniciais e explorar a generalização do modelo CVCL em diferentes contextos.
À medida que as crianças em diferentes partes do mundo aprendem e vivenciam o mundo de diferentes maneiras, a captura destes diversos contextos poderia abrir novos caminhos para o desenvolvimento de uma IA mais inclusiva e culturalmente adaptada.
Este estudo não só oferece novas perspectivas sobre o processo de aprendizagem das IAs, mas também levanta questões sobre como os humanos, desde os primeiros estágios da vida, interagem com o seu ambiente para desenvolver competências cognitivas básicas.
Fonte: Revista Crescer