Global communication network concept. Worldwide business. Diversity.

A IA está a “comer-se” a si própria e a criar mais IA. Este loop poderá levar ao fim da internet?

Por Human Resources Em 21:05, 23 Set, 2024

A Inteligência Artificial (IA) é treinada com dados que são, em grande parte, retirados da internet. No entanto, com o volume de dados necessários para “ensinar” a IA, muitos modelos acabam por consumir outros dados gerados por IA, o que pode, por sua vez, afectar negativamente o modelo como um todo, revela o The Week US.

Com a IA a produzir e a consumir dados, a internet tem o potencial de ser invadida por bots, com cada vez menos conteúdo a ser produzido por humanos.

A canibalização da IA é má?

A IA está a “comer-se” a si própria. Actualmente, está a crescer rapidamente e os dados criados pelo homem, necessários para treinar modelos, estão a esgotar-se. «À medida que vasculham a web em busca de novos dados para treinar os próximos modelos – uma tarefa cada vez mais desafiante – [os bots de IA] provavelmente vão absorver algum do seu próprio conteúdo gerado por IA, criando um loop inconsciente no qual o que antes era um output se torna input noutro momento», refere o The New York Times. «Quando a IA generativa é treinada no seu próprio conteúdo, o seu resultado também pode afastar-se da realidade.» Isto é conhecido como colapso do modelo.

Ainda assim, as empresas de IA estão de mãos atadas. «Para desenvolver produtos de IA cada vez mais avançados, as Big Tech podem não ter outra escolha senão alimentar os seus programas com conteúdo gerado por IA, ou simplesmente não ser capaz de separar “conteúdos humanos” dos sintéticos», explica o The Atlantic. Da forma como estão, os dados sintéticos são necessários para acompanhar o crescimento da tecnologia. «Apesar dos avanços impressionantes, os chatbots e outras ferramentas generativas, como as de criação de imagens, continuam algo disfuncionais – os resultados estão repletos de preconceitos, falsidades e incongruências.» E estas imprecisões são então transferidas para o seguinte modelo de IA.

Isto não quer dizer que todos os dados gerados por IA sejam maus. «Existem certos contextos onde os dados sintéticos podem ajudar a IA a aprender», realça o Times. «Por exemplo, quando o resultado de um modelo de IA maior é utilizado para treinar um modelo mais pequeno, ou quando a resposta correcta pode ser verificada, como a solução para um problema de matemática ou as melhores estratégias em jogos como xadrez.» Além disso, os especialistas estão a trabalhar para criar conjuntos de dados sintéticos com menor probabilidade de colapsar um modelo. «Neste momento, a filtragem é uma área de investigação completamente implementada», afirmou Alex Dimakis, cientista informático da Universidade do Texas e co-director do National AI Institute for Foundations of Machine Learning, ao The Atlantic. «E vemos que isso tem um enorme impacto na qualidade dos modelos.»

A IA está a dominar a internet?

A questão do treino de modelos mais recentes de IA pode estar a salientar um problema maior. «O conteúdo de IA está a dominar a internet» e o texto gerado por «grandes modelos de linguagem está a preencher centenas de sites», explica a Scientific American. O conteúdo de IA também está a ser criado muito mais rapidamente e em maiores quantidades do que o conteúdo produzido pelo ser humano. «Sinto que estamos neste ponto de inflexão, em que muitas das ferramentas existentes que utilizamos para treinar estes modelos estão rapidamente a ficar saturadas com texto sintético», disse Veniamin Veselovskyy, estudante de pós-graduação do Swiss Federal Institute of Technology, à Scientific American. Imagens, publicações nas redes sociais e artigos criados por IA já inundaram a internet.

A quantidade astronómica de conteúdo de IA na internet, incluindo tweets de bots, imagens absurdas e críticas falsas, deu origem a uma teoria mais sinistra. A teoria da morte da internet é a «crença de que a grande maioria do tráfego, publicações e utilizadores da internet foram substituídos por bots e conteúdo gerado por IA, e que as pessoas já não moldam a direcção da Internet», afirmou a Forbes. Embora antes fosse apenas uma teoria a pairar em fóruns durante o início de 2010, a crença ganhou força recentemente.

Alguns acreditam que o conteúdo de IA na internet vai mais além do que apenas obter engagement nas redes sociais ou modelos de formação. «Será que a teoria da morte da internet termina na cultura inofensiva desse engagement?», perguntaram Jake Renzella, professor e director de estudos de Ciências Informáticas na UNSW Sydney, e Vlada Rozova, investigador em aprendizagem automática aplicada na Universidade de Melbourne, no The Conversation. «Ou talvez por trás exista uma tentativa sofisticada e bem financiada de apoiar regimes autocráticos, atacar adversários e espalhar propaganda?»

Felizmente, os especialistas dizem que a teoria da morte da internet ainda não se concretizou. «A grande maioria das publicações que se tornam virais – opiniões, piadas, observações, etc. – não são geradas pela IA», garante a Forbes.

Ler Mais