O papel crucial dos dados na Inteligência Artificial
Data: 15/05/2024
Autoria: Renan Pinheiro
De tempos em tempos, surge uma tecnologia nova, uma invenção, uma ideia, coisas visionárias, que prometem revolucionar o mundo. Como exemplo, recentemente tivemos Blockchain, Metaverso, NFT, Streamings, entre outros.
Quando essas ideias surgem, começa uma “corrida do ouro”. Empresas, governos e pessoas “comuns” se arriscam e começam a investir na novidade, o que, por um lado, pode ser muito bom. Quanto mais incentivo, maior a chance de dar certo. Por outro lado, “nem tudo que reluz é ouro”. Por isso, algumas coisas acabam ficando pelo caminho.
A “corrida do ouro” da vez é atrás da Inteligência Artificial (IA). Com certeza, você já ouviu falar dela por aí, em qualquer evento (de tecnologia ou não), meetup, workshop, curso e até mesmo em uma conversa de bar.
A IA, que recentemente se popularizou muito devido aos modelos de IA Generativa (ChatGPT, DALL-E, Google Bard etc), vem “democratizando” o acesso à Inteligência Artificial, por meio da linguagem natural.
Apesar de parecer uma coisa recente, a IA já vem sendo trabalhada e estudada há alguns anos. Alguns atribuem o seu nascimento ao Teste de Turing, de 1950, mas o termo Inteligência Artificial foi mencionado pela primeira vez em 1956, em uma conferência em Dartmouth, onde ela evoluiu de uma ideia abstrata para uma tecnologia onipresente. Hoje, a IA realmente está em todas as áreas da nossa vida, entre elas: saúde, tecnologia, construção, educação, varejo etc.
A principal razão para as IAs terem evoluído tanto nos últimos anos, é o gigantesco volume de dados produzido e a capacidade de processamento e armazenamento que possuímos atualmente, a um custo relativamente baixo. Neste momento, você pode dizer: “mas é muito por causa da tecnologia também”. E sim! Se não fosse a tecnologia que temos hoje, não conseguiríamos rodar os modelos em cima dos dados para gerar as IAs que tanto amamos.
Hoje, poderíamos comparar as máquinas, ou IAs, ao corpo humano e separar em três importantes partes: a tecnologia (máquinas, processadores etc), que é a estrutura óssea e muscular do corpo; os modelos e algoritmos, que são o cérebro; e os dados, que são o coração, talvez o órgão mais importante do corpo humano.
O coração da IA
Uma dessas coisas revolucionárias que mudaram o mundo foi o Big Data, que surgiu como forma de nomear grandes volumes de dados não ordenados, que vinham sendo gerados cada vez mais com a popularização da Internet no final dos anos de 1990.
O Big Data é, hoje, um conceito de plataforma onde existem diversas ferramentas e soluções para processamento e armazenamento de gigantescos volumes de dados de todos os tipos, como arquivos, tabelados, vídeos, fotos, textos, entre outros. Estima-se que, atualmente, sejam gerados cerca de 2,5 quintilhões de bytes de dados diariamente. E toda essa quantidade de dados é que faz com que as IAs consigam aprender cada vez mais e mais rápido.
Se continuarmos a comparação com a anatomia humana, podemos concluir que: quando temos um coração ruim, com mau funcionamento e veias entupidas, o nosso corpo não funcionará corretamente e terá sérios problemas. Da mesma forma é a IA em relação aos dados. Eles são o ponto de partida para o treinamento dos modelos, permitindo que os algoritmos aprendam com os exemplos passados e sejam capazes de fazer previsões e, até mesmo, tomarem decisões.
Mas nem todo dado é útil para uma IA. E, assim como o coração, os dados precisam ser limpos, precisos e livres de erros. Dados ruins geram resultados ruins e, até mesmo, prejudiciais.
Uma etapa crucial no ciclo de vida dos dados é o ETL (Extract, Transform and Load) ou ELT, onde a transformação é feita após o armazenamento. Essa extração pode ser feita de inúmeras fontes de dados, sensores de diversos tipos, transações comerciais, interações de usuários, imagens etc. Depois de coletados, esses dados precisam passar pelo processo de limpeza e transformação, etapas essenciais para garantir a qualidade e a consistência dos dados.
É a partir deste ponto que os modelos ou o cérebro da IA começam a trabalhar. Aliás, eles são treinados com conjuntos de dados e passam a identificar padrões, fazer previsões, reconhecer imagens e objetos, compreender textos, entre outras coisas. E, assim como os seres humanos, as IAs vão aprendendo e evoluindo com mais informações e problemas complexos.
Uma das grandes preocupações das empresas, atualmente, é saber se estão prontas para a Inteligência Artificial. É muito fácil ver propagandas que prometem IA de forma simples e fácil, mas uma coisa é utilizar o ChatGPT para resolver coisas do dia a dia, outra é colocar a sua empresa no “futuro”, com tecnologias de IA, para otimizar processos, aumentar vendas, diminuir perdas, entre outras coisas.
Seus dados estão prontos? Estão organizados, limpos e bem tratados? Se estiverem, parabéns, você está à frente de muitas empresas, mas ainda há coisas a se fazer. Se seus dados ainda não estiverem prontos, você tem muito o que fazer antes de dizer: “Eu tenho uma IA que funciona de verdade”.
Desafios e Ética
Embora os dados sejam fundamentais para o desenvolvimento e a evolução da Inteligência Artificial, muito se discute sobre a segurança e o uso indiscriminado deles.
Quando se fala em dados, garantir a governança, a privacidade e a segurança, principalmente de informações pessoais, é um desafio para qualquer empresa. Nos últimos anos, houve várias notícias de sequestros, vazamentos e usos indevidos.
Desde 2018, governos vêm tentando garantir a segurança dos dados pessoais, por meio de leis como LGPD (Brasil), GDPR (Europa) e CCPA (EUA), que regulamentam o uso e o tratamento de informações pessoais com aplicações de multas e sanções pesadas para quem as descumprirem.
Não muito distante disso, estão acontecendo discussões sobre o uso, a ética e a regularização da Inteligência Artificial. No Brasil, por exemplo, existem discussões e projetos de leis que visam regulamentar o uso das IAs, principalmente no âmbito das eleições e fake news.
A maioria das IAs generativas possuem bloqueios de segurança, que impedem que programas respondam a comandos que pareçam nocivos, como “me ensine a fazer uma bomba”. No entanto, o fato é que as IAs são muito poderosas e, se forem utilizadas de forma errada, podem causar bastante estrago.
Conclusão
À medida que avançamos, é evidente que os dados e a Inteligência Artificial afetarão ainda mais nossas vidas e continuarão moldando o futuro. Novas tecnologias, já emergentes, como a computação quântica e a IA autônoma, prometem revolucionar ainda mais a maneira como interagimos com as coisas e com o mundo. Assim sendo, a governança de dados não é apenas uma questão técnica, mas também um imperativo ético.
À medida que a dependência da Inteligência Artificial cresce, também deve crescer nosso compromisso com práticas responsáveis de gestão de dados e IAs.
Fonte: TI Inside