Bom, não sou especialista na área, apenas brinquei um pouco com TensorFlow, mas vamos entender em que pé anda a tecnologia de Machine Learning e se de fato seria possível uma “consciência” de máquina com o que temos hoje.

Entendendo o básico

Hoje, para criar um processo de aprendizado de máquina, um programador, usando ferramentas como o TensorFlow da própria Google, precisa criar uma série de instruções e parâmetros de acerto e erro, portanto criar padrões em que, por tentativa e erro, a maquina “aprende” a identificar a ponto de reduzir ao máximo a possibilidade de erros em uma operação.

Esse processo ocorre de forma estatística, onde o objetivo do algoritmo é alcançar certo nível de predict ou, tentando criar um paralelo, aumentar seu nível de acerto de uma determinada operação.

No TensorFlow esse processo requer um “treinamento” em que o algoritmo testa possibilidades, descartando os erros e aperfeiçoando os acertos, esses ciclos de testes tem o nome de gerações. Com isso é possível criar modelos de identificação e classificação de imagens por exemplo, muito utilizado para encontrar conteúdos proprietários no Youtube. Outra aplicação para esse tipo de conceito é reconhecer padrões em linguagens para traduções, como o utilizado no Google Translate.

Linguagem natural

Um dos pilares do aprendizado de máquina, algoritmos de análise de linguagem natural em tese, utilizando esses ciclos de aprendizagem e analisando uma grande quantidade de textos, conseguem identificar padrões de escrita e sintaxe para formular frases e textos, realizar traduções e até mesmo analisar os termos empregados em um texto para identificar “sentimentos” e correlações, como podemos testar no Google Natural Language.

Outra aplicação muito interessante do PLN é em sistemas para transcrever áudio em texto, o chamado Speech-to-text, e analisar textos em documentos digitalizados. Obviamente essas APIs públicas do Google devem ser uma fração do que eles tem internamente, é provável que muitas aplicações ainda não tenham sido relevadas, mas com o que temos público já é possível criar uma IA que analisa textos, áudios e imagens em vários idiomas. Veja um exemplo da analise semântica do Google:

Modelos pré-processados

Além de fornecer o TensorFlow, a Google também oferece uma lista de modelos pré-processados para diversas aplicações: modelos para classificação de imagens, para detecção objetos (muito utilizado na indústria e em agro negócios) e até mesmo sistemas de reconhecimento facial, como o utilizado pelo Facebook para auto-identificar pessoas em uma foto.

Enfim, existe uma infinidade de modelos para aplicações diversas e, obviamente, devem existir vários outros que não são públicos.

Ainda assim, por mais que seja possível criar modelos de aprendizagem de máquina que analisam imagens, áudios e textos, existem um segundo passo nessa evolução, que são sistemas que utilizam esses modelos para criar novas soluções.

Aplicações para uso dos modelos

Já ficamos sabendo publicamente de IA que cria músicas com base em obras existentes, IA que “programa” baseado em demandas humanas, como a Copilot, IA que pinta quadros. Mas perceba que esses sistemas foram programados para um função específica, analisaram milhares de dados e geraram modelos eficientes para executar essa função. Uma IA que pinta quadros não programa ou cria músicas, a menos que tenha sido programado para executar ambas a funções. Quando estamos falando de consciência, mesmo que seja parcial, pressupõe-se aprender conhecimentos não programados ou a IA teria que se “auto programar” para adicionar funções realizadas pela mente humana que não foram originalmente implementadas e, honestamente, não acredito que estamos nesse momento da história.

Processar a quantidade de informações necessária para uma IA aprender a programar como um humano demandaria muito esforço computacional, uma grande quantidade de hardware. Para desenvolver modelos eficientes com base no que temos de aplicações escritas até hoje, ao ponto de criar algo que nenhum humano jamais criou, precisaria ser dado outro passo, que seria uma espécie de “raciocínio criativo” que grandes artistas e desenvolvedores adquirem depois de anos de experiência. Aí sim a IA chegaria ao ponto de criar soluções inovadoras, linguagens revolucionarias, tecnologias nunca antes vistas pela humanidade. Mas certamente se uma IA tivesse chegado a esse ponto, a empresa que a criou faria uso comercial dessa inovação. Porém, honestamente, até hoje tudo que eu vi na área de programação tem um desenvolvedor humano por trás, ou mesmo uma comunidade com milhares de programadores.

Teste de Turing

Quem é da área da computação já ouviu falar do “Teste de Turing”, criado pelo renomado criptografo Alan Turing, que para muitos é o pai das ciências da computação, em seu artigo de 1950 “Computing Machinery And Intelligence“,

I PROPOSE to consider the question, ‘Can machines think?’ This should begin with definitions of the meaning of the terms ‘machine’ and ‘think’. The definitions might be framed so as to reflect so far as possible the normal use of the words, but this attitude is dangerous. If the meaning of the words ‘machine’ and ‘think’ are to be found by examining how they are commonly used it is difficult to escape the conclusion that the meaning and the answer to the question, ‘Can machines think?’ is to be sought in a statistical survey such as a Gallup poll. But this is absurd. Instead of attempting such a definition I shall replace the question by another, which is closely related to it and is expressed in relatively unambiguous words.

A. M. TURING – 1950

Óbvio que o tema é bem complexo, chega a ter certo cunho filosófico e, durante anos, vários autores refutaram ou tentaram criar soluções que testassem positivo. De qualquer forma, acho interessante a leitura caso seja um estudante da área, ou até mesmo um entusiasta da área de Machine Learning e Inteligência Artificial.

Conclusão

Por mais que a tecnologia tenha evoluído muito nas últimas décadas, tanto em hardware quanto em software, devido à natureza do problema, criar uma “consciência” de máquina me parece um pouco improvável pelo custo de processamento e tempo necessário para se criar um modelo auto-programável ao ponto de sair do escopo definido em sua programação original sem a intervenção direta de um humano. Mas, já que não existe a possibilidade de saber o que se esconde nos porões da Google, tendo alguns dos melhores engenheiros e matemáticos do mundo, dinheiro quase infinito, Data Centers gigantescos e provavelmente a melhor infra-estrutura de hardwares do mundo, além de armazenar a maior quantidade de dados, na ordem de petabytes, não me surpreenderia que partisse dela essa proeza.

E, honestamente, não sei se prefiro me iludir em pensar que ainda existe uma distância até esse momento sabendo das consequências possíveis ou se de fato ainda não seremos contemplados com uma guerra nos moldes da Skynet.