23.3 C
New York
Sunday, June 30, 2024

Como os roboticistas estão pensando sobre IA generativa


(Uma versão deste artigo apareceu pela primeira vez no boletim informativo de robótica do TechCrunch, Actuator. Inscreva-se aqui.)

O tópico de IA generativa aparece frequentemente em meu boletim informativo, Actuator. Admito que fiquei um pouco hesitante em dedicar mais tempo ao assunto há alguns meses. Qualquer pessoa que faça reportagens sobre tecnologia há tanto tempo quanto eu já passou por incontáveis ​​ciclos de hype e já foi queimada antes. Reportar sobre tecnologia requer uma boa dose de ceticismo, esperançosamente temperado por algum entusiasmo sobre o que pode ser feito.

Desta vez, parecia que a IA generativa estava esperando nos bastidores, ganhando tempo, esperando pela inevitável cratera da criptografia. À medida que o sangue escorria dessa categoria, projetos como ChatGPT e DALL-E estavam de prontidão, prontos para serem o foco de reportagens de tirar o fôlego, esperança, crítica, doomerismo e todos os diferentes estágios Kübler-Rossianos da bolha do hype tecnológico.

Aqueles que acompanham meu trabalho sabem que nunca fui especialmente otimista em relação à criptografia. As coisas são, no entanto, diferentes com a IA generativa. Para começar, há um acordo quase common de que a inteligência synthetic/aprendizado de máquina em geral desempenhará papéis mais centralizados em nossas vidas no futuro.

Continua após a publicidade..

Os smartphones oferecem ótimas informações aqui. Fotografia computacional é algo sobre o qual escrevo com certa regularidade. Houve grandes avanços nessa frente nos últimos anos, e acho que muitos fabricantes finalmente encontraram um bom equilíbrio entre {hardware} e software program quando se trata de melhorar o produto remaining e reduzir o padrão de entrada. O Google, por exemplo, utiliza alguns truques verdadeiramente impressionantes com recursos de edição como Melhor Take e Magic Eraser.

Claro, são truques legais, mas também são úteis, em vez de serem recursos apenas por recursos. Seguindo em frente, no entanto, o verdadeiro truque será integrá-los perfeitamente à experiência. Com fluxos de trabalho futuros ideais, a maioria dos usuários terá pouca ou nenhuma noção do que está acontecendo nos bastidores. Eles ficarão felizes por funcionar. É o guide clássico da Apple.

A IA generativa oferece um efeito “uau” semelhante desde o início, que é outra maneira pela qual difere de seu antecessor do ciclo de hype. Quando seu parente menos experiente em tecnologia pode sentar-se em frente a um computador, digitar algumas palavras em um campo de diálogo e observar a caixa preta cospe pinturas e contos, não é necessária muita conceituação. Essa é uma grande parte da razão pela qual tudo isso se popularizou tão rapidamente – na maioria das vezes, quando as pessoas comuns recebem tecnologias de ponta, é necessário que visualizem como isso poderá parecer daqui a cinco ou dez anos.

Com ChatGPT, DALL-E, and so forth., você pode experimentar isso em primeira mão agora mesmo. É claro que o outro lado disso é a dificuldade de moderar as expectativas. Por mais que as pessoas estejam inclinadas a imbuir os robôs com inteligência humana ou animal, sem uma compreensão basic da IA, é fácil projetar intencionalidade aqui. Mas é assim que as coisas acontecem agora. Começamos com uma manchete que chama a atenção e esperamos que as pessoas fiquem por aqui tempo suficiente para ler sobre as maquinações por trás dela.

Continua após a publicidade..

Alerta de spoiler: nove em cada dez vezes isso não acontece e, de repente, estamos gastando meses e anos tentando fazer as coisas voltarem à realidade.

Uma das vantagens do meu trabalho é a capacidade de discutir essas coisas com pessoas muito mais inteligentes do que eu. Eles dedicam um tempo para explicar as coisas e espero que eu faça um bom trabalho traduzindo isso para os leitores (algumas tentativas são mais bem-sucedidas do que outras).

Depois que ficou claro que a IA generativa tem um papel importante a desempenhar no futuro da robótica, tenho encontrado maneiras de inserir perguntas nas conversas. Acho que a maioria das pessoas na área concorda com a afirmação da frase anterior, e é fascinante ver a amplitude do impacto que acreditam que isso terá.

Por exemplo, na minha conversa recente com Marc Raibert e Gill Pratteste último explicou o papel que a IA generativa está desempenhando na sua abordagem à aprendizagem de robôs:

Descobrimos como fazer algo, que é usar técnicas modernas de IA generativa que permitem a demonstração humana de posição e força para ensinar essencialmente um robô a partir de apenas alguns exemplos. O código não foi alterado em nada. Isto se baseia em algo chamado política de difusão. É um trabalho que fizemos em colaboração com a Columbia e o MIT. Ensinamos 60 habilidades diferentes até agora.

Semana passadaquando perguntei ao vice-presidente e gerente geral de computação incorporada e de borda da Nvidia, Deepu Talla, por que a empresa acredita que a IA generativa é mais do que uma moda passageira, ele me disse:

Continua após a publicidade..

Acho que isso fala nos resultados. Você já pode ver a melhoria da produtividade. Ele pode escrever um e-mail para mim. Não está exatamente certo, mas não preciso começar do zero. Está me dando 70%. Há coisas óbvias que você já pode ver que são definitivamente uma função passo a passo melhor do que como eram antes. Resumindo algo não é perfeito. Não vou deixar que seja lido e resumido para mim. Então, já é possível ver alguns sinais de melhorias de produtividade.

Enquanto isso, durante meu última conversa com Daniela Ruso chefe do MIT CSAIL explicou como os pesquisadores estão usando IA generativa para realmente projetar os robôs:

Acontece que a IA generativa pode ser bastante poderosa para resolver até mesmo problemas de planejamento de movimento. Você pode obter soluções muito mais rápidas e soluções de controle muito mais fluidas e humanas do que com soluções preditivas de modelo. Acho que isso é muito poderoso, porque os robôs do futuro serão muito menos robotizados. Eles serão muito mais fluidos e humanos em seus movimentos.

Também usamos IA generativa para design. Isto é muito poderoso. Também é muito interessante porque não se trata apenas de geração de padrões para robôs. Você tem que fazer outra coisa. Não pode apenas gerar um padrão baseado em dados. As máquinas têm que fazer sentido no contexto da física e do mundo físico. Por esse motivo, nós os conectamos a um mecanismo de simulação baseado em física para garantir que os projetos atendam às restrições exigidas.

Esta semana, uma equipe da Northwestern College revelou sua própria pesquisa no design de robôs gerados por IA. Os pesquisadores mostraram como projetaram um “robô que anda com sucesso em poucos segundos”. Não há muito para se olhar, mas é fácil ver como, com pesquisas adicionais, a abordagem poderia ser usada para criar sistemas mais complexos.

“Descobrimos um algoritmo de design muito rápido baseado em IA que contorna os engarrafamentos da evolução, sem recorrer ao preconceito dos designers humanos”, disse o líder da pesquisa Sam Kriegman. “Dissemos à IA que queríamos um robô que pudesse andar pela terra. Então simplesmente apertamos um botão e pronto! Ele gerou um projeto para um robô em um piscar de olhos que não se parece em nada com nenhum animal que já andou na Terra. Eu chamo esse processo de ‘evolução instantânea’”.

Foi escolha do programa de IA colocar pernas no robô pequeno e mole. “É interessante porque não dissemos à IA que um robô deveria ter pernas”, acrescentou Kriegman. “Redescobriu que as pernas são uma boa forma de se movimentar em terra. A locomoção com pernas é, de fato, a forma mais eficiente de movimento terrestre.”

Continua após a publicidade..

“Do meu ponto de vista, a IA generativa e a automação física/robótica são o que vão mudar tudo o que sabemos sobre a vida na Terra”, disse-me o fundador e CEO da Formant, Jeff Linnell, esta semana. “Acho que todos estamos cientes do fato de que a IA é uma coisa e esperamos que todos os nossos empregos, todas as empresas e estudantes sejam impactados. Acho que é simbiótico com a robótica. Você não precisará programar um robô. Você vai falar com o robô em inglês, solicitar uma ação e então tudo será resolvido. Vai demorar um minuto para isso.”

Antes da Formant, Linnell fundou e atuou como CEO da Bot & Dolly. A empresa sediada em São Francisco, mais conhecida pelo seu trabalho na Gravity, foi aspirada pelo Google em 2013, quando a gigante do software program se concentrou em acelerar a indústria (os planos mais bem elaborados, and so forth.). O executivo me disse que a principal conclusão dessa experiência é que tudo gira em torno do software program (dada a chegada da absorção da Intrinsic and On a regular basis Robots pelo DeepMind, estou inclinado a dizer que o Google concorda).

Related Articles

LEAVE A REPLY

Please enter your comment!
Please enter your name here

Latest Articles