banner

Notícias

Jun 05, 2023

Os geradores de imagens de alimentos com IA não podem substituir os fotógrafos de alimentos

Arquivado em:

Com infinitos anéis de camarão e torres rígidas de lula, as tentativas da IA ​​de fotografar alimentos se transformam em algo misterioso

Se você comprar algo em um link do Eater, a Vox Media poderá ganhar uma comissão. Veja nossa política de ética.

Outro dia me vi, como costumamos fazer, perdendo 10 minutos brincando com um gerador de imagens de IA. Eu estava com fome na época e, por fim, comecei a criar opções para um almoço hipotético: um prato de charcutaria sombrio, erguendo-se como as ruínas de uma cidade antiga com um pôr do sol ao fundo; anéis de lula de aparência rígida, aparentemente feitos de lucite ou vidro, dispostos em uma pilha artisticamente torta; e um círculo de 12,5 camarões vermelhos translúcidos, lisos e caricaturais, sob uma faixa de texto cursivo que dizia simplesmente “Shimp”. Algumas das imagens pareciam comida; nenhum deles parecia comestível.

Como meu experimento na hora do almoço mostrou, fazer com que a IA gere uma imagem de qualidade requer saber o que você está fazendo – começando com instruções bem escritas (além de apenas “prato de camarão”), um passo crucial que eu não havia dado. Às vezes, os resultados são surpreendentes, como as imagens geradas por IA que Bon Appétit encomendou recentemente ao artista Bobby Doherty, que acompanhava um artigo sobre a conversa de um editor com o ChatGPT enquanto este desenvolvia pratos para um hipotético restaurante New American. Algumas das ideias da IA ​​​​para o menu eram de revirar os olhos, como pode ser o caso dos restaurantes New American, mas a arte vívida e sobrenatural de Doherty ainda parece boa o suficiente para comer.

Parece, no entanto, que a imagem média dos alimentos gerada pela IA não chega lá. Em vários cantos do Reddit e do Google Images, fatias de pizza e folhas se sobrepõem estranhamente ou se misturam, caril brilha nas bordas, perus têm pernas incomuns em lugares incomuns e outros supostos alimentos não são identificáveis. No Adobe Stock, os usuários podem monetizar arte gerada por IA, desde que tenham os direitos para fazê-lo, e rotular seus uploads como ilustrações. A maioria das naturezas-mortas fotorrealistas e paisagens de mesa da plataforma são aceitáveis, embora algumas se tornem grotescas: um anel interminável de camarões, todo corpo e sem cabeça, ou seu primo impossível com cabeças em cada extremidade. Imagens como essas, e mesmo aquelas que são menos absurdas, muitas vezes residem em algum lugar do vale misterioso – um local muito debatido que se destaca em muitas conversas sobre IA.

Ainda assim, à medida que as empresas tecnológicas promovem as aplicações da IA ​​para o desenvolvimento de receitas e até mesmo para o ensino de técnicas culinárias, as redes neurais artificiais também estão a fazer a sua entrada no mundo da fotografia de alimentos. Algumas agências de fotografia, incluindo a Shutterstock, fizeram parceria com plataformas de IA em suas próprias ferramentas de geração de imagens. Startups como Swipeby e Lunchbox pretendem cortejar restaurantes e operações de entrega que precisam de recursos visuais para seus menus online. É claro que já existe uma maneira de criar recursos visuais – pagando fotógrafos de alimentos para fazerem seu trabalho. E para além deste pântano ético existe um problema jurídico mais imediato: alguns modelos de IA foram treinados com trabalhos criativos, muitas vezes sem licença, extraídos da Internet, e podem responder a pedidos para imitar artistas específicos. Compreensivelmente, os artistas estão começando a levar as coisas aos tribunais.

Deixando de lado todas as preocupações morais, por enquanto, pelo menos, a comida ainda parece mais deliciosa nas mãos de fotógrafos de comida, cinegrafistas e estilistas de comida e acessórios. Então, o que a IA está errando? Karl F. MacDorman, estudioso de interação homem-máquina e reitor associado da Escola Luddy de Informática, Computação e Engenharia da Universidade de Indiana, diz que existem muitas teorias sobre o que pode fazer com que certas representações provoquem sentimentos de estranheza ou desconforto à medida que se aproximam. precisão total. “O vale misterioso é frequentemente associado a coisas liminares”, diz MacDorman, como quando não temos certeza se algo está vivo ou morto, animal ou não, real ou animado por computador. Isto pode ser especialmente pronunciado quando uma imagem mistura categorias díspares ou atribui características a um assunto que geralmente pertencem a coisas muito diferentes. Talvez não seja surpreendente que a IA, nesta conjuntura relativamente inicial, possa ter dificuldades com tudo isto.

COMPARTILHAR