Gemini 2.0 Flash surpreende na edição de imagens

O mais recente modelo Gemini 2.0 Flash concretiza a capacidade de se manipularem fotos e imagens com simples pedidos. As ferramentas AI de geração e manipulação de imagem têm vindo a melhorar ao longos dos últimos anos, mas agora o Gemini 2.0 Flash atinge um patamar em que isso pode ser feito de forma bastante eficiente e acessível a todas as pessoas - através do Google AI Studio. Este modelo tem capacidades incríveis a nível da interpretação e manipulação de imagens, fazendo com que se torne possível efectuar todo o tipo de alterações com simples pedidos de texto. Coisas como aplicar novas roupas e acessórios a pessoas; remover mobiliário de uma sala e fazer experiências com diferentes estilos de mobília; ou até a remoção de watermarks de imagens. Alright, Google really killed it here.You can easily swap your garment just by uploading the pieces to Gemini Flash 2.0 and telling it what to do. pic.twitter.com/pNPBkIdRqy— Halim Alrasihi (@HalimAlrasihi) March 14, 2025 You can now design your house with AI.I asked Google Gemini "make the furniture go away" and then "decorate it with a modern chic aesthetic". It did it on the first try.An interior designer would have charged $5–10k for this in the US. You can get infinite reps for free. pic.twitter.com/Tiv6TjuAyl— Deedy (@deedydas) March 15, 2025 New skill unlocked: Gemini 2 Flash model is really awesome at removing watermarks in images! pic.twitter.com/6QIk0FlfCv— Deedy (@deedydas) March 15, 2025 This is wild. Google's new Gemini model turns complex effects authoring into simple text prompts.Technical barriers gone - just describe what you want. Entire ComfyUI workflows now collapsed into simple prompts.5 workflows you should try for free in Google AI studio. pic.twitter.com/8lccCHIxVQ— Bilawal Sidhu (@bilawalsidhu) March 16, 2025 4/5 I think i'm going to have a lot of fun using this model in my own videos and thumbnails -- you can pull out some exceedingly creative results quickly, that would otherwise have been a multi-controlnet comfyui nightmare.Another 3d wireframe + semantic LiDAR point cloud test pic.twitter.com/sIOWqkaeat— Bilawal Sidhu (@bilawalsidhu) March 16, 2025 Claro que nem sempre os resultados são perfeitos, mas não deixa de ser um excelente indicador da velocidade com que, aquilo que há alguns anos parecia apenas "ficção científica" se está a tornar realidade. Não é difícil antever que, num futuro não muito distante, os programas de edição de imagem poderão começar a dar menos destaque a todas as ferramentas manuais tradicionais, e passar a disponibilizar um botão de microfone ou caixa de chat onde os utilizadores simplesmente peçam aquilo que querem fazer.

Mar 17, 2025 - 01:11
 0
Gemini 2.0 Flash surpreende na edição de imagens
O mais recente modelo Gemini 2.0 Flash concretiza a capacidade de se manipularem fotos e imagens com simples pedidos.

As ferramentas AI de geração e manipulação de imagem têm vindo a melhorar ao longos dos últimos anos, mas agora o Gemini 2.0 Flash atinge um patamar em que isso pode ser feito de forma bastante eficiente e acessível a todas as pessoas - através do Google AI Studio.

Este modelo tem capacidades incríveis a nível da interpretação e manipulação de imagens, fazendo com que se torne possível efectuar todo o tipo de alterações com simples pedidos de texto. Coisas como aplicar novas roupas e acessórios a pessoas; remover mobiliário de uma sala e fazer experiências com diferentes estilos de mobília; ou até a remoção de watermarks de imagens.

Claro que nem sempre os resultados são perfeitos, mas não deixa de ser um excelente indicador da velocidade com que, aquilo que há alguns anos parecia apenas "ficção científica" se está a tornar realidade.

Não é difícil antever que, num futuro não muito distante, os programas de edição de imagem poderão começar a dar menos destaque a todas as ferramentas manuais tradicionais, e passar a disponibilizar um botão de microfone ou caixa de chat onde os utilizadores simplesmente peçam aquilo que querem fazer.