Flux 1.1 Pro: Inovações e Comparações no Mercado de IA para Imagens
Na semana passada, a Black Forest Labs, o estúdio por trás da família de geradores de imagens AI Flux, anunciou o lançamento do Flux 1.1 [Pro]. Este lançamento acontece apenas dois meses após a disponibilização de sua linha original de modelos, que incluem o Flux 1 Pro (um modelo de código fechado com capacidades líderes na indústria), Flux 1 Dev (um modelo open source não comercial) e Flux Schnell (um modelo totalmente open source).
Avanços Tecnológicos e Comparações com Concorrentes
Os modelos Flux marcaram um grande avanço na tecnologia de IA generativa com suas capacidades de geração de texto, aderência a prompts e qualidade geral de imagem. Mesmo os modelos menores, Flux Dev e Flux Schnell, conseguiram gerar resultados comparáveis aos da MidJourney, superando significativamente as saídas fornecidas pelo SD3, a tão aguardada evolução da Stability sobre o SDXL, que resultou ser algo desapontador.
Métricas e Desempenho
O novo modelo já se destacou, conquistando a melhor classificação Elo na arena de imagens da Artificial Analysis—uma plataforma de benchmarking líder para modelos de IA. Ele superou todos os outros modelos de texto para imagem disponíveis no mercado, mantendo-se quase tão rápido quanto seu modelo menor.
O gráfico acima mostra a pontuação Elo (qualidade da imagem) no eixo Y e as velocidades de geração no eixo X. Os entusiastas da MidJourney podem notar que seu modelo não está representado—é tão lento que literalmente não aparece no gráfico. No entanto, sua pontuação Elo está em torno de 1100 pontos, logo abaixo do Ideogram V2.
Estratégia de Preço e Acessibilidade do Flux 1.1 Pro
O Flux 1.1 Pro se destaca em termos de preços, custando apenas $0,04 por imagem—valor esse inferior ao de muitos outros modelos no mercado, incluindo o modelo original Flux 1 Pro. Essa estrutura de preços torna-o um forte competidor em relação a outros serviços pagos como MidJourney e Ideogram, que custam $96 e $84 por ano cada. As opções da MidJourney e Ideogram também são mais lentas e apresentam um custo mais alto por token.
Infelizmente, o Flux 1.1 Pro não pode ser executado localmente. Ao contrário de seus contrapartes open source, como os modelos FLUX1 [Dev] e FLUX1 [Schnell], esta nova versão profissional é um modelo de código fechado, limitando os usuários ao acesso por plataformas como Together AI, Replicate, Fal AI e Freepik. O modelo não pode ser ajustado ou personalizado.
Para aqueles que consideram experimentar o modelo, algumas dessas plataformas oferecem créditos gratuitos para gerações, mas uma vez esgotados, o melhor serviço, segundo nossos critérios, é Freepik. Isto se deve ao fato de que seu fluxo de trabalho Mystic aumenta dramaticamente as gerações, proporcionando maiores detalhes e melhor estética.
IT’S FINALLY HERE!
🔥 Freepik Mystic 🔥
“Any sufficiently advanced technology is indistinguishable from magic.” — Arthur C. Clarke ✨ Mystic é o gerador AI mais avançado até hoje com saídas diretamente em Full HD.
Mas o que realmente é Mystic? Vamos nos aprofundar 🧵👇 pic.twitter.com/nrlPTi0OWo
— Javi Lopez ⛩️ (@javilopen) agosto 27, 2024
Considerações Finais sobre o Flux 1.1 Pro
Até o momento, não há anúncios sobre uma versão 1.1 open source dos modelos FLUX1 [Dev] ou FLUX1 [Schnell], mas é evidente que a Black Forest Labs está concentrando seus esforços em criar ótimos modelos para criadores de imagens e vídeo.
Testamos o novo modelo Flux e os resultados foram satisfatórios. Não é um salto geracional—como a mudança do SDXL para o Flux—mas é, sem dúvida, uma atualização bem-vinda. O modelo é geralmente muito realista, possui ótimas capacidades de geração de texto e é bastante criativo em tarefas e estilos artísticos.
Imagens Testadas e Resultados
Exemplo de geração de imagem 1: A seguir está um resultado de teste utilizando um prompt detalhado:
Prompt: “Polaroid photo with VSCO filter, 1990, woman, night, flash photo, blonde, young face, beautiful shadows, tropical plants, inside an apartment, DSLR, camera flash, holding a handwritten sign on a notebook saying ‘Verification for Decrypt October 7, 2024.’ The woman is doing the peace sign with her other hand.”
O modelo se destacou na produção de imagens realistas, melhorando a aparência de “retocado” dos modelos Flux iniciais.
Aderência ao Prompt
O novo modelo apresenta melhorias notáveis na aderência a prompts, incorporando mais elementos à cena sem perder a qualidade. Um exemplo é o seguinte prompt: “A white cat playing the piano, wearing sunglasses and a hat, wearing purple Hawaiian style, full body shot against a gray studio background with lighting elements and a pterodactyl hanging from the ceiling, commercial video screengrab.”
Conclusão
O Flux 1.1 Pro se mostra, em geral, mais consistente e lógico em suas gerações. Se você não pode executar um modelo localmente, é uma excelente opção. Ele compreende a linguagem natural, tornando-se adequado para iniciantes—embora esta não seja sua principal força. O MidJourney tende a ser mais criativo ao aprimorar comandos ruins.
No entanto, o Flux 1.1 Pro é mais barato, mais rápido e geralmente melhor em qualidade do que qualquer modelo atual, podendo se tornar a melhor opção para aqueles que buscam boa aderência a prompts, qualidade e capacidades de geração de texto.
Para aqueles que estão dispostos a pagar pelo modelo, qualquer uma das opções atuais atende as necessidades. Valorizamos o serviço oferecido pela Fal.AI, pois proporciona mais controle do que os outros. Contudo, o Freepik parece ser a melhor opção para quem deseja uma experiência mais profissional. Embora ligeiramente mais caro, é significativamente mais versátil, oferecendo não apenas serviços de geração de imagem, mas também funcionalidades adicionais como upscaling de imagens, outpainting, gerações de rascunho para imagem, um removedor de fundo e uma biblioteca de conteúdo para experimentação.
#Flux1Pro, #InteligenciaArtificial, #GeracaoDeImagens, #IA, #BlackForestLabs, #Tecnologia, #ArteDigital
autor original:
Jose Antonio Lanz
ref:https://decrypt.co/284932/meet-flux-1-1-pro-best-ai-image-generator