Guia para iniciantes em DALL-E 2: Gerar imagens melhores

PDFelement

DALL E AIé uma plataforma de arte da OpenAI, a mesma empresa que desenvolveu o ChatGPT. O DALLE AI é uma ferramenta que gera imagens a partir de descrições de texto em questão de segundos. Enquanto algumas pessoas afirmam que a vida imita a arte, outras acreditam que é a arte que imita a vida. Independentemente do seu lema, o OpenAI DALE é capaz de imitar praticamente qualquer coisa. Com essa plataforma de texto para arte, é possível criar imagens a partir das suas palavras em questão de segundos. Neste artigo, oferecemos um guia breve para iniciantes sobre como utilizar o DALL·E para criar imagens com inteligência artificial.

Neste artigo

Parte 1. Introdução ao DALL-E 2: Explicação e tecnologia subjacente.
Parte 2. Como usar o DALL-E 2: inscrição e sugestões de redação
Parte 3: Prompts eficazes para gerar imagens em diferentes estilos.
Parte 4. Produza imagens realistas usando o recurso de imagem com IA do Filmora.
Conclusão

Gerador de imagens AI

Transforme suas ideias em imagens visuais com o Wondershare Filmora!

Download gratuito Download gratuito Saiba mais

Parte 1. Introdução ao DALL-E 2: Definição e tecnologia subjacente.

DALL E 2 A inteligência artificial (IA) é um modelo de geração de imagem a partir de texto, desenvolvido pela OpenAI. Este modelo, sucessor do DALLE original da OpenAI, é amplamente utilizado para gerar imagens realistas e diversas a partir de descrições em texto. Com o DALLE-2, é possível criar arte conceitual, imagens fotorrealistas, ilustrações e modelos.

Embora o OpenAI DALLE 2 seja uma versão mais recente, uma comparação com o DALLE original revela diversas semelhanças e diferenças entre ambos. O site DALLE2 gera imagens com uma resolução maior, de 512x512 pixels, em contraste com o antecessor DALL-E, que cria imagens de 256x256 pixels. Devido à maior resolução, é possível obter imagens mais nítidas e detalhadas. O OpenAI DALLE 2 também foi treinado em um conjunto de dados mais extenso e diversificado, possibilitando a geração de imagens de uma gama mais ampla de objetos e cenários. Uma outra diferença significativa é que o DALL·E 2 é um modelo de geração mais robusto e versátil, capaz de produzir imagens mais realistas.

No geral, o DALL-E 2 representa uma evolução do modelo DALL-E2 original, possibilitando a criação de imagens variadas e de alta qualidade.

Treinado em um conjunto de dados mais amplo, consegue compreender de maneira mais aprofundada a relação entre texto e imagem.
Ele emprega uma nova arquitetura de modelo de difusão para gerar imagens de alta qualidade. Esse modelo inicia o processo com uma imagem ruidosa e a transforma de maneira gradual em uma imagem mais realista.
Utiliza a técnica CLIP (Contrastive Language-Image Pre-Training) para alinhar as representações de texto e imagem, assegurando que as imagens sejam mais coerentes com o prompt.

Em relação à tecnologia subjacente e às técnicas empregadas na geração de imagens pelo DALL-E 2, ele utiliza quatro abordagens principais:

Modelo de difusão: Inicia com uma imagem ruidosa e a transforma gradualmente em uma imagem mais realista.
Pré-treinamento Contrastivo de Linguagem-Imagem (CLIP): Alinha as representações de texto e imagem para obter resultados mais consistentes.
Espaço latente hierárquico: Baseia-se em um espaço latente hierárquico para representar imagens em diferentes níveis de detalhes.
Mecanismo de Atenção: Esse mecanismo permite que o modelo se concentre nas partes mais cruciais da descrição em texto ao criar uma imagem.

Parte 2. Como usar o DALL-E 2: inscrição e sugestões de redação

O OpenAI DALLE 2 foi desenvolvido para criar imagens com base em descrições em texto. Aqui estão algumas dicas para você começar, seja usando o site DALL·E mini no seu telefone ou a versão da web.

Como usar o DALL-E 2 para gerar imagens de IA

A melhor abordagem para começar a usar o OpenAI DALLE 2 AI é se envolver diretamente e começar a criar imagens. Siga estas passos para acessar e utilizar o modelo DALL-E 2:

Passo 1Cadastre-se

Acesse a aplicação web do OpenAI DALLE 2 AI por meio do seu navegador web ou dispositivo móvel e faça o registro.

Passo 2Adquira créditos e comece a criar.

Antes de iniciar a geração de imagens, é necessário adquirir créditos. O preço inicial é de US$ 15 para 115 créditos. Após adquirir os créditos, insira seu prompt na página inicial e clique em "Gerar".

Passo 3Selecione sua opção de imagem.

Após inserir o seu prompt, você receberá quatro imagens geradas pela IA em questão de segundos. Clique na imagem que você gosta para fazer download, salvar, compartilhar no feed público, editar ou até mesmo criar mais variações.

Como solicitar ao DALL-E 2 que gere as imagens desejadas

A utilização do OpenAI DALL-E 2 para criar arte e imagens pode ser bastante intuitiva. No entanto, pode ser necessário um pouco de prática para expressar de maneira precisa suas ideias abstratas ao interagir com um sistema de IA, a fim de direcionar os resultados dentre as diversas possibilidades. Veja como você pode inserir imagens ou prompts de texto para criar as imagens desejadas:

Passo 1Inspire-se nos outros

Você pode estar se sentindo sobrecarregado ou talvez sua inspiração ainda não tenha se cristalizado. A maneira mais simples é passar o mouse sobre um conceito ou imagem na galeria da página inicial. Em seguida, escolha "Clique para Experimentar", o que fará com que o DALL-E 2 crie variações semelhantes que podem ser personalizadas com suas descrições.

Passo 2Experimente o recurso "Surpreenda-me"

Não fique preso à tela frontal. O botão "Surpreenda-me" acima da barra de entrada criará uma frase para você começar. Você pode digitar a frase para visualizar os resultados ou personalizá-la com o seu toque pessoal.

Passo 3Utilize palavras simples para explicar a sua ideia.

Seja detalhado em suas descrições e explique suas ideias ao DALL-E 2 de maneira simples, como se estivesse falando com uma criança de cinco anos. Seguindo essa abordagem, você conseguirá imagens de melhor qualidade e mais pertinentes.

Parte 3: Dicas para prompts que produzem diferentes estilos de imagem.

Para aproveitar ao máximo o OpenAI DALL E 2, é essencial aprender estratégias para criar prompts de imagem com eficácia. Embora a experimentação seja a melhor forma de compreender como o modelo de IA interpreta diferentes ideias, as seguintes dicas podem ser úteis:

Seja o mais específico e detalhado possível em sua solicitação.. Se você solicitar uma "vaca" ao DALL E 2 da OpenAI, ele pode gerar algumas imagens com aparência estranha.

Ao fornecer descrições mais detalhadas, a IA é capaz de gerar imagens mais relevantes. Em nosso exemplo, tentaremos criar uma obra de arte representando uma vaca de grande porte em um campo, utilizando um estilo de pintura cubista. É isso que o DALL-E 2 gera:

Tente estilos e descritores diferentes: Além da especificidade, faça pequenas alterações nos seus prompts para gerar diversas variações das imagens. O modelo de IA tende a produzir resultados mais destacados ao imitar pinturas impressionistas e obras digitais do que ao criar imagens realistas. Ao explorar estilos diversos, é provável que você fique mais satisfeito com os resultados.

Simplifique suas solicitações: Evite criar prompts excessivamente complexos com múltiplos personagens e detalhes intricados. Tais prompts geralmente resultam em imagens caóticas, pois a IA não conseguirá determinar o foco adequado. Considere esta imagem de uma cena em que uma equipe dos Vingadores e da Liga da Justiça se encontra com Bowser e os Rugrats.

Imagens ficam menos coerentes com descrições complexas. Eles não são tão divertidos como se espera. Aplique a mesma abordagem para gerar uma pintura do Homem de Ferro. Isso proporciona algo mais realista e limpo.

A seleção de palavras-chave e conceitos desempenha um papel crucial na geração de imagens. Ao elaborar seu prompt de texto, leve em consideração o seguinte:

Qual é o objeto ou assunto principal que você deseja ver na imagem?
Que estilo você deseja para a imagem (realista, abstrato ou algo intermediário)?
Em que estado de espírito você está interessado para a imagem (feliz, triste ou outro)?

Com esses fatores em mente, você saberá quais palavras-chave ou conceitos específicos usar. Por exemplo, você pode desejar criar uma imagem de um gato contente repousando sob um raio de sol. Nesse caso, as palavras-chave "gato feliz raio de sol" podem ser utilizadas.

Você pode também experimentar diferentes abordagens, testando diversos prompts e parâmetros. Por exemplo, você pode explorar diversos estilos de arte, como "pintura" ou "arte digital", e referir-se a artistas específicos, como "Van Gogh" ou "Picasso". Você pode igualmente incorporar cores e tons distintos, fazendo uso de palavras-chave como "brilhante", "frio", "vermelho" ou "azul". Outra alternativa é conduzir experimentos relacionados à iluminação e composição, como "iluminação frontal", "iluminação de fundo" ou "assimétrica". Para explorar ao máximo o potencial criativo do DALL-E 2:

Use sua imaginação. Não hesite em experimentar diversos prompts e parâmetros para descobrir o que a IA é capaz de gerar.

Combine elementos diferentes. A combinação de elementos diversos em seus prompts resultará em criações mais criativas. Por exemplo, você pode experimentar um prompt como "um gato alado descansando sob um raio de lua".
Use avisos negativos. Solicitações negativas podem impedir o DALL-E 2 de gerar elementos específicos na imagem. Um exemplo seria usar "no people" (sem pessoas) para assegurar que o DALL·E 2 não inclua pessoas na imagem.

Parte 4. Crie fotos realistas com o Filmora Recurso de imagem AI

Para atender às necessidades dos criadores mais criativos, o Wondershare Filmora introduziu um recurso de geração automática de imagens a partir de texto. Com essa funcionalidade, você pode escolher entre 3 resoluções para cada imagem gerada. Após gerar a imagem, você pode usá-la diretamente em seu projeto de vídeo ou para outros fins. Basta descrever o que você deseja ver, e o AI Image transformará sua descrição em imagens visuais.

Download gratuito Para Win 7 ou posterior (64 bits)

Download gratuito Para macOS 10.14 ou posterior

Um guia passo a passo para utilizar imagens com IA.

Passo 1Iniciar imagem AI

A imagem AI está localizada ao lado do botão "Importar" no painel de mídia. Ao clicar nesse botão, você inicia sua jornada criativa para imagens generativas.

Passo 2Descreva a imagem que você deseja

A criação de uma imagem com esse recurso é bastante simples. Insira a descrição da imagem desejada na caixa de entrada e escolha a resolução desejada.

Passo 3Comece a criar

Clique no ícone de download para adicionar a imagem gerada diretamente ao seu painel de mídia. Você também pode arrastar e soltar a imagem na linha do tempo para começar a editá-la em detalhes.

No Filmora, você pode aproveitar diversos recursos para editar detalhadamente suas imagens, incluindo:

AI Portrait - Elimine o fundo de vídeos e imagens de forma simples, sem a necessidade de usar um Chroma Key ou tela verde.

AI Smart Cutout – Automaticamente, o software remove objetos indesejados da imagem, como pessoas e ícones.

AI Portrait – Automaticamente, o software remove o fundo dos objetos em sua imagem.

Conclusão

Gerar imagens com o DALL-E 2 da OpenAI é uma emocionante experiência com inteligência artificial. Basta digitar algumas palavras, e o OpenAI DALL-E 2 dá vida à sua imaginação automaticamente. É interessante observar que você pode gerar uma imagem para praticamente qualquer coisa. Se você é um entusiasta ou simplesmente deseja explorar sua criatividade com a IA, recomendamos usar o DALL-E 2 e o recurso de imagem de IA do Filmora para criar conteúdo exclusivo e visualmente atraente.

Prompts de Vídeo

Tendências de Vídeo

Enciclopédia de Vídeo

Inspire-se com Filmora

Hub de Criadores

Efeitos Especiais DIY

O que há de novo

Vídeo tutorial

Guia do usuário

Especificações técnicas

Perguntas frequentes

Contate-nos

Histórico de versões

Cases de Sucesso

Avaliações

Histórias de clientes

Artigos recomendados