No campo da IA generativa (AIGC), a arte das instruções de texto é crucial. O lançamento do modelo Gen-3 Alpha da Runway revolucionou a forma como controlamos com precisão a IA generativa. Isso não é apenas uma vitória tecnológica, mas também um salto na criatividade e na expressão.
Ao usar produtos de IA generativa como o Gen-3, você pode descobrir que os resultados gerados às vezes estão longe do esperado. Isso geralmente ocorre porque as instruções não são detalhadas ou precisas o suficiente. Por exemplo, a simples instrução "pôr do sol no deserto" é muito vaga e não orienta o modelo a compreender sua verdadeira intenção.
A maneira correta é fornecer uma descrição visual detalhada, como "deserto ao pôr do sol, luz solar dourada sobre dunas ondulantes, um grupo de camelos retornando de longe em fila, levantando bastante poeira, estilo realista em câmera lenta em alta definição". Isso permite que o modelo capture sua criatividade com mais precisão.
Estrutura de instruções de texto do Gen-3
A Runway recomenda dividir os detalhes de cena, tema e movimento da câmera em diferentes módulos. Essa estrutura clara proporciona os melhores resultados. A estrutura de instruções padrão do Gen-3 inclui instruções de texto para estabelecer a cena e detalhes adicionais, como:
Close-up: cachorrinho miniatura curioso em cima de um dedo em alta definição.
Mudança de cena: sobrevoando um castelo irlandês, descobrindo arranha-céus de uma cidade cyberpunk futurista.
Embora o Runway Gen-3 tenha um ótimo desempenho, sua alta taxa de assinatura impede muitos usuários. Se você não pode pagar a assinatura do Gen-3, não se preocupe, as mesmas instruções podem ser usadas no [Nome do software alternativo - Substitua "可灵" aqui].
No entanto, produtos diferentes podem ter lógicas diferentes. Por exemplo, a instrução "cachorrinho miniatura curioso em cima de um dedo em alta definição" não gera facilmente resultados satisfatórios em [Nome do software alternativo - Substitua "可灵" aqui]. Por quê? Porque a lógica do [Nome do software alternativo - Substitua "可灵" aqui] segue a lógica real, então o cachorrinho gerado pode não ser tão miniatura, sem o efeito realista e ao mesmo tempo irreal do Runway Gen-3.
Então, para gerar esse efeito usando [Nome do software alternativo - Substitua "可灵" aqui], você precisa modificar ligeiramente as instruções, indicando o tamanho desejado do cachorrinho.
A seguir, o AIbase usará essa lógica para replicar uma mini-zebra em um dedo. As instruções são as seguintes: uma zebra miniatura fofa andando em cima de um dedo em alta definição, tão pequena quanto uma formiga, zebra miniatura.

Então, você pode obter uma mini-zebra fofa assim:
Usando o mesmo método, basta substituir o nome do animal para criar miniaturas de pandas, tigres e outros animais.
Segue abaixo exemplos detalhados de instruções fornecidos oficialmente:
Transição perfeita
Sequência de tomadas FPV em alta velocidade: a câmera voa perfeitamente sobre um cânion glacial até uma paisagem de nuvens de sonho.
Movimento da câmera
Oceano brilhante à noite, com criaturas bioluminescentes debaixo d'água. A cena começa com um close-up de uma medusa bioluminescente, depois amplia, mostrando todo o oceano iluminado por várias cores brilhantes sob as estrelas. Movimento da câmera: começa com um close-up da medusa, depois recua e sobe suavemente, mostrando o oceano brilhante.
Cartão de título de texto
Tela de título com movimento dinâmico. A cena começa com uma parede pintada com tinta colorida. De repente, tinta preta escorre pela parede, formando a palavra "Runway". Os detalhes da tinta pingando são ricos, com textura nítida, centralizados e com excelente iluminação cinematográfica.
Palavras-chave de instruções
As palavras-chave ajudam a alcançar estilos específicos na saída. Assegurar que as palavras-chave sejam consistentes com a instrução geral permite que elas sejam mais evidentes na saída.
Por exemplo, em uma tomada grande angular, se a câmera não consegue focar bem no rosto, adicionar palavras-chave sobre a textura da pele não é muito útil. Ao contrário, adicionar mais detalhes sobre o ambiente pode ser muito benéfico para uma tomada grande angular.
Lembre-se dessa coerência. Abaixo estão algumas palavras-chave diferentes que você pode tentar ao redigir instruções:





