Additionally, the models do not understand the concept of a word being negated by the word in front of it. So using "not [X]", "no [X]", "exclude [X]", "minimise [X]", "with no [X]", and "without [X]" does not work. As you observed, it ignores the negation word and adds to the image or video the thing you are trying to avoid. You basically need to find "positive" words and phrases telling the model what you want to see rather than telling it what you do not want to see. Such as "flat land" rather than "no mountains" or "desolate" rather than "no people". If I am not sure how to describe something I want to exclude in a positive way, I will ask Google Gemini or ChatGPT for ideas. Just be aware that when they give prompts, they are usually too wordy and conversational, so you have to edit them, but they are good for ideas.
시각장애인을 안내하는 장면으로, 반보 앞에 있는 여성의 오른팔의 팔꿈치를 반보 옆 뒤쪽에서 걷는 시각장애인 여성이 살짝 잡고 있다. 시각장애인은 팔을 잡은 손이 아닌 다른 손으로는 지팡이를 짚고 있다. 두 사람 모두 한국인으로 안경은 쓰고 있지 않다. 걷는 배경은 길에 인도를 걷고 있다. 걷는 모습을 보여줘야 하기 때문에 전신이 다 나와야 함. 반보 뒤쪽에 있는 여성이 시각장애인이니까 그 사람이 지팡이를 짚어야 한다. 그리고 발까지 다 이미지로 보여야 한다 / 이렇게 썼는데도 계속 두 사람다 안경을 끼고 두 사람다 지팡이를 짚고, 반신만 나온다던가 서로 반보 앞 뒤도 아닌 서로 다른 방향으로 보듯이 서 있기도 하고. 정말 못 그리네요.
Could you provide a few more details by what you mean? Maybe a screenshot or the prompt you are using? The more information you provide the more we can assist you.