À l'occasion de la présence de Qiplim à VivaTech 2026, j'ai produit une courte vidéo de mascotte entièrement par IA. Le pitch tient en une phrase : une peluche jaune chevauche le Grand Éléphant des Machines de l'Île, l'éléphant grandit jusqu'à enjamber la France en une foulée, et la mascotte atterrit en héros sur l'anneau de VivaTech, à Paris. Quinze secondes, format vertical, pensé pour tenir en un seul prompt vidéo.
Derrière ce rendu, deux outils : Magnific pour toutes les images, et Dreamina pour la vidéo via le modèle Seedance 2. Voici ce que je retiens de ce projet, des erreurs comprises, pour quiconque veut créer des visuels et des vidéos par IA sans y laisser ses nerfs ni son budget.
Tout part d'un scénario clair
Le premier apprentissage n'a rien d'une révélation technique : c'est une question de méthode. Créer avec l'IA ne dispense d'aucune des rigueurs d'un projet vidéo classique. C'est même l'inverse. Plus l'outil génère vite, plus l'absence de cap se paie cher en allers-retours.
Tout part d'un scénario défini le plus précisément possible. Sans lui, les résultats sont systématiquement décevants, et pour une raison simple : si je ne sais pas exactement ce que je veux, je suis incapable d'évaluer ma satisfaction. Je regarde un rendu, il est joli, mais je ne peux pas dire s'il est bon, parce que je n'ai aucune référence à laquelle le comparer. Le scénario, le découpage en plans, le format, le ton, tout cela se décide avant la première génération.
La vitesse de l'IA ne remplace pas la vision. Elle l'amplifie quand elle existe, et elle multiplie le bruit quand elle manque. Un brief flou produit cent images moyennes ; un brief net produit la bonne en quelques essais.
Une fois la vision posée, il reste à lui donner vie. Et c'est là qu'intervient la vraie colonne vertébrale d'un projet IA cohérent : les références visuelles.
Ancrer les références : personnages et lieux
Pour qu'un personnage reste identique d'une image à l'autre, puis tout au long d'une vidéo, il faut l'ancrer. Je suis donc parti de feuilles de character design de la mascotte de Qiplim, réalisées avec Nano Banana 2 (le modèle d'image de Google) directement dans Magnific. Une planche de tournage, une planche d'émotions, une planche d'actions.
Ces planches changent tout. Elles servent ensuite de référence d'identité à chaque étape : pour générer de nouvelles images, puis pour la séquence vidéo. Concrètement, je les fournis au modèle vidéo en lui disant explicitement de garder la mascotte conforme à ces planches, partout. C'est ce qui empêche le personnage de dériver d'un plan à l'autre.
Les images d'ancrage : première et dernière frame
À partir de ces références, j'ai généré sur Magnific les deux images clés de la vidéo : la première frame (la mascotte au-dessus de l'éléphant de Nantes, devant le Château des ducs de Bretagne, dans une gerbe d'eau dorée) et la dernière frame (la mascotte filant vers le ciel au-dessus de l'anneau de VivaTech, Tour Eiffel en fond, golden hour). Ces deux images deviennent les points de départ et d'arrivée que le modèle vidéo doit relier.
Première frame, Nantes
La mascotte au-dessus du Grand Éléphant des Machines de l'Île, en pleine chute, golden hour, jet d'eau venant de la droite. Cette image fixe le décor de départ, la lumière et la direction du mouvement.
Dernière frame, Paris
La mascotte s'élance au-dessus de l'anneau blanc de Paris Expo Porte de Versailles, Tour Eiffel en fond. Même lumière dorée, même jet d'eau venant de la droite : c'est ce raccord qui permet à la vidéo de boucler sans montage.
J'ai aussi ajouté des images de référence pour les éléments que le modèle ne connaît pas finement : le Grand Éléphant des Machines de l'Île et une vue aérienne de l'île de Nantes. Plus une référence est précise, moins le modèle improvise.
Pour faire mieux, j'aurais dû générer aussi des feuilles de référence de lieux, comme je l'ai fait pour le personnage. Une planche dédiée à Nantes aurait rendu la ville plus réaliste et cohérente d'un plan à l'autre. C'est mon principal regret sur ce projet : j'ai verrouillé le personnage, pas les décors.
Pourquoi Seedance 2
J'avais besoin de produire vite une vidéo cohérente, à partir de plusieurs images de référence, sans usine à gaz de montage. Seedance 2 répond exactement à ce cahier des charges. Trois raisons concrètes ont guidé mon choix.
Pour situer l'outil : Seedance 2 est le modèle de génération vidéo de ByteDance, sorti en février 2026, capable de combiner jusqu'à douze entrées multimodales (texte, images, vidéo, audio) en une seule génération (source : Comparateur IA). C'est cette logique multi-entrées qui en fait un bon outil de cohérence.
D'abord, la durée en un seul prompt. Seedance permet d'aller jusqu'à 15 secondes d'un seul tenant. Pour un trajet narratif complet, de Nantes à Paris, c'est ce qui évite de découper en cinq clips et de les raccorder à la main.
Ensuite, le multi-références. Je peux fournir plusieurs images en même temps et assigner à chacune un rôle précis : celle-ci est la première frame, celle-là la dernière, ces trois-là définissent le personnage, cette autre l'environnement. C'est la clé de la cohérence sur une séquence longue.
Enfin, la cohérence physique et caméra. Seedance 2 n'est pas un générateur d'images animées au hasard : il se comporte comme un assistant conscient de la caméra et du poids des objets. Bien dirigé, il produit un mouvement crédible plutôt qu'un diaporama qui s'agite.
Prompter Seedance efficacement
C'est la partie la plus contre-intuitive, et celle qui m'a fait gagner le plus de temps une fois comprise. Seedance 2 n'est pas un outil d'écriture créative à qui l'on raconte une scène en espérant qu'il l'interprète. C'est un assistant conscient de la caméra. On ne lui décrit pas une histoire, on lui assigne des rôles à des images et on lui décrit du mouvement, de la caméra et de la physique.
Le système de références
Chaque image fournie reçoit une référence et un rôle explicite. Et il faut toujours dire comment chaque image doit servir, une idée par ligne, sans jamais mélanger plusieurs intentions dans la même phrase.
@image1 = USE AS FIRST FRAME (Nantes, golden hour, splash...)
@image2 = USE AS LAST FRAME (Paris, anneau VivaTech...)
@image3 / @image4 / @image5 = REFERENCE for character identity
@image6 = REFERENCE for the Elephant of Nantes
@image7 = REFERENCE for the Nantes environment
La distinction est essentielle. « USE AS first / last frame » épingle un plan exact, et le modèle interpole entre les deux. « REFERENCE for... » emprunte une idée visuelle, une identité, un décor, sans forcer la frame. L'astuce qui fonctionne le mieux pour un trajet d'un point A vers un point B : fournir les deux frames et demander simplement de montrer ce qui se passe entre les deux.
Ne pas re-décrire l'image source
En image vers vidéo, l'image porte déjà l'identité. Redécrire chaque objet de la frame dilue le prompt et nuit au suivi. Je me concentre uniquement sur ce qui bouge : le mouvement, la caméra, les contraintes. Au lieu de redire ce que l'on voit, dire ce qui se passe.
La structure de prompt qui marche
Sujet, action, environnement, caméra, style, contraintes. Dans cet ordre. Le sujet en détail (matière, proportions, posture), l'action au présent avec des adverbes d'intensité, l'environnement avec sa lumière, la caméra avec un mouvement nommé, deux ou trois mots de style, et des contraintes de stabilité.
Décrire des forces, pas seulement des actions
Pour activer le moteur physique, je décris le poids, l'élan, l'impact. « Atterrit avec du poids et un petit rebond à l'impact » vaut bien mieux que « atterrit ». C'est ce qui rend l'eau, les sauts et les collisions crédibles.
La caméra ne bouge que si on la nomme
Sans instruction, Seedance reste frontal, droit, statique. C'est le défaut que j'ai observé sur ma première version : trop plat, trop sage. Pour un rendu cinématique, j'impose des mouvements nommés, orbite, plan grue, travelling avant, gros plan, dézoom, et je varie les vitesses entre les segments. C'est le rythme qui fait la différence.
| Réflexe naturel | Ce qui marche avec Seedance |
|---|---|
| Décrire une scène et un récit | Assigner un rôle à chaque image de référence |
| Redécrire tout ce qu'on voit | Décrire uniquement le mouvement et la caméra |
| « Il saute, il tombe » | « Il saute avec de l'élan, retombe avec du poids » |
| Laisser la caméra par défaut | Nommer un mouvement de caméra précis |
| Un clip de 30 secondes | Des clips de 5 à 10 secondes, 15 au plafond |
Garder les clips courts et tester malin
Cinq à dix secondes maintiennent une cohérence bien plus serrée que quinze à trente. Quinze secondes reste un plafond raisonnable ; au-delà, le personnage risque de dériver. Côté crédits, je teste en Seedance 2 Fast, en 720p, j'affine le prompt, et je finalise seulement en Seedance 2 Standard, en 1080p, une fois le timing bon. Un prompt court avec un mouvement clair bat souvent un prompt long bourré d'instructions.
Un mot d'honnêteté sur la méthode. Je présente ici une génération en un seul prompt, du début à la fin. J'aurais tout aussi bien pu générer chaque plan court séparément, puis les assembler un à un au montage, et c'est même ce que je recommande quand la cohérence est critique. D'ailleurs, la vidéo en tête de cet article n'est pas une prise unique : c'est un montage de deux générations différentes, dans lesquelles j'ai interpolé certains plans pour obtenir le résultat qui me plaisait le plus.
Détail qui surprend : le prompt de Seedance 2 plafonne à 4000 caractères, espaces et sauts de ligne compris. En pratique je vise 3500 à 3900 pour garder de la marge. Quand il faut couper, je sacrifie d'abord les adjectifs de style, puis les redescriptions d'images. Jamais les rôles des références ni les instructions de caméra : ce sont eux qui portent le résultat.
Vous voulez les prompts exacts ?
Je partage les prompts précis utilisés pour générer cette vidéo, frames comprises. Recevez-les par email.
Recevoir les promptsCombien coûte la stack : Magnific et Dreamina
Parlons argent, parce que c'est souvent ce qui manque dans les retours d'expérience. Pour ce projet, j'ai investi dans deux abonnements.
- Un abonnement Magnific Premium+, à 36 euros par mois.
- Un abonnement annuel Dreamina, qui me revient à 309 euros pour l'année.
Pourquoi Dreamina pour la vidéo
Le choix de Dreamina n'est pas un hasard. Dreamina délivre directement l'API de Seedance, à un tarif plus bas qu'ailleurs, tout simplement parce que ce sont eux qui développent le modèle (Dreamina, comme Seedance, appartient à ByteDance). Quand l'éditeur d'un modèle propose lui-même l'accès, on évite la marge de l'intermédiaire. Et le coût par seconde de Seedance figure déjà parmi les plus bas du marché face à Sora, Kling ou Veo (source : Atlas Cloud). Pour qui prévoit de générer beaucoup de vidéo, c'est l'accès au meilleur rapport entre le coût et la qualité du modèle.
| Outil | Rôle | Formule | Coût |
|---|---|---|---|
| Magnific | Images, tests, références | Premium+ mensuel | 36 euros / mois |
| Dreamina | Vidéo (Seedance 2) | Annuel | 309 euros / an |
Le budget tokens, vidéo par vidéo
Sur Dreamina, chaque génération coûte des tokens, et c'est là que la méthode fait la différence. Mon conseil : générer d'abord en Seedance 2 Fast, en 720p, pour itérer à bas coût, soit 180 tokens par essai, jusqu'à atteindre le niveau qui me convient. Puis passer en Seedance 2 Standard, en 1080p, pour la génération finale, à 225 tokens.
| Phase | Mode Seedance 2 | Définition | Coût |
|---|---|---|---|
| Itération (deux essais) | Fast | 720p | 180 tokens par génération |
| Génération finale | Standard | 1080p | 225 tokens |
| Total par vidéo | 585 tokens |
Je suis sur le plan Standard annuel, qui me donne environ 3600 tokens par mois. En comptant deux itérations en Fast et une finale en Standard par concept, cela représente jusqu'à 6 vidéos de 15 secondes par mois. Ramené à l'unité, le coût théorique tourne autour de 4 à 5 euros par vidéo de 15 secondes, hors temps de conception.
Une note de prudence avant d'uploader quoi que ce soit. Ces outils sont hébergés hors de l'Union européenne et vos images transitent par leurs serveurs. Pour un projet de marque ou un visuel public, aucun souci. En revanche, n'y déposez pas de données personnelles ni de visuels confidentiels de clients sans avoir vérifié les conditions de traitement. La règle vaut pour toute donnée partagée avec un outil d'IA.
Magnific, l'outil créa à maîtriser en 2026
Mon avis, après ce projet et bien d'autres : Magnific est aujourd'hui l'outil de création à avoir absolument dans ses compétences quand on fait du marketing et de la communication créative en 2026. Il permet de créer énormément de visuels et de vidéos, de tester des idées très vite, avec une vraie boîte à outils réunie au même endroit.
Ce n'est pas qu'un générateur d'images de plus. C'est un atelier : on y génère, on y compose, on y upscale, on y accède à plusieurs modèles, dont Nano Banana 2 que j'ai utilisé pour les planches de la mascotte. Pour une équipe marketing, savoir manier ce type d'outil n'est plus un gadget, c'est une compétence de production, l'esprit même d'un studio graphique piloté par l'IA.
La vraie bascule de 2026 n'est pas la qualité des images, qui est déjà là. C'est la vitesse d'itération. Tester dix directions artistiques en une matinée change la façon dont on conçoit une campagne. La compétence rare n'est plus de savoir générer, mais de savoir diriger.
Conclusion
Créer une vidéo IA cohérente n'est pas une affaire de chance ni de prompt magique. C'est de l'organisation : un scénario net, des références verrouillées, un modèle bien choisi et bien dirigé. Magnific pour les images, Dreamina et Seedance 2 pour la vidéo, et une méthode empruntée à la production vidéo classique. La technologie a changé, la rigueur reste la même.
Mon prochain pas, et mon conseil pour aller plus loin : traiter les décors comme j'ai traité le personnage, avec leurs propres feuilles de référence. C'est ce qui fera passer le résultat du convaincant à l'irréprochable.
Recevez les prompts exacts de cette vidéo
Je vous envoie par email les prompts précis utilisés sur ce projet : les planches de personnage, la première et la dernière frame, et le prompt vidéo complet de Seedance 2. De quoi reproduire la méthode sur vos propres projets.
Vos données ne seront jamais partagées. Politique de confidentialité
C'est envoyé
Vérifiez votre boîte mail, les prompts arrivent. Pensez à regarder vos spams si vous ne voyez rien.