Monolith Soft a créé toute une série de jeux qui mettent tous en scène des personnages dynamiques et des histoires entrainantes. Ces aventures sont portées par des cut-scenes et des lore dumps, et à chaque nouvelle sortie, Monolith Soft s’est amélioré pour rendre ces aspects plus attrayants.
Selon les commentaires du directeur de Monolith Soft, le studio n’est toujours pas satisfait de sa production, et il cherche à améliorer un élément en particulier qui devrait attirer les joueurs encore plus profondément dans leurs créations.
Tetsuya Takahashi, cofondateur de Monolith Soft et directeur exécutif de Xenoblade, a fait part de la volonté du studio d’améliorer l’expression des personnages dans ses titres à l’avenir. Plutôt que de faire parler les personnages et d’utiliser des mouvements de caméra dynamiques pour maintenir l’intérêt des joueurs, Monolith Soft souhaite que les personnages eux-mêmes deviennent encore plus séduisants grâce à leurs expressions faciales.
« Lorsque nous disons que nous valorisons les expressions, nous les avons toujours considérées comme importantes et nous aimerions les traiter avec encore plus d’importance à l’avenir. En d’autres termes, nous avons abordé la grammaire des jeux vidéo tout à l’heure, mais il y a des scènes de conversations banales, n’est-ce pas ? S’il s’agit d’une conversation de trois minutes, on s’en lasserait si elle était écrite en grammaire de jeu vidéo. On pourrait appuyer sur le bouton, en espérant pouvoir progresser. En revanche, lorsqu’on regarde un film en prises de vue réelles, même si une scène dure environ cinq minutes, tant que les performances et l’alchimie des acteurs fonctionnent, même s’il n’y a pas de musique ou d’effets spéciaux, on finira par le regarder quand même. La différence réside peut-être dans le choix des mots ou la puissance des répliques, mais le plus important, ce sont les expressions. Beaucoup d’acteurs peuvent parler en utilisant uniquement leurs yeux, ce qui permet de combler un vide et d’éviter que les gens ne s’ennuient dans les médias en prise de vue réelle, mais pour les jeux, nous ne pouvons pas encore atteindre ce niveau d’expressivité. C’est pourquoi nous voulons nous concentrer davantage sur ce point à l’avenir.
À titre d’exemple extrême, si nous devions réaliser une scène de dix minutes, nous voudrions faire quelque chose qui puisse tenir sur les seuls échanges verbaux, sans musique ni effets, et c’est l’objectif que nous pensons viser. Ce n’est qu’un exemple, bien sûr. Nous n’essayons pas de faire une scène de 10 minutes, alors ne vous méprenez pas (rires).
Pour en revenir au sujet, si l’on regarde les cutscenes d’un jeu, on constate qu’il y a beaucoup de scènes d’action et de scènes tape-à-l’œil, et il y a de nombreux titres qui, à mon avis, feraient un excellent matériel de référence pour les générations futures. Mais lorsqu’il s’agit de personnes et d’échanges de mots et d’émotions, la tendance est aux actions, tandis que la mise en valeur des parties silencieuses est encore principalement bloquée dans le domaine de la grammaire des jeux vidéo, alors j’aimerais que Monolith Soft y parvienne en premier ».