Peu importe les raisons qui peuvent vous inciter à vouloir séparer les pistes d’une chanson des instruments, sachez qu’il existe maintenant une IA ultra efficace pour réaliser cette tache : découvrez Phoenix, le nouveau réseau neuronal isolant des pistes vocales et instrumentales plus rapidement que jamais et offrant une meilleure qualité de séparation vocale que d’autres concurrents basés sur l’IA sur le marché.
Il y a moins d’un an que LALAL.AI, la plateforme d’extraction de pistes de voix et d’instruments en ligne, a présenté Cassiopée, une solution de séparation de pistes surpassant Rocknet, le réseau neuronal initial de LALAL.AI, tant en qualité qu’en précision. Depuis lors, les développeurs de LALAL.AI ont effectué de nombreuses recherches sur comment améliorer l’algorithme de Cassiopée ayant servi de base à Phoenix.
On peut faire des vidéos musicless hilarantes
Avantages de Phoenix:
- Les pistes sont extraites 2 fois plus vite;
- Les résultats de l’extraction sont d’une meilleure qualité;
- Les chœurs sont traités avec plus de précision (en particulier ceux qui sonnent à l’unisson avec les chœurs principaux) et il y a moins d’artefacts sonores (son sec, “sableux”) dans les vocaux.
Le réseau neuronal Phoenix en chiffres:
- Environ 2 téraoctets de données ont été utilisés pour entraîner le réseau à extraire la piste vocale seule. Comme Phoenix “observe” plus de données, il est capable de mieux reconnaître les instruments qui composent la composition et les caractéristiques de la source recherchée;
- 2 fois plus rapide que la vitesse de fonctionnement de Cassiopée. Les seules améliorations architecturales de Phoenix ont permis en même temps d’augmenter la quantité de données observées et de réduire de près de moitié le temps d’exécution du réseau! Pour les utilisateurs, cela signifie que le traitement des morceaux prend deux fois moins de temps.
Développement ultérieur
Pour le moment, LALAL.AI a une solution pour isoler les voix de la classe Phoenix. Il n’y a aucun doute qu’elle sera suivie de solutions pour séparer d’autres pistes – basse, tambours, piano, guitares électrique et acoustique, synthétiseur. Ce n’est qu’une question de temps, car la création de chacune de ces solutions nécessite une quantité importante de temps machine.
Je n’ose même pas imaginer tous les remix, samples et autres créations que l’on risque d’avoir avec la démocratisation de cette technologie à l’avenir.
Et vous, qu’est-ce que vous en pensez?
Dites-nous tout dans les commentaires.
Gwen
Bonsoir,
Oui, cela est une bonne idée pour entendre certains instruments. Comme la stéréo dans le passé, on savait écouter le chanteur et les instruments. Mais pour les films, je trouve que la musique est trop puissante. Le dialogue est trop faible. J’espère que cette technologie peut améliorer les nouveaux films actuels.