3DX Spatializer User Manual
User Manual: Pdf
Open the PDF directly: View PDF
.
Page Count: 14
| Download | |
| Open PDF In Browser | View PDF |
AUDIO E SPACIAL 3DX SPATIALIZER - PLUGIN PARA LA ESPACIALIZACIÓN DE ARCHIVOS DE AUDIO 31 de octubre de 2017 Diego Mauricio Murillo Gómez Angélica Londono Borja Thomas Viana Alzate Ing. de Sonido Índice general 0.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 0.2. Descripción del Software . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 0.2.1. Instalación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 0.2.2. Especificaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 0.2.3. Análisis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 0.2.4. Diseño . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 0.2.5. Implementación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 0.2.6. Validación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 0.2.6.1. Pruebas de usuario . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 0.3. Estructura del software . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 0.3.1. Módulos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 0.3.1.1. LOAD IR: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 0.3.1.2. DRY / WET: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 0.3.1.3. DISTANCE: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 0.3.1.4. AZIMUTH / ELEVATION: . . . . . . . . . . . . . . . . . . . . . . . 12 0.3.1.5. INPUT / OUTPUT: . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 1 Angélica Londoño Borja - Thomas Viana Alzate 0.1. 3DX Spatializer I NTRODUCCIÓN En la actualidad hay un acelerado crecimiento en la industria multimedia, la cual busca incansablemente desarrollar formatos de reproducción visual y auditiva que le permitan al usuario tener una experiencia inmersiva. Todo lo relacionado con el audio espacial se ha convertido en un tema atractivo para muchos amantes de los videojuegos y el contenido social mediático. El 3DX Spatializer es un plugin desarrollado para espacializar archivos de audio en tiempo real y recrearlos en un recinto específico permitiendo crear experiencias sonoras inmersivas en proyectos musicales y audiovisuales. El plugin está desarrollado bajo la implementación de convoluciones en tiempo real con respuestas al impulso y HRTFs (Head Related Transfer Functions). 0.2. D ESCRIPCIÓN DEL S OFTWARE 0.2.1. Instalación Para que el DAW (Digital Audio Workstation) pueda reconocer el plugin es indispensable pegar el archivo .VST en la carpeta de plugins definida por el DAW. 0.2.2. Especificaciones Lenguaje de programación: Cabbage/cSound. Plataforma: macOSX. Denominación de la aplicación: 3DX Spatializer Versión: 1.0. Base teórica: Convolución en tiempo real y síntesis binaural. Página 2 de 13 Angélica Londoño Borja - Thomas Viana Alzate 3DX Spatializer 0.2.3. Análisis El plugin 3DX Spatializer es una herramienta que le permite al usuario especificar la orientación de procedencia en términos de azimuth y elevación de archivos de audio y recrearlos en un recinto determinado. Además de tener estas opciones, el usuario tiene la posibilidad de determinar la distancia a la cual desea ubicar el archivo de audio, modificar el nivel de entrada y salida de la señal y automatizar parámetros. En la tabla 1 se especifican los requerimientos de diseño y una descripción del proyecto. Tabla 1: Descripción y requerimientos del proyecto PROYECTO DESCRIPCIÓN REQUERIMIENTOS R1 R2 R3 R4 R5 R6 R7 R8 VST 3DX Spatializer El proyecto tiene como objetivo espacializar archivos de audio en el espacio tridimensional recreándolos en un recinto deseado mediante la convolución con una respuesta al impulso que el usuario puede cargar. Debe ser un software tipo plugin con formato .VST. Posibilidad de cargar diferentes respuestas al impulso monofónicas. Posibilidad de controlar la influencia de la respuesta al impulso sobre el archivo de audio. Posibilidad de controlar la distancia virtual del archivo de audio. Posibilidad de controlar el nivel de entrada y salida de la señal. Posibilidad de orientar el archivo de audio en cualquier dirección del espacio tridimensional. Procesamiento en tiempo real de la espacialización. Posibilidad de automatizar parámetros. 0.2.4. Diseño Determinando la relación entre el usuario y el sistema, se hace una representación de los casos de uso con la funcionalidad completa. El diagrama de casos de uso define el conjunto de funcionalidades afines que el sistema debe cumplir para satisfacer los requerimientos de diseño. Este conjuntos de funcionalidades son representados por los casos de uso, como se muestra en la figura 1. Página 3 de 13 Angélica Londoño Borja - Thomas Viana Alzate 3DX Spatializer Figura 1: Diagrama de casos de uso En las tablas 2, 3 y 4 se hace una descripción detallada de cada uno de los casos de uso y subcasos de uso operados por el usuario y se hace referencia a los requerimientos consignados en la tabla 1, con los cuales tiene relación. Página 4 de 13 Angélica Londoño Borja - Thomas Viana Alzate 3DX Spatializer Tabla 2: Descripción de los casos de uso 3DX Spatializer DESCRIPCIÓN DE CASOS DE USO Nombre: Cargar plugin en el DAW Actor: Usuario Función: Permitir el funcionamiento del plugin en el DAW. Descripción: El usuario debe cargar el plugin tipo VST en un canal de audio en el DAW. Referencia: De requerimientos: R1 Nombre: Cargar IR, Elegir IR Actor: Usuario Función: Permitir elegir una respuesta al impulso para cargar al plugin. Descripción: Una vez se decide cargar la respuesta al impulso (IR), el usuario puede elegir entre diferentes IR monofónicas (Sala 1, Sala 2, Sala 3, Sala 4, Capilla). Referencia: De requerimientos: R2, R7 Nombre: Ajustar DRY/WET Actor: Usuario Función: Controlar la influencia de la IR sobre el archivo de audio. Descripción: El usuario puede determinar, mediante un control DRY/WET, qué tan “seco” o “mojado” va a estar el audio procesado. Entendiendo por “seco” el archivo de audio sin influencia de la IR, y por “mojado” el archivo completamente influenciado por la IR. Referencia: De requerimientos: R3, R7 Nombre: Ajustar distancia Actor: Usuario Función: Controlar la distancia a la que se desea ubicar el archivo de audio. Descripción: El usuario puede determinar mediante este control la lejanía, o bien, la cercanía del archivo de audio en el espacio. Referencia: De requerimientos: R4, R7 Página 5 de 13 Angélica Londoño Borja - Thomas Viana Alzate 3DX Spatializer Tabla 3: Continuación Descripción de los casos de uso 3DX Spatializer DESCRIPCIÓN DE CASOS DE USO Nombre: Ajustar nivel de entrada Actor: Usuario Función: Controlar el nivel de entrada. Descripción: El usuario puede determinar el nivel de entrada de la señal antes de ser procesada. Referencia: De requerimientos: R5 Nombre: Definir ángulo de elevación. Actor: Usuario Función: Determinar el ángulo de elevación del archivo de audio. Descripción: El usuario puede especificar el ángulo de elevación en un rango de -80º a 80º, dependiendo de la orientación del archivo de audio deseada en el eje de elevación. Entendiendo -80º como el punto más bajo y 80º como el más alto. Referencia: De requerimientos: R6, R7 Nombre: Definir ángulo azimuth. Actor: Usuario Función: Determinar el ángulo azimuth del archivo de audio. Descripción: El usuario puede especificar el ángulo azimuth en un rango de -180º a 180º, dependiendo de la orientación del archivo de audio deseada en el eje cenital. Entendiendo ángulos negativos como la parte izquierda de la cabeza y los ángulos positivos como la derecha. Referencia: De requerimientos: R6, R7 Página 6 de 13 Angélica Londoño Borja - Thomas Viana Alzate 3DX Spatializer Tabla 4: Continuación Descripción de los casos de uso 3DX Spatializer DESCRIPCIÓN DE CASOS DE USO Nombre: Ajustar nivel de salida Actor: Usuario Función: Controlar el nivel de salida. Descripción: El usuario puede determinar el nivel de la señal luego de ser procesada. Referencia: De requerimientos: R5, R7 Nombre: Automatización Actor: Usuario Función: Permitir la automatización de parámetros. Descripción: El usuario tiene la posibilidad de automatizar cada uno de los parámetros variables del plugin directamente desde el DAW. Referencia: De requerimientos: R8, R7 Nombre: Automatización, Seleccionar parámetros. Actor: Usuario Función: Determinar los parámetros a automatizar. Descripción: El usuario debe especificar en el DAW cada uno de los parámetros que desee automatizar. Referencia: De requerimientos: R8, R7 0.2.5. Implementación Con el propósito de satisfacer cada uno de los requerimientos, antes de comenzar a desarrollar el código en el entorno de programación de Cabbage, se define el flujo de señal mediante un diagrama de bloques. La señal de audio entra al plugin y, en primera instancia, se ve afectada por un control de nivel antes de ser procesada; luego, una vez el usuario carga una respuesta al impulso, esta señal de audio es convolucionada con dicha respuesta al impulso. Se establece un control DRY/WET que permite hacer una mezcla entre el archivo de audio sin convolucionar y el resultado de la convolución, para así determinar la influencia que se tiene de la respuesta al impulso sobre el archivo de audio. Luego se realiza la convolución con las HRTFs (Head Related Transfer Functions) determinadas por la coordenada que especifique el usuario mediante los controles de azimuth y elevación. Finalmente la señal de audio es Página 7 de 13 Angélica Londoño Borja - Thomas Viana Alzate 3DX Spatializer afectada por un control de distancia basado en la ley del inverso cuadrado y por un control de nivel de salida, como se observa en la figura 2. Figura 2: Diagrama de bloques del flujo de señal 0.2.6. Validación 0.2.6.1. Pruebas de usuario Se realizó una prueba de aceptación de usuario diseñada siguiendo las recomendaciones del estándar de la National Bureau Standards (NBS) Special Publication 500-136 con el objetivo del desarrollo de validar el cumplimiento de los requerimientos de diseño del software desarrollado. A fin de reconocer la aceptación del software por parte de diferentes usuarios, se realizó una encuesta con preguntas concretas relacionadas a los requerimientos de funcionamiento del plugin. La prueba manual del funcionamiento del software se realizó en actividad con el DAW Reaper. Cada uno de los usuario encuestados, tuvieron la libertad de verificar el debido funcionamiento de cada uno de los controles variables del plugin antes de responder las preguntas que se muestran a continuación. Encuesta para la pueba de aceptación de usuario Antes de comenzar, verifique junto con el encuestador, que el software haya sido cargado correctamente en el DAW. Se realizarán preguntas concretas con respecto al funcionamiento del software, orientadas a la verificación de los requerimientos de diseño propuestos. Página 8 de 13 Angélica Londoño Borja - Thomas Viana Alzate 3DX Spatializer 1. ¿Es el software evaluado, un software tipo plug-in en formato .VST? Sí No ¿Es otro formato?, ¿cuál?. 2. ¿El software le otorga la posibilidad de cargar diferentes respuestas al impulso monofónicas? Sí No ¿Por qué no? 3. ¿El software le permite controlar la influencia de la respuesta al impulso sobre el archivo de audio? Sí No ¿Por qué no? 4. ¿Considera que el software evaluado ofrece la posibilidad de alejar virtualmente el archivo de audio? Sí No ¿Por qué no?. 5. ¿Piensa usted que el software permite orientar el archivo de audio hacia cualquier dirección de un espacio tridimensional? Sí No ¿Por qué no? 6. ¿Considera que el software realiza la espacialización del archivo de audio en tiempo real? Sí No ¿Por qué no? 7. Teniendo en cuenta la anterior evaluación, ¿acepta usted el desarrollo del software, indicando y verificando que cumple con las funciones para el cual está diseñado? Sí No ¿Por qué no? Página 9 de 13 Angélica Londoño Borja - Thomas Viana Alzate 3DX Spatializer Resultados de la prueba de aceptación: Los resultados obtenidos después de la realización de la prueba fueron los siguientes: 100 % de los encuestados estuvieron de acuerdo con que el formato del plugin es .VST. 100 % estuvieron de acuerdo con que otorga la posibilidad de cargar diferentes respuestas al impulso monofónicas. 100 % afirmaron que el plugin permite controlar la influencia de la respuesta al impulso sobre el archivo de audio mediante el control DRY/WET. 90 % de los encuestados acordaron que el software evaluado ofrece la posibilidad de alejar virtualmente el archivo de audio. El otro 10 % argumentan que no solo basta con controlar la atenuación por distancia, sino que se podrían considerar filtros por absorción del aire y cambios en cuanto a las reflexiones del recinto, lo cual computacionalmente implicaría cargar un tren de respuestas al impulso convirtiéndose en un plugin computacionalmente muy pesado y robusto. 90 % estuvieron de acuerdo con que el plugin permite orientar el archivo de audio hacia cualquier dirección de un espacio tridimensional. El otro 10 % estuvieron dudosos en cuanto a algunos ángulos de procedencia entendiendo que el método de espacialización puede presentar inconsistencias dependiendo de la morfología de la persona dado que el banco de HRTFs utilizado corresponde a la respuesta de una cabeza genérica. 100 % de los encuestados consideraron que el software realiza la espacialización del archivo de audio en tiempo real. 100 % aceptaron el desarrollo del software, indicando y verificando que cumple con las funciones para el cual está diseñado. Todos los usuarios encuestados estuvieron satisfechos con la interfaz de usuario. 0.3. E STRUCTURA DEL SOFTWARE Desde que el plugin es cargado sobre el canal de DAW, automáticamente carga una respuesta al impulso por defecto con el fin de que no sea un requisito indispensable para utilizar el módulo de especialización. Permite cargar una HRTF mediante un boton y tiene seis(6) controles variables para modificar cada uno de los parámetros. Página 10 de 13 Angélica Londoño Borja - Thomas Viana Alzate 3DX Spatializer Figura 3: Interfaz gráfica de usuario 0.3.1. Módulos El plugin cuenta con tres módulos implícitos, uno para controlar la reverberación por convolución con la respuesta al impulso, uno para espacializar el archivo de audio, y otro para manejar la estructura de ganancia con controles de nivel de entrada y salida de la señal. 0.3.1.1. LOAD IR: Permite al usuario elegir entre diferentes respuestas al impulso monofónicas. El software viene por defecto con cinco respuestas al impulso, pero el usuario tiene la posibilidad de cargar cualquiera que tenga a su disposición. Página 11 de 13 Angélica Londoño Borja - Thomas Viana Alzate 3DX Spatializer 0.3.1.2. DRY / WET: Permite al usuario determinar cuán influyente será la respuesta al impulso sobre el archivo de audio. 0.3.1.3. DISTANCE: Con un algoritmo basado en la pérdida de nivel por distancia y ley del inverso cuadrado, permite al usuario alejar la fuente virtualmente hasta 30 m. 0.3.1.4. AZIMUTH / ELEVATION: Permiten definir la orientación de procedencia del archivo de audio especificando una coordenada esférica a una resolución de 10º. ELEVATION toma valores entre -80º (abajo) y 80º (arriba) en el eje cenital y AZIMUTH entre -180º (izquierda) y 180º (derecha) en el eje azimutal. Página 12 de 13 Angélica Londoño Borja - Thomas Viana Alzate 3DX Spatializer 0.3.1.5. INPUT / OUTPUT: Permite controlar la el nivel de entrada del audio sin procesar y el nivel de salida de la señal procesada. El usuario tiene la posibilidad de controlar y automatizar todos los parámetros descritos. Página 13 de 13
Source Exif Data:
File Type : PDF File Type Extension : pdf MIME Type : application/pdf PDF Version : 1.5 Linearized : No Page Count : 14 Producer : pdfTeX-1.40.18 Creator : TeX Create Date : 2017:10:31 09:36:12-05:00 Modify Date : 2017:10:31 09:36:12-05:00 Trapped : False PTEX Fullbanner : This is pdfTeX, Version 3.14159265-2.6-1.40.18 (TeX Live 2017) kpathsea version 6.2.3EXIF Metadata provided by EXIF.tools