Media Móvil Autorregresiva Con Variables Exógenas


Autoregresivo con Variables Exógenas y Red Neural Modelos de Previsión de Carga a Corto Plazo para Redes de Distribución Residencial de Bajo Voltaje Cuando solicite una corrección, mencione por favor este ítem de los elementos: RePEc: gam: jeners: v: 7: y: 2014: i: 5: p: 2938 - 2960: d: 35652. Consulte la información general sobre cómo corregir el material en RePEc. Para preguntas técnicas sobre este tema, o para corregir sus autores, título, resumen, información bibliográfica o de descarga, comuníquese con: (Equipo de Conversión XML) Si ha creado este artículo y aún no está registrado en RePEc, le recomendamos que lo haga aquí . Esto permite vincular tu perfil a este elemento. También le permite aceptar citas potenciales a este tema de las que no estamos seguros. Si faltan referencias, puede agregarlas usando este formulario. Si las referencias completas enumeran un elemento que está presente en RePEc, pero el sistema no enlazó con él, puede ayudar con este formulario. Si sabe de los elementos que faltan citando éste, puede ayudarnos a crear esos vínculos añadiendo las referencias relevantes de la misma manera que se ha indicado anteriormente, para cada elemento referente. Si usted es un autor registrado de este artículo, también puede revisar la pestaña de citas en su perfil, ya que puede haber algunas citas esperando confirmación. Tenga en cuenta que las correcciones pueden tardar un par de semanas en filtrarse a través de los distintos servicios de RePEc. Más servicios MyIDEAS Seguir series, revistas, autores amp más Nuevos artículos por correo electrónico Suscribirse a nuevas adiciones a RePEc Registro de autor Perfiles públicos para investigadores de economía Rankings Varios rankings de investigación en economía y campos relacionados Genealogía ¿Quién fue un estudiante de quién, con RePEc RePEc Biblio Artículos curados artículos de amp y varios temas de economía MPRA Sube tu artículo para ser incluido en RePEc e IDEAS EconAcademics Agregador de blogs para la investigación de la economía Plagio Casos de plagio en la economía Documentos de mercado de trabajo RePEc serie de trabajo de trabajo dedicada al mercado de trabajo Fantasy League Pretendas estar al timón De un departamento de economía Los servicios de los datos de StL Fed, la investigación, las aplicaciones más de los procesos de error de media móvil FedAutoregressive de St. Louis (errores ARMA) y otros modelos que implican retrasos de términos de error pueden estimarse usando declaraciones FIT y simuladas o Utilizando las sentencias SOLVE. Los modelos ARMA para el proceso de error se usan con frecuencia para modelos con residuos autocorrelados. La macro AR se puede utilizar para especificar modelos con procesos de error autorregresivo. La macro MA se puede utilizar para especificar modelos con procesos de error de media móvil. Errores auto-regresivos Un modelo con errores autorregresivos de primer orden, AR (1), tiene la forma mientras que un proceso de error AR (2) tiene la forma y así sucesivamente para procesos de orden superior. Obsérvese que los s son independientes e idénticamente distribuidos y tienen un valor esperado de 0. Un ejemplo de un modelo con un componente AR (2) es y así sucesivamente para los procesos de orden superior. Por ejemplo, puede escribir un modelo de regresión lineal simple con MA (2) errores de media móvil, donde MA1 y MA2 son los parámetros de media móvil. Tenga en cuenta que RESID. Y se define automáticamente por PROC MODEL como La función ZLAG debe utilizarse para que los modelos MA trunquen la recursión de los retrasos. Esto asegura que los errores rezagados empiezan a cero en la fase de cebado y no propagan los valores faltantes cuando faltan las variables del período de cebado y aseguran que los errores futuros son cero en lugar de faltar durante la simulación o la predicción. Para obtener más información sobre las funciones de retraso, consulte la sección Lag Logic. El modelo general ARMA (p, q) tiene la siguiente forma Un modelo ARMA (p, q) se puede especificar de la siguiente manera: donde AR i y MA j representan Los parámetros autorregresivos y de media móvil para los diferentes desfases. Puede utilizar cualquier nombre que desee para estas variables, y hay muchas formas equivalentes de que la especificación podría ser escrita. Los procesos ARMA vectoriales también se pueden estimar con PROC MODEL. Por ejemplo, un proceso AR (1) de dos variables para los errores de las dos variables endógenas Y1 e Y2 puede especificarse como sigue: Problemas de Convergencia con Modelos ARMA Los modelos ARMA pueden ser difíciles de estimar. Si las estimaciones de parámetros no están dentro del intervalo apropiado, los términos residuales de modelos de media móvil crecen exponencialmente. Los residuos calculados para observaciones posteriores pueden ser muy grandes o pueden desbordarse. Esto puede ocurrir ya sea porque se utilizaron valores iniciales incorrectos o porque las iteraciones se alejaron de valores razonables. Se debe tener cuidado al elegir los valores iniciales para los parámetros ARMA. Los valores iniciales de 0,001 para los parámetros ARMA normalmente funcionan si el modelo se ajusta bien a los datos y el problema está bien condicionado. Tenga en cuenta que un modelo de MA a menudo puede ser aproximado por un modelo de AR de alto orden, y viceversa. Esto puede dar lugar a una alta colinealidad en los modelos ARMA mixtos, lo que a su vez puede causar un grave mal acondicionamiento en los cálculos y la inestabilidad de los parámetros estimados. Si tiene problemas de convergencia mientras estima un modelo con procesos de error ARMA, intente estimarlos en pasos. En primer lugar, utilice una sentencia FIT para estimar sólo los parámetros estructurales con los parámetros ARMA mantenidos a cero (o a estimaciones previas razonables si están disponibles). A continuación, utilice otra instrucción FIT para estimar sólo los parámetros ARMA, utilizando los valores de los parámetros estructurales de la primera ejecución. Dado que los valores de los parámetros estructurales es probable que estén cerca de sus estimaciones finales, las estimaciones de los parámetros de ARMA podrían ahora converger. Finalmente, use otra instrucción FIT para producir estimaciones simultáneas de todos los parámetros. Dado que los valores iniciales de los parámetros ahora es probable que estén muy cerca de sus estimaciones conjuntas finales, las estimaciones deben converger rápidamente si el modelo es apropiado para los datos. AR Condiciones iniciales Los retornos iniciales de los términos de error de los modelos AR (p) pueden modelarse de diferentes maneras. Los métodos de arranque de errores autorregresivos soportados por los procedimientos SAS / ETS son los siguientes: mínimos cuadrados condicionales (procedimientos ARIMA y MODELO) mínimos cuadrados incondicionales (procedimientos AUTOREG, ARIMA y MODELO) Yule-Walker (Procedimiento AUTOREG solamente) Hildreth-Lu, que elimina las primeras p observaciones (procedimiento MODEL solamente) Consulte el Capítulo 8, Procedimiento AUTOREG, para una explicación y discusión de los méritos de varios métodos de arranque AR (p). Las inicializaciones CLS, ULS, ML y HL pueden realizarse mediante PROC MODEL. Para errores AR (1), estas inicializaciones se pueden producir como se muestra en la Tabla 18.2. Estos métodos son equivalentes en muestras grandes. Tabla 18.2 Inicializaciones realizadas por PROC MODEL: AR (1) ERRORES Los retornos iniciales de los términos de error de los modelos MA (q) también se pueden modelar de diferentes maneras. Los siguientes paradigmas de inicio de error de media móvil son soportados por los procedimientos ARIMA y MODELO: mínimos cuadrados incondicionales mínimos condicionales condicionales El método de mínimos cuadrados condicionales para estimar los términos de error de media móvil no es óptimo porque ignora el problema de inicio. Esto reduce la eficiencia de las estimaciones, aunque siguen siendo imparciales. Los residuos rezagados iniciales, que se extienden antes del inicio de los datos, se supone que son 0, su valor esperado incondicional. Esto introduce una diferencia entre estos residuales y los residuos de mínimos cuadrados generalizados para la covarianza media móvil, que, a diferencia del modelo autorregresivo, persiste a través del conjunto de datos. Por lo general, esta diferencia converge rápidamente a 0, pero para los procesos de media móvil no inversa la convergencia es bastante lenta. Para minimizar este problema, debe tener un montón de datos, y las estimaciones de parámetros del promedio móvil deberían estar dentro del intervalo invertible. Este problema se puede corregir a expensas de escribir un programa más complejo. Las estimaciones de mínimos cuadrados incondicionales para el proceso MA (1) se pueden producir especificando el modelo de la siguiente manera: Los errores de media móvil pueden ser difíciles de estimar. Debe considerar usar una aproximación AR (p) al proceso del promedio móvil. Un proceso de media móvil normalmente puede ser bien aproximado por un proceso autorregresivo si los datos no han sido suavizados o diferenciados. La macro AR La macro AR de SAS genera instrucciones de programación para MODELO PROC para modelos autorregresivos. La macro AR forma parte del software SAS / ETS y no es necesario configurar ninguna opción especial para utilizar la macro. El proceso autorregresivo puede aplicarse a los errores de la ecuación estructural oa las propias series endógenas. La macro AR puede utilizarse para los siguientes tipos de autorregresión: autorreversión vectorial sin restricciones autorregresión vectorial restringida Autoregresión univariable Para modelar el término de error de una ecuación como un proceso autorregresivo, utilice la siguiente sentencia después de la ecuación: Por ejemplo, supongamos que Y es una Función lineal de X1, X2 y un error AR (2). Escribirías este modelo de la siguiente manera: Las llamadas a AR deben venir después de todas las ecuaciones a las que se aplica el proceso. La invocación de macros anterior, AR (y, 2), produce las declaraciones mostradas en la salida LIST de la Figura 18.58. Figura 18.58 Salida de opción LIST para un modelo AR (2) Las variables prefijadas PRED son variables temporales del programa utilizadas para que los retrasos de los residuos sean los residuos correctos y no los redefinidos por esta ecuación. Tenga en cuenta que esto es equivalente a las declaraciones explícitamente escritas en la sección Formulario General para Modelos ARMA. También puede restringir los parámetros autorregresivos a cero en los retornos seleccionados. Por ejemplo, si desea parámetros autorregresivos en los retornos 1, 12 y 13, puede utilizar las siguientes sentencias: Estas instrucciones generan la salida que se muestra en la Figura 18.59. Figura 18.59 Salida de opción de LIST para un modelo de AR con Lags en 1, 12 y 13 El listado de procedimientos MODEL de la declaración de código de programa compilado como analizado PRED. yab x1 c x2 RESID. y PRED. y - ACTUAL. y ERROR. y PRED. Y - y OLDPRED. y PRED. y yl1 ZLAG1 (y - perdy) yl12 ZLAG12 (y - perdy) yl13 ZLAG13 (y - perdy) RESID. y PRED. y - ACTUAL. y PRED. y - y Hay Variaciones en el método de los mínimos cuadrados condicionales, dependiendo de si las observaciones al comienzo de la serie se utilizan para calentar el proceso AR. Por defecto, el método de mínimos cuadrados condicionales de AR utiliza todas las observaciones y supone ceros para los retardos iniciales de los términos autorregresivos. Utilizando la opción M, puede solicitar que AR utilice el método de mínimos cuadrados incondicionales (ULS) o de máxima verosimilitud (ML). Por ejemplo, las discusiones de estos métodos se proporcionan en la sección AR Condiciones iniciales. Mediante el uso de la opción MCLS n, puede solicitar que las primeras n observaciones se utilicen para calcular las estimaciones de los retrasos autorregresivos iniciales. En este caso, el análisis comienza con la observación n 1. Por ejemplo: Puede utilizar la macro AR para aplicar un modelo autorregresivo a la variable endógena, en lugar del término de error, mediante la opción TYPEV. Por ejemplo, si desea agregar los cinco retrasos anteriores de Y a la ecuación del ejemplo anterior, podría utilizar AR para generar los parámetros y los retrasos mediante las siguientes sentencias: Las sentencias anteriores generan la salida que se muestra en la Figura 18.60. Figura 18.60 Salida de la opción LIST para un modelo AR de Y Este modelo predice Y como una combinación lineal de X1, X2, una intersección y los valores de Y en los cinco períodos más recientes. Autoregresión vectorial sin restricciones Para modelar los términos de error de un conjunto de ecuaciones como un proceso autorregresivo vectorial, utilice la siguiente forma de la macro AR después de las ecuaciones: El valor del nombre del proceso es cualquier nombre que suministre para que AR utilice para crear nombres para el autorregresivo Parámetros. Puede utilizar la macro AR para modelar varios procesos AR diferentes para diferentes conjuntos de ecuaciones utilizando diferentes nombres de proceso para cada conjunto. El nombre del proceso garantiza que los nombres de variable utilizados sean únicos. Utilice un valor de nombre de proceso corto para el proceso si las estimaciones de parámetros se escriben en un conjunto de datos de salida. La macro AR intenta construir nombres de parámetro menores o iguales a ocho caracteres, pero esto está limitado por la longitud de nombreproceso. Que se utiliza como prefijo para los nombres de parámetro AR. El valor de variablelist es la lista de variables endógenas para las ecuaciones. Por ejemplo, supongamos que los errores de las ecuaciones Y1, Y2 e Y3 son generados por un proceso autorregresivo vectorial de segundo orden. Puede utilizar las siguientes sentencias: que generan lo siguiente para Y1 y código similar para Y2 e Y3: Sólo el método de mínimos cuadrados condicionales (MCLS o MCLS n) se puede utilizar para procesos vectoriales. También puede usar el mismo formulario con restricciones de que la matriz de coeficientes sea 0 en retrasos seleccionados. Por ejemplo, las siguientes afirmaciones aplican un proceso vectorial de tercer orden a los errores de ecuación con todos los coeficientes con retraso 2 restringido a 0 y con los coeficientes en los retornos 1 y 3 sin restricciones: Puede modelar las tres series Y1Y3 como un proceso vectorial autorregresivo En las variables en lugar de en los errores mediante la opción TYPEV. Si desea modelar Y1Y3 como una función de valores pasados ​​de Y1Y3 y algunas variables o constantes exógenas, puede usar AR para generar las sentencias para los términos de retraso. Escriba una ecuación para cada variable para la parte no autorregresiva del modelo, y luego llame a AR con la opción TYPEV. Por ejemplo, la parte no autorregresiva del modelo puede ser una función de variables exógenas, o puede ser parámetros de intercepción. Si no hay componentes exógenos en el modelo de autorregresión vectorial, incluyendo no intercepciones, entonces asigne cero a cada una de las variables. Debe haber una asignación a cada una de las variables antes de que AR se llame. Este ejemplo modela el vector Y (Y1 Y2 Y3) como una función lineal solamente de su valor en los dos períodos anteriores y un vector de error de ruido blanco. El modelo tiene 18 (3 3 3 3) parámetros. Sintaxis de la macro AR Hay dos casos de la sintaxis de la macro AR. Cuando no se necesitan restricciones en un proceso AR vectorial, la sintaxis de la macro AR tiene la forma general especifica un prefijo para que AR utilice en la construcción de nombres de variables necesarios para definir el proceso AR. Si el endolist no se especifica, la lista endógena tiene por defecto el nombre. Que debe ser el nombre de la ecuación a la que se va a aplicar el proceso de error AR. El valor de nombre no puede superar los 32 caracteres. Es el orden del proceso AR. Especifica la lista de ecuaciones a las que se va a aplicar el proceso AR. Si se da más de un nombre, se crea un proceso vectorial sin restricciones con los residuos estructurales de todas las ecuaciones incluidas como regresores en cada una de las ecuaciones. Si no se especifica, endolist toma el nombre por defecto. Especifica la lista de rezagos en los que se van a agregar los términos AR. Los coeficientes de los términos a intervalos no listados se ponen a 0. Todos los desfases enumerados deben ser menores o iguales a nlag. Y no debe haber duplicados. Si no se especifica, el laglist se ajusta por defecto a todos los retornos 1 a nlag. Especifica el método de estimación a implementar. Los valores válidos de M son CLS (estimaciones de mínimos cuadrados condicionales), ULS (estimaciones de mínimos cuadrados incondicionales) y ML (estimaciones de máxima verosimilitud). MCLS es el valor predeterminado. Sólo se permite MCLS cuando se especifica más de una ecuación. Los métodos ULS y ML no son compatibles con modelos AR vectoriales por AR. Especifica que el proceso AR debe aplicarse a las variables endógenas en lugar de a los residuos estructurales de las ecuaciones. Autoregresión vectorial restringida Puede controlar qué parámetros se incluyen en el proceso, restringiendo a 0 aquellos parámetros que no incluye. Primero, use AR con la opción DEFER para declarar la lista de variables y definir la dimensión del proceso. A continuación, utilice llamadas AR adicionales para generar términos para las ecuaciones seleccionadas con variables seleccionadas en retrasos seleccionados. Por ejemplo, las ecuaciones de error producidas son las siguientes: Este modelo establece que los errores para Y1 dependen de los errores de Y1 y Y2 (pero no de Y3) en ambos rezagos 1 y 2 y que los errores para Y2 y Y3 dependen de Los errores anteriores para las tres variables, pero sólo con retraso 1. AR Macro Sintaxis para AR Restringido AR Un uso alternativo de AR se permite imponer restricciones en un proceso AR vector llamando a AR varias veces para especificar diferentes términos de AR y rezagos para diferentes Ecuaciones. La primera llamada tiene la forma general especifica un prefijo para que AR utilice en la construcción de nombres de variables necesarias para definir el proceso vector AR. Especifica el orden del proceso AR. Especifica la lista de ecuaciones a las que se va a aplicar el proceso AR. Especifica que AR no es para generar el proceso AR, sino que es esperar la información adicional especificada en las llamadas AR posteriores para el mismo valor de nombre. Las llamadas siguientes tienen la forma general es la misma que en la primera llamada. Especifica la lista de ecuaciones a las que deben aplicarse las especificaciones de esta llamada AR. Sólo los nombres especificados en el valor endolist de la primera llamada para el valor de nombre pueden aparecer en la lista de ecuaciones en eqlist. Especifica la lista de ecuaciones cuyos residuos estructurales rezagados se incluyen como regresores en las ecuaciones de eqlist. Solamente los nombres en el endolist de la primera llamada para el valor del nombre pueden aparecer en varlist. Si no se especifica, varlist por defecto es endolist. Especifica la lista de rezagos en los que se van a agregar los términos AR. Los coeficientes de los términos en retrasos no enumerados se establecen en 0. Todos los retornos enumerados deben ser inferiores o iguales al valor de nlag. Y no debe haber duplicados. Si no se especifica, laglist se ajusta por defecto a todos los retornos 1 a nlag. La macro MA La macro MA SAS genera instrucciones de programación para MODELO PROC para modelos de media móvil. La macro MA forma parte del software SAS / ETS y no se necesitan opciones especiales para utilizar la macro. El proceso de error de media móvil puede aplicarse a los errores de la ecuación estructural. La sintaxis de la macro MA es la misma que la macro AR excepto que no hay ningún argumento TYPE. Cuando está utilizando las macros MA y AR combinadas, la macro MA debe seguir la macro AR. Las siguientes instrucciones SAS / IML producen un proceso de error ARMA (1, (1 3)) y lo guardan en el conjunto de datos MADAT2. Las siguientes instrucciones PROC MODEL se usan para estimar los parámetros de este modelo usando la estructura de error de máxima verosimilitud: Las estimaciones de los parámetros producidos por esta ejecución se muestran en la Figura 18.61. Figura 18.61 Estimaciones de un proceso ARMA (1, (1 3)) Hay dos casos de la sintaxis para la macro MA. Cuando no se necesitan restricciones en un proceso MA vectorial, la sintaxis de la macro MA tiene la forma general especifica un prefijo para que MA utilice en la construcción de nombres de variables necesarias para definir el proceso MA y es el endolist predeterminado. Es el orden del proceso MA. Especifica las ecuaciones a las que se aplica el proceso de MA. Si se da más de un nombre, la estimación CLS se utiliza para el proceso vectorial. Especifica los rezagos en los que se van a agregar los términos MA. Todos los desfases enumerados deben ser inferiores o iguales a nlag. Y no debe haber duplicados. Si no se especifica, el laglist se ajusta por defecto a todos los retornos 1 a nlag. Especifica el método de estimación a implementar. Los valores válidos de M son CLS (estimaciones de mínimos cuadrados condicionales), ULS (estimaciones de mínimos cuadrados incondicionales) y ML (estimaciones de máxima verosimilitud). MCLS es el valor predeterminado. Sólo se permite MCLS cuando se especifica más de una ecuación en el endolist. MA Sintaxis de macros para movimientos restringidos de medios móviles Un uso alternativo de MA permite imponer restricciones a un proceso de MA vectorial llamando a MA varias veces para especificar diferentes términos de MA y rezagos para diferentes ecuaciones. La primera llamada tiene la forma general especifica un prefijo para que MA utilice en la construcción de nombres de variables necesarias para definir el proceso MA vector. Especifica el orden del proceso MA. Especifica la lista de ecuaciones a las que se aplicará el proceso de MA. Especifica que MA no es para generar el proceso MA sino que es esperar a que la información adicional especificada en las llamadas MA más recientes para el mismo valor de nombre. Las llamadas siguientes tienen la forma general es la misma que en la primera llamada. Especifica la lista de ecuaciones a las que se aplicarán las especificaciones de esta llamada MA. Especifica la lista de ecuaciones cuyos residuos estructurales rezagados se incluyen como regresores en las ecuaciones de eqlist. Especifica la lista de rezagos en los que se van a agregar los términos de la AM. La demanda de servicios de atención médica se ha vuelto insostenible 1. 2. Esto se debe en gran medida al aumento de la población y la esperanza de vida, la escalada de los costos, el aumento de las expectativas de los pacientes, y los problemas de fuerza de trabajo 3. A pesar de la creciente demanda, el número de camas de hospitalización en los hospitales se ha reducido en 2 desde la última década 2. 4. La gestión eficaz de la cama es clave para satisfacer esta creciente demanda y reducir los costos de atención médica. La tasa de descarga diaria puede ser un indicador potencial en tiempo real de la eficiencia operativa 5. Desde una perspectiva de nivel de barrio, una buena estimación de los vertidos al día siguiente permitirá al personal del hospital prever problemas potenciales como cambios en el número de camas disponibles y cambios en el número de personal requerido. La previsión eficiente reduce la crisis de la cama y mejora la asignación de recursos. Esta previsión puede ayudar a acelerar la preparación de la descarga, que tiene un costo enorme para el personal clínico y la educación de los pacientes y la familia, que requieren la planificación post-alta 6. 7. Sin embargo, estudiar el flujo de pacientes de las salas generales ofrece varios desafíos. Las descargas a nivel de sala incorporan una dinámica hospitalaria mucho mayor que a menudo no es lineal 8. El acceso a información clínica en tiempo real en salas puede ser difícil debido a las barreras administrativas y de procedimiento, tales datos pueden no estar disponibles para aplicaciones predictivas. Debido a que la codificación de diagnóstico se realiza después del alta, hay poca información sobre la condición médica o variación en la calidad de la atención en tiempo real. Además, factores distintos de la condición del paciente desempeñan un papel en las decisiones de aprobación de la gestión 5. 9. 10. La práctica actual de la asignación de camas en las salas generales de la mayoría de los hospitales involucra a un personal / equipo del hospital que utiliza información y experiencia pasadas para programar y asignar camas 11. Las modernas técnicas de aprendizaje mecánico pueden utilizarse para ayudar a estas decisiones y ayudar a entender el proceso subyacente. A modo de ejemplo, la Figura 1 ilustra un árbol de decisiones capacitado sobre las descargas pasadas y las estadísticas de ocupación de la sala, que modela el patrón de descarga diaria de una sala abierta en un hospital australiano regional. Aunque la ausencia de información médica del paciente afectó el desempeño de los pronósticos, las reglas de decisión proporcionan una visión importante del proceso de alta. Motivados por este resultado, abordamos el problema abierto de pronosticar las descargas diarias de un hospital sin datos clínicos en tiempo real. Específicamente, comparamos el desempeño de predicción de 5 modelos de regresión populares: 1) el promedio móvil autoregresivo clásico (ARIMA), 2) el promedio móvil autorregresivo con variables exógenas (ARMAX), k) el vecino más cercano (kNN) Regresión, (4) regresión aleatoria del bosque (RF), y (v) regresión del vector de soporte (SVR). Nuestros experimentos se llevaron a cabo en los datos disponibles de una sala de recuperación (ala heath 5) en Barwon Health, un hospital regional en Victoria, Australia. Los modelos ARIMA y kNN se construyen a partir de descargas diarias de la sala. Para tener en cuenta el carácter estacional de los vertidos, el modelo ARMAX incluía estadísticas sobre el día de la semana y sobre la ocupación de las salas. Se identificaron y construyeron 20 nivel de barrio y 88 nivel de pacientes predictores para derivar la RF y SVR modelos. La precisión de la predicción se midió usando 3 métricas en un conjunto de 2511 visitas de pacientes en el año 2014. Cuando se compara con un método de pronóstico ingenuo de usar la media de las descargas de la semana pasada, demostramos a través de nuestros experimentos que (1) (2) los modelos SVR y RF superan los métodos autorregresivos y kNN, (3) un modelo de RF derivado de 108 características tiene el error mínimo para los pronósticos del día siguiente. La importancia de nuestro estudio es identificar la importancia de prever camas disponibles en las salas, lo que podría ayudar a aliviar el bloque de acceso de emergencia 12. La duración de la estancia del paciente contribuye directamente a los costos hospitalarios ya la asignación de recursos. Los pronósticos a largo plazo en el cuidado de la salud tienen como objetivo modelar las necesidades de cama y de personal durante un período de meses a años. Cote y Tucker clasifican los métodos comunes en la previsión de la demanda de atención médica como ajuste por ciento, promedio móvil de 12 meses, línea de tendencia y pronóstico estacional 13. Aunque cada uno de estos métodos se construye a partir de la demanda histórica, la predicción estacional proporciona resultados más realistas, ya que tiene en cuenta las variaciones estacionales y las tendencias de los datos. Mackay y Lee 3 aconsejan modelar el flujo de pacientes en las instituciones de salud para la predicción táctica y estratégica. Con este fin, el modelado compartimental 14. 15, los modelos de colas 16. 17 y modelos de simulación 17 - 20 se han aplicado para analizar el flujo de pacientes. Para entender el flujo de pacientes a largo plazo, los estudios analizan métricas como la ocupación de la cama 3. 8. 14. 19. 21. 22, las llegadas de los pacientes 23 y la duración individual de la estadía 19. 24 - 27. Por otro lado, nuestro trabajo implementa pronósticos a corto plazo. Los métodos de predicción a corto plazo se refieren a las previsiones horarias y diarias de una sola unidad en un entorno de atención. La unidad de interés más popular es el departamento de atención de emergencia o aguda, ya que a menudo es una medida clave del indicador de desempeño en la evaluación de la calidad de la atención 28. 29. Modelo de árbol de decisión de las descargas totales de una sala abierta de día de la semana y ocupación de la sala (ocupación del día anterior) datos durante 5 años. Las hojas representan el número total de descargas del paciente. Series de tiempo y métodos de suavizado Al mirar las descargas como series de tiempo, los modelos de media móvil autorregresiva son los más populares 30 - 32. También se han utilizado técnicas de suavizado exponencial para pronosticar el flujo mensual 33 y el flujo diario de pacientes 34. Jones et al utilizaron el clásico ARIMA para pronosticar la ocupación diaria de camas en el servicio de urgencias de un hospital europeo 30. El modelo que incluyó términos de estacionalidad demostró un desempeño razonable para predecir la ocupación de la cama. Los autores especularon si las técnicas de predicción no lineal podrían mejorar con ARIMA. Un estudio reciente confirmó la efectividad de esta técnica de pronóstico en un hospital de EE. UU. 35 Los modelos ARIMA también se utilizaron con éxito para pronosticar el número de camas ocupadas durante un brote de SRAS en un hospital de Singapur 36. Un estudio reciente utilizó la asistencia de pacientes en un servicio de urgencias pediátricas para modelar la demanda diaria usando ARIMA 37. Jones et al 34 compararon el modo ARIMA con el suavizado exponencial y las redes neuronales artificiales para predecir los volúmenes diarios de pacientes en el servicio de urgencias. El estudio no reveló ningún modelo único para ser superior y concluyó que los patrones estacionales desempeñan un papel importante en la demanda diaria. El modelado usando simulación se usa típicamente para estudiar el comportamiento de sistemas complejos. Un trabajo temprano en investigar los efectos de las admisiones de emergencia en los requisitos de cama diaria en la atención aguda, utilizando modelos de simulación estocástica de eventos discretos [38]. Sinreich y Marmor 39 propusieron una guía para construir una herramienta de simulación basada en los datos de los servicios de urgencias de 5 hospitales israelíes. Su método analizó el flujo de pacientes agrupados en 8 tipos junto con elementos de tiempo. La simulación demostró que los procesos del paciente se caracterizan mejor por el tipo de pacientes que por los hospitales visitados. Yeh y Lin utilizaron un modelo de simulación para caracterizar el flujo de pacientes a través del servicio de urgencias del hospital y reducir los tiempos de espera utilizando un algoritmo genético 40. Un experimento similar se llevó a cabo en un departamento de geriatría utilizando una combinación de simulación de eventos discretos y el modelo de colas para analizar la ocupación de la cama [19]. Regresión para la previsión Los modelos de regresión analizan la relación entre la variable pronosticada y las características de los datos. Regresión lineal que codificó variaciones mensuales se utilizó para pronosticar las admisiones de pacientes en un horizonte de 6 meses y superado modelos cuadráticos y autorregresivos [41]. Otro estudio utilizó la agrupación y el análisis de componentes principales PCA para encontrar predictores significativos de los datos del paciente para modelar la duración de emergencia de la estancia mediante la regresión lineal [42]. Un enfoque no lineal utilizando árboles de regresión se propuso en la previsión de admisiones de pacientes que demostraron un rendimiento superior en un marco de red neuronal [43]. Barnes et al utilizaron 10 predictores para modelar el tiempo de hospitalización en estancia en una unidad de 36 camas usando un modelo de RF 24. La regresión no lineal es más adecuada para modelar la dinámica cambiante del flujo de pacientes. Para caracterizar el flujo de salida de los pacientes de la sala, recurrimos a la regresión usando RF, kNN y SVR. En el área de reconocimiento de patrones, kNNs 44 son el método más eficaz que explora patrones repetidos. El algoritmo kNN se ha aplicado con éxito a las series temporales de predicción a histograma en datos financieros 45. La regresión no paramétrica utilizando kNN se ha demostrado con éxito para el pronóstico de tráfico a corto plazo 46. 47 y la previsión de la carga de la electricidad 48. 49. Sin embargo, la regresión kNN no se ha estudiado para el flujo de pacientes. Otra poderosa y popular técnica de regresión, SVR, utiliza las funciones del kernel para mapear las características en un espacio de mayor dimensión para realizar una regresión lineal. Aunque esta técnica no ha visto mucha aplicación en pronósticos médicos, las máquinas vectoriales de apoyo han sido exitosas en la predicción del mercado financiero, la previsión de la electricidad, la previsión de negocios y la predicción de la confiabilidad. Aparte de los métodos autorregresivos estándar, usamos kNN, RFs y SVR para pronosticar las descargas al día siguiente. Debido a que los patrones de descarga se repiten con el tiempo, la regresión kNN puede aplicarse para buscar un patrón de coincidencia de descargas pasadas. RFs y SVR regresión son poderosas técnicas de modelado que requieren una afinación mínima para manejar efectivamente la no linealidad en los procesos hospitalarios. Recientemente, la predicción RF se utilizó para predecir las descargas totales de pacientes de una unidad de 36 camas en un hospital urbano [24]. Además de 4 predictores demográficos y 2 de predicción temporal, este estudio utilizó 3 predictores clínicos para los pacientes: (1) razón de la visita: identificada por un médico y registrada utilizando la Clasificación Internacional de Enfermedades: versión 9 (ICD-9) códigos de diagnóstico 51, ) Estado de observación: asignado a los pacientes para el propósito de monitoreo, y (3) ubicación de la descarga pendiente. El número total de descargas se estimó a partir del agregado de la duración individual de la estancia del paciente. La ausencia de información clínica en tiempo real en nuestros datos hace que el cálculo de la duración de la estancia del paciente sea imposible. En cambio, recurrimos a modelar las descargas al siguiente día observando los patrones de descarga anteriores y examinando los datos demográficos y las características de flujo en la sala. Nuestro estudio utilizó datos retrospectivos recolectados de una sala de recuperación en Barwon Health, un gran proveedor de salud pública en Victoria, Australia, que atiende a unos 350.000 residentes. La aprobación ética se obtuvo del Comité de Ética del Hospital y la Investigación de Barwon Health (número 12/83) y Deakin University. El número total de camas disponibles dependía del número de personal asignado a la sala. En promedio, el barrio contaba con 36 camas de personal, pero fluctuaba entre 20 y 80 camas con un flujo de pacientes diferente. Los médicos de la sala no tenían responsabilidades de enseñanza. Tablas en la base de datos del hospital usadas en nuestra colección de datos. Un IQR, rango intercuartil. Los datos de nuestro estudio provienen de tres tablas en la base de datos del hospital, como se muestra en la Tabla 1. Datos adicionales en tiempo real que describen la condición del paciente o la progresión de la enfermedad no estaban disponibles porque la codificación de diagnóstico utilizando códigos médicos se realiza después del alta. El flujo del paciente se recogió durante un período de 4 años. Usando los tiempos de admisión y de alta para cada paciente, calculamos las descargas diarias de nuestra sala en estudio. Un total de 12.141 pacientes fueron ingresados ​​en la sala con una descarga mediana de 8 pacientes por día desde el 1 de enero de 2010 hasta el 31 de diciembre de 2014. La Tabla 2 resume las principales características de nuestros datos. Una descomposición en series de tiempo de nuestros datos reveló fuertes variaciones estacionales y alta no linealidad en los patrones de descarga diaria. Hubo una descarga de patrón semanal definida de la sala de pico los viernes y cayó significativamente los fines de semana (ver Figura 2). Esta naturaleza estacional está en sintonía con los estudios anteriores [9, 32]. La agregación de las descargas diarias en una serie mensual reveló patrones mensuales definidos (ver Figura 3). Los datos no muestran tendencia significativa. Además, se encontró que el patrón de descarga diaria era altamente no lineal. Nuestros métodos de predicción deben ser capaces de manejar dicha dinámica de datos. Describimos los siguientes métodos que son aplicables a la predicción bajo dinámica de datos compleja: (1) ARIMA, (2) movimiento autorregresivo, (3) pronóstico usando patrones de descarga de kNN, (4) RF, y (5) SVR. Los métodos autorregresivos modelan la correlación lineal temporal entre puntos de datos cercanos en la serie de tiempo. Los patrones más cercanos levantan este supuesto de linealidad y asumen que los períodos cortos forman patrones repetidos. Finalmente, RF y SVR buscan una relación funcional no lineal entre los resultados futuros y los descriptores en el pasado. Promedio de ingresos y egresos por día de la sala. Serie temporal de descargas mensuales de la sala. Métodos de pronóstico Autoregresivo Promedio móvil integrado Los métodos de predicción de series temporales pueden analizar el patrón de descargas pasadas y formular un modelo de pronóstico a partir de relaciones temporales subyacentes 52. Estos modelos se pueden utilizar para extrapolar las series de tiempo de descarga en el futuro. Los modelos ARIMA son ampliamente utilizados en la previsión de series de tiempo. Su popularidad se puede atribuir a la facilidad de la formulación del modelo y la interpretabilidad [53]. Los modelos ARIMA buscan relaciones lineales en la secuencia de descarga para detectar las tendencias locales y la estacionalidad. Sin embargo, estas relaciones pueden cambiar con el tiempo. Los modelos ARIMA son capaces de capturar estos cambios y actualizarse en consecuencia. Esto se hace combinando modelos autorregresivos (AR) y de media móvil (MA). Los modelos autorregresivos formulan la descarga en el tiempo t y t. Como una combinación lineal de descargas anteriores. Por otra parte, los modelos de promedios móviles se caracterizan como una combinación lineal de errores de pronóstico previos. Para el modelo ARIMA, la serie de tiempos de descarga se hace estacionaria usando diferenciación. Permítanos ser parámetros autorregresivos, ser parámetros de media móvil, y ser los errores de pronóstico. Tal modelo de ARIMA se puede definir como se muestra en la Figura 4. donde es una constante. Variando p y q. Podemos generar diferentes modelos para ajustar los datos. Box Jenkins método 54 proporciona un enfoque bien definido para la identificación del modelo y la estimación de parámetros. En nuestro trabajo, elegimos la función auto. arima () del paquete de pronóstico 55 en R 56 para seleccionar automáticamente el mejor modelo. Modelo ARIMA clásico. Medición móvil auto-regresiva con variables exógenas (ARMAX) Las técnicas de regresión dinámica permiten agregar variables explicativas adicionales, como el día de la semana y el número de pacientes actuales en la sala, a modelos autorregresivos. El ARMAX móvil autorregresivo modifica el modelo ARIMA incluyendo la variable externa dependiente x t en el instante t. Como se muestra en la Figura 5. Modelamos x t utilizando características de la base de datos del hospital. Modelo ARIMA con variable exógena xt. Detección de patrones de descarga usando k-vecinos más cercanos El algoritmo kNN aprovecha la localidad en el espacio de datos. Suponemos que la descarga al día siguiente depende de las descargas que ocurren en días anteriores. Usando los principios de kNN, podemos hacer una regresión para pronosticar la descarga del siguiente día. Sea y d el número de descargas en el día actual: d. Para pronosticar la descarga al día siguiente: y d1. Nos fijamos en las descargas en los últimos días p como: dischvec y d-p. Y d. Utilizando la métrica de distancia euclídea, encontramos k coincidencias más cercanas a dischvec de los datos de entrenamiento. Una estimación de la descarga al día siguiente: d1. Se calcula como una medida de las descargas del siguiente día de los k patrones de coincidencia: (y coincidencia) i i (1: k). La Figura 6 muestra un ejemplo de predicción basada en kNN. Aquí, dischvec en rojo y d-7. Y d da lugar a 3 coincidencias de los datos de entrenamiento. Para la simplicidad, hemos trazado los patrones emparejados junto a dischvec, aunque habían ocurrido en el pasado. El pronóstico del día siguiente d1 se convierte en una medida de (y match) i. Donde (y match) i i (1: 3) es el término (d 1) th de cada uno de los patrones 57 coincidentes. Un método popular de calcular d1 es minimizando la pérdida cuadrática ponderada (Figura 7), donde w i toma valores entre 0 y 1, con k i1 w i 1. Sin embargo, hay dos inconvenientes principales que lo hacen menos deseable para nuestros datos. Primero, la pérdida cuadrática es sensible a los valores atípicos. En segundo lugar, una estimación robusta de i se hace difícil. Nuestros datos contienen ruido significativo, causando grandes variaciones en los pronósticos del próximo día de los k patrones coincidentes. Ilustramos este problema en la Figura 8. Para un día dado, la regresión kNN devuelve 125 patrones coincidentes. Los pronósticos del próximo día de cada patrón k125 mostraron variaciones significativas. En este escenario, recurrimos a estimar t1 minimizando la pérdida robusta (Figura 9). K - ejemplo de pronóstico del vecino más cercano con k3 y P 7. Calcular d1 minimizando la pérdida cuadrática ponderada. Diagrama de dispersión del pronóstico del día siguiente usando k-vecino más cercano para un día determinado. El eje X representa cada patrón de vecinos más próximos. El eje Y representa el pronóstico del día siguiente de ese patrón coincidente. Estimación de t1 minimizando la pérdida robusta. En este enfoque, asumimos la descarga del día siguiente en función del vector descriptor histórico: x. Utilizamos cada día en el pasado como un punto de datos, donde el descargo del día siguiente es el resultado, y el corto período antes de la descarga se utilizan para derivar descriptores. El RF utilizado en este documento es actualmente uno de los métodos más poderosos para modelar la función y f (x) 58. 59. Un RF es un conjunto de árboles de regresión. Un árbol de regresión se aproxima a una función f (x) dividiendo recursivamente el espacio del descriptor. En cada región R p. La función se aproxima como se muestra en la figura 10. donde 124 Rp 124 es el número de puntos de datos que caen en la región Rp. El RF crea una colección diversa de árboles al azar variando los subconjuntos de puntos de datos para entrenar a los árboles y los subconjuntos de descriptores en cada paso de división del espacio. El resultado final de RF es un promedio de todos los árboles del conjunto. Dado que el crecimiento de árboles es un proceso altamente adaptativo, puede descubrir cualquier función no lineal a cualquier grado de aproximación si se le da suficientes datos de entrenamiento. Sin embargo, la flexibilidad hace que el árbol de regresión sea propenso a la superposición, es decir, la incapacidad de generalizar datos no vistos. Esto requiere controlar el crecimiento estableciendo el número de descriptores por paso de partición y el tamaño mínimo de la región R p. La votación conduce a grandes beneficios: reducir las variaciones por árbol. La aleatoriedad ayuda a combatir el sobreensado. No hay ninguna suposición sobre la distribución de los datos o la forma de la función (x). Hay calidad controlable de ajustes. Formulación de bosques al azar de las descargas del día siguiente (y) de los descriptores históricos (x). Regresión vectorial de soporte El vector descriptor histórico x, utilizado en el modelo RF, también puede utilizarse para construir un modelo SVR 60. Dado el conjunto de datos 1. Donde xi R m denota el descriptor de entrada para el pronóstico correspondiente del día siguiente i i R 1. una función de regresión toma la forma: i f (x i). SVR funciona por (1) asignar el espacio de entrada de x i en un espacio de mayor dimensión utilizando una función de correlación no lineal:. (2) realizar una regresión lineal en este espacio de mayor dimensión. En general, podemos expresar la función de regresión como: f (x) (w (x)) b, donde w R m es el peso y b R 1 es el término de polarización. Vapnik 60 propuso la función de pérdida insensible para SVR, que toma la forma mostrada en la ecuación 1 de la figura 11. La función de pérdida L tolera errores que son más pequeños que el umbral:, resultando en un tubo alrededor de los valores de descarga verdadera. Los parámetros del modelo se pueden estimar minimizando la función de coste como se muestra en la ecuación 2 de la figura 11. donde C es una constante que penaliza el error en los datos de entrenamiento. En nuestro trabajo, utilizamos un kernel RBF 61 para mapear nuestros datos de entrada a un espacio de características dimensionales superiores. RBF kernels son una buena opción para la adaptación de nuestro patrón de descarga no lineal debido a su capacidad para mapear los datos de entrenamiento a un espacio de dimensiones infinitas y la aplicación fácil. La solución a la doble formulación de la función de coste de SVR se detalla en 60. 62. El modelo de aprendizaje SVR. Hemos extraído todos los datos de las tablas de base de datos (como en la Tabla 1) para nuestro barrio en el estudio. Patient flow was analyzed for a period of 5 years. We formatted our data as a matrix where each row corresponds to a day and each column represents a feature (descriptor). Two main groups of features were identified: (1) ward level and (2) patient level. Our feature creation process resulted in 20 ward-level and 88 patient-level predictors, as listed in Table 3. The ward-level descriptor: trend of next-day discharge was calculated by fitting a locally weighted polynomial regression 63 from past discharges. An example of this regression fitting is shown in Figure 12 . Features constructed from ward data in hospital database. a a The random forest and support vector regression models used the full set of features. The ARMAX (autoregressive moving average with exogenous variables) model used seasonality and occupancy. All other models were derived from daily discharges. An example of the discharge trend, as derived from a locally weighted polynomial regression model. Our training and testing sets are separated by time. This strategy reflects the common practice of training the model using data in the past and applying it on future data. Training data consisted of 1460 days from January 1, 2010, to December 31, 2013. Testing data consisted of 365 days in the year 2014. The characteristics of the training and validation cohort are shown in Table 4. Most stays were short, around 65 of patients stayed for less than 5 days. Characteristics of training and validation cohorts. The current hospital strategy involves using past experience to foresee available beds. To compare the efficiency of our proposed approaches, we model the following baselines: (1) Naive forecasting using the last day of week discharge: since our data were found to have defined weekly patterns, we model the next day discharge as the number of discharges for the same day during previous week (2) naive forecasting using mean of last week discharges: to better model the variation and noise in weekly discharges, we model the next-day discharge as the mean of discharges during previous 7 days and (3) naive forecasting using mean of last 3-week discharges: to account for the monthly and weekly variations in our data, we use mean of daily discharges over the past 3 weeks to model the next-day discharge. Measuring Forecast Performance We compare the next-day forecasts of our proposed approaches with the baseline methods on the measures of mean forecast error, mean absolute error, symmetric mean absolute percentage error, and root mean square error 64. 65 . If y t is the measured discharge at time t. f t is the forecasted dishcharge at time t. we can define the following: Mean forecast error (MFE): is used to gauge model bias and is calculated as MFE mean( y t - f t ) For an ideal model, MFE 0. If MFE 62 0, the model tends to underforecast. When MFE 60 0, the model tends to overforecast. Mean absolute error (MAE): is the average of unsigned errors: MAE mean124 y t - f t 124. MAE indicates the absolute size of the errors. Root mean square error (RMSE) is a measure of the deviation of forecast errors. It is calculated as: RMSE mean( y t - f t ) 2 Due to squaring and averaging, large errors tend to have more influence over RMSE. In contrast, individual errors are weighted equally in MAE. There has been much debate on the choice of MAE or RMSE as an indicator of model performance 66. 67 . Symmetric mean absolute percentage error (sMAPE): It is scale independent and hence can be used to compare forecast performance between different data series. It overcomes 2 disadvantages of mean absolute percentage error (MAPE) namely, (1) the inability to calculate error when the true discharge is zero and (2) heavier penalties for positive errors than negative errors. sMAPE is a more robust estimate of forecast error and is calculated as: sMAPE mean(200124 y t - f t 124/ y t f t ). However, sMAPE ranges from 200 to 200, giving it an ambiguous interpretation 68 . Results Model Performance In this section, we describe the results of comparing our different forecasting methods. The model parameters for kNN forecast, RF, and SVR models were tuned to minimize forecast errors. For kNN regression, the optimum value of pattern length: d and number of nearest neighbours: k. was obtained by analyzing forecast RMSE for values d (1,100) and k (5,1000). Minimum RMSE of 3.77 was obtained at d 70 and k 125. The SVR parameters C (penalty cost) and (amount of allowed error) were determined by choosing the best value from a grid search, that minimized the model RMSE. Similarly, the optimum number of variables in building each node of the RF was chosen by examining its effect on minimizing the out-of-bag estimate. We compared the naive forecasting methods with our proposed 5 models using MFE, MAE, RMSE, and sMAPE. The results are summarized in Table 5. whereas Figure 13 compares the distribution of actual discharges with different model forecasts. Forecast accuracy of different models. a ARIMA: autoregressive integrated moving average b ARMAX: autoregressive moving average with exogenous variables The naive forecasts are unable to capture all variations in the data and resulted in the maximum error when compared with other models. The variations in seasonality and trend are better captured in ARIMA and ARMAX models. The time series consisting of past 3-month discharges were used to generate the next-day discharge forecast. The ARMAX model also included the day of week and ward occupancy as exogenous variables, which resulted in better forecast performance over ARIMA. Interestingly, kNN was more successful than ARIMA and ARMAX in capturing the variations in discharge, demonstrating about 3 improvement in MAE, when compared with ARMAX. However, the kNN model tends to under forecast (MFE 1.09), possibly because of resorting to median values for forecast. In comparison, RF and SVR forecast models demonstrated better performance. This can be expected because they are derived from all the 108 features. However, RF demonstrated a relative improvement of 3.3 in MAE over SVR model (see Table 5 ). When looking at forecast errors for each day of week, RF model confirmed better performance, as shown in Figure 14 . The process of SVR with RBF kernel maps all data into a higher dimensional space. Hence, the original features responsible for forecast cannot be recovered, and the model acts as a black box. Alternatively, RF algorithm returns an estimate of importance for each variable for regression. Examining the features with high importance could give us a better understanding of the discharge process. Comparison of actual and forecasted discharges from ward for each day in 2014. Forecast error in predicting each day of week in 2014. Feature Importance in the Random Forest model The features in random forecast model were ranked on importance scores. The top 10 significant features are described as follows. The day of week for the forecast proved to be the most important feature. Other features were number of patients in the ward during the day of forecast, the trend of discharges measured using locally weighted polynomial regression, number of discharges in past 14th day, number of discharges in past 21st day, number of patients who had visited only one previous ward, the number of males in the ward, number of patients labelled as: public standard, and current month of forecast. Discussion Principal Findings Improved patient flow and efficient bed management is key to counter escalating service and economic pressures in hospitals. Predicting next-day discharges is crucial but has been seldom studied for general wards. When compared with emergency and acute care wards, predicting next-day discharges from a general ward is more challenging because of the nonavailability of real-time clinical information. The daily discharge pattern is seasonal and irregular. This could be attributed to management of hospital processes such as ward rounds, inpatient tests, and medication. The nonlinear nature of these processes contributes to unpredictable length of stay even in patients with similar diagnosis. Typically, for open wards, a floor manager uses previous experience to foresee the number of available beds. In this paper, we attempt to model total number of next-day discharges using 5 methods. We have compared the forecasting performance using MAE, RMSE, and sMAPE. Our predictors are extracted from commonly available data in the hospital database. Although the kNN method is simple to implement, requiring no special expertise, software packages for other models are available for all common platforms. These models can be implemented by the analytics staff in hospital IT department and can be easily integrated into existing health information systems. In our experiments, forecast based on RF model outperformed all other models. Forecasting error rate is 31.9 (as measured by sMAPE) which is in the same ballpark as the recent work of 24 , though we had no real-time clinical information. An RF model makes minimum assumptions about the underlying data. Hence, it is the most flexible, and at the same time, comes with great overfitting control. Similarly, SVR also demonstrated superior performance, compared with the autoregressive and kNN models. The RBF kernel maps the features into a higher dimensional space during the regression process. Hence, the physical meaning of the features is lost, making it difficult to interpret the model. Finally, RFs and SVR are able to handle more features. This extra information in the form of patient demographics and past admission and discharge statistics contributed to improve the predictive performance when compared with other models. The kNN regression also performed well as it assumes only the locality in the data. But it is not adaptive, and thus less flexible in capturing complex patterns. The kNN regression assumes similar patterns in past discharges extrapolate to similar future discharge, which is not true for daily discharges from ward. ARMAX model outperformed the traditional ARIMA forecasts since it incorporated seasonal information as external regressors. As expected, a naive forecast of using the median of past discharges performed worst. We noticed a weekly pattern ( Figure 2 ) and monthly pattern ( Figure 3 ) in discharges from the ward. Other studies have also confirmed that discharges peak on Friday and drop during weekends 5. 9. 10 . This weekend effect could be attributed to shortages in staffing or reduced availability of services like sophisticated tests and procedures 10. 69 . This suggests discharges are heavily influenced by administrative reasons and staffing. Feature importance score from an RF model helps in identifying the features contributing to the regression process. The day of forecast proved to be one of the most important features in the RF model. Other important features included trend based on nonlinear regression of past weekdays, number of discharges in the past days, ward occupancy in previous day, number of males in the ward, and number of general patients in ward. When looking at for each day of the week, the RF and SVR model consistently outperformed other models. Sundays and Thursdays proved to be the easiest to predict for all models ( Figure 14 ). This can be expected since these days had the least variation in our data. Fridays proved to be the most difficult to forecast. Retraining the RF model by omitting day of the week increased the forecast error by 1.39 (as measured by sMAPE). Patient length of stay is inherently variable, partly due to the complex nonlinear structure of medical care 8 . The number of discharges from a ward is strongly related to the length of stay of the current patients in the ward. Hence, the variability in ward-level discharges is compounded by the variability in individual patient length of stay. In our study, the daily discharge pattern from ward shows great variation for each day of week. Apart from patient level details, we believe that a knowledge of hospital policies is also required to capture such nonlinearity. In our study, we were able to validate that the weekend patterns affect discharges from a general ward. The RF model was able to give a reasonable estimate of number of next-day discharges from the ward. Clinical staff can use this information as an aid to decisions regarding staffing and resource utilization. This foresight can also aid discharge planning such as communication and patient transfer between wards or between hospitals. An estimate of number of free beds can also help reduce emergency department (ED) boarding time and improve patient flow 12. 23 . ED boarding time is the time spent by a patient in emergency care when a bed is not available in the ward. ED boarding time severely reduces the hospital efficiency. High bed occupancy in ward directly contributes to ED overcrowding 70 . In our data, 42.81 of patients were admitted from the emergency care. An estimate of daily forecasts can be helpful in deciding the number of beds in wards to ease patient flow. We acknowledge the following limitations in our study. First, we focused only on a single ward. However, it was a ward with different patient types, and hence the results could be an indication for all general wards. Second, we did not use patient clinical data to model discharges. This was because clinical diagnosis data were available only for 42.81 of patients who came from emergency. In a general ward, clinical coding is not done in real time. However, we believe that incorporating clinical information to model patient length of stay could improve forecasting performance. Third, we did not compare our forecasts with clinicians/managing nurses. Finally, our study is retrospective. However, we have selected prediction period separated from development period. This has eliminated possible leakage and optimism. This study set out to model patient outflow from an open ward with no real-time clinical information. We have demonstrated that using patient-level and ward-level features in modelling forecasts outperforms the traditional autoregressive methods. Our proposed models are built from commonly available data and hence could be easily extended to other wards. By supplementing patient-level clinical information when available, we believe that the forecasting accuracy of our models can be further improved.

Comments