44 research outputs found

    Scalable Speech Coding for IP Networks

    Get PDF
    The emergence of Voice over Internet Protocol (VoIP) has posed new challenges to the development of speech codecs. The key issue of transporting real-time voice packet over IP networks is the lack of guarantee for reasonable speech quality due to packet delay or loss. Most of the widely used narrowband codecs depend on the Code Excited Linear Prediction (CELP) coding technique. The CELP technique utilizes the long-term prediction across the frame boundaries and therefore causes error propagation in the case of packet loss and need to transmit redundant information in order to mitigate the problem. The internet Low Bit-rate Codec (iLBC) employs the frame-independent coding and therefore inherently possesses high robustness to packet loss. However, the original iLBC lacks in some of the key features of speech codecs for IP networks: Rate flexibility, Scalability, and Wideband support. This dissertation presents novel scalable narrowband and wideband speech codecs for IP networks using the frame independent coding scheme based on the iLBC. The rate flexibility is added to the iLBC by employing the discrete cosine transform (DCT) and iii the scalable algebraic vector quantization (AVQ) and by allocating different number of bits to the AVQ. The bit-rate scalability is obtained by adding the enhancement layer to the core layer of the multi-rate iLBC. The enhancement layer encodes the weighted iLBC coding error in the modified DCT (MDCT) domain. The proposed wideband codec employs the bandwidth extension technique to extend the capabilities of existing narrowband codecs to provide wideband coding functionality. The wavelet transform is also used to further enhance the performance of the proposed codec. The performance evaluation results show that the proposed codec provides high robustness to packet loss and achieves equivalent or higher speech quality than state-of-the-art codecs under the clean channel condition

    Robust P2P Live Streaming

    Get PDF
    Projecte fet en col.laboraci贸 amb la Fundaci贸 i2CATThe provisioning of robust real-time communication services (voice, video, etc.) or media contents through the Internet in a distributed manner is an important challenge, which will strongly influence in current and future Internet evolution. Aware of this, we are developing a project named Trilogy leaded by the i2CAT Foundation, which has as main pillar the study, development and evaluation of Peer-to-Peer (P2P) Live streaming architectures for the distribution of high-quality media contents. In this context, this work concretely covers media coding aspects and proposes the use of Multiple Description Coding (MDC) as a flexible solution for providing robust and scalable live streaming over P2P networks. This work describes current state of the art in media coding techniques and P2P streaming architectures, presents the implemented prototype as well as its simulation and validation results

    Robust P2P Live Streaming

    Get PDF
    Projecte fet en col.laboraci贸 amb la Fundaci贸 i2CATThe provisioning of robust real-time communication services (voice, video, etc.) or media contents through the Internet in a distributed manner is an important challenge, which will strongly influence in current and future Internet evolution. Aware of this, we are developing a project named Trilogy leaded by the i2CAT Foundation, which has as main pillar the study, development and evaluation of Peer-to-Peer (P2P) Live streaming architectures for the distribution of high-quality media contents. In this context, this work concretely covers media coding aspects and proposes the use of Multiple Description Coding (MDC) as a flexible solution for providing robust and scalable live streaming over P2P networks. This work describes current state of the art in media coding techniques and P2P streaming architectures, presents the implemented prototype as well as its simulation and validation results

    Resource-Constrained Low-Complexity Video Coding for Wireless Transmission

    Get PDF

    Wavelet based image compression integrating error protection via arithmetic coding with forbidden symbol and map metric sequential decoding with ARQ retransmission

    Get PDF
    The phenomenal growth of digital multimedia applications has forced the communication

    Design and evaluation of echocardiograms codification and transmission for Teleradiology systems

    Get PDF
    Las enfermedades cardiovasculares son la mayor causa de muerte en el mundo. Aunque la mayor铆a de muertes por cardiopat铆as se puede evitar, si las medidas preventivas no son las adecuadas el paciente puede fallecer. Es por esto, que el seguimiento y diagn贸stico de pacientes con cardiopat铆as es muy importante. Numerosos son las pruebas m茅dicas para el diagnostico y seguimiento de enfermedades cardiovasculares, siendo los ecocardiogramas una de las t茅cnicas m谩s ampliamente utilizada. Un ecocardiograma consiste en la adquisici贸n de im谩genes del coraz贸n mediante ultrasonidos. Presenta varias ventajas con respecto otras pruebas de imagen: no es invasiva, no produce radiaci贸n ionizante y es barata. Por otra parte, los sistemas de telemedicina han crecido r谩pidamente ya que ofrecen beneficios de acceso a los servicios m茅dicos, una reducci贸n del coste y una mejora de la calidad de los servicios. La telemedicina proporciona servicios m茅dicos a distancia. Estos servicios son de especial ayuda en casos de emergencia m茅dica y para 谩reas aisladas donde los hospitales y centros de salud est谩n alejados. Los sistemas de tele-cardiolog铆a pueden ser clasificados de acuerdo al tipo de pruebas. En esta Tesis nos hemos centrado en los sistemas de tele-ecocardiografia, ya que los ecocardiogramas son ampliamente usados y presentan el mayor reto al ser la prueba m茅dica con mayor flujo de datos. Los mayores retos en los sistemas de tele-ecocardiografia son la compresi贸n y la transmisi贸n garantizando que el mismo diagn贸stico es posible tanto en el ecocardiograma original como en el reproducido tras la compresi贸n y transmisi贸n. Los ecocardiogramas deben ser comprimidos tanto para su almacenamiento como para su transmisi贸n ya que estos presentan un enorme flujo de datos que desbordar铆a el espacio de almacenamiento y no se podr铆a transmitir eficientemente por las redes actuales. Sin embargo, la compresi贸n produce p茅rdidas que pueden llevar a un diagnostico err贸neo de los ecocardiogramas comprimidos. En el caso de que las pruebas ecocardiograficas quieran ser guardadas, una compresi贸n cl铆nica puede ser aplicada previa al almacenamiento. Esta compresi贸n cl铆nica consiste en guardar las partes del ecocardiograma que son importantes para el diagn贸stico, es decir, ciertas im谩genes y peque帽os v铆deos del coraz贸n en movimiento que contienen de 1 a 3 ciclos cardiacos. Esta compresi贸n cl铆nica no puede ser aplicada en el caso de transmisi贸n en tiempo real, ya que es el cardi贸logo especialista quien debe realizar la compresi贸n cl铆nica y 茅ste se encuentra en recepci贸n, visualizando el echocardiograma transmitido. En cuanto a la transmisi贸n, las redes sin cables presentan un mayor reto que las redes cableadas. Las redes sin cables tienen un ancho de banda limitado, son propensas a errores y son variantes en tiempo lo que puede resultar problem谩tico cuando el ecocardiograma quiere ser transmitido en tiempo real. Adem谩s, las redes sin cables han experimentado un gran desarrollo gracias a que permiten un mejor acceso y movilidad, por lo que pueden ofrecer un mayor servicio que las redes cableadas. Dos tipos de sistemas se pueden distinguir acorde a los retos que presenta cada uno de ellos: los sistemas de almacenamiento y reenvi贸 y los sistemas de tiempo real. Los sistemas de almacenamiento y reenvi贸 consisten en la adquisici贸n, almacenamiento y el posterior envi贸 del ecocardiograma sin requerimientos temporales. Una compresi贸n cl铆nica puede ser llevada a cabo previa al almacenamiento. Adem谩s de la compresi贸n cl铆nica, una compresi贸n con p茅rdidas es recomendada para reducir el espacio de almacenamiento y el tiempo de env铆o, pero sin perder l ainformaci贸n diagn贸stica de la prueba. En cuanto a la transmisi贸n, al no haber requerimientos temporales, la transmisi贸n no presenta ninguna dificultad. Cualquier protocolo de transmisi贸n fiable puede ser usado para no perder calidad en la imagen debido a la transmisi贸n. Por lo tanto, para estos sistemas s贸lo nos hemos centrado en la codificaci贸n de los ecocardiogramas. Los sistemas de tiempo real consisten en la transmisi贸n del ecocardiograma al mismo tiempo que 茅ste es adquirido. Dado que el env铆o de video cl铆nico es una de las aplicaciones con mayor demanda de ancho de banda, la compresi贸n para la transmisi贸n es requerida, pero manteniendo la calidad diagn贸stica de la imagen. La transmisi贸n en canales sin cables puede ser afectada por errores que distorsionan la calidad del ecocardiograma reconstruido en recepci贸n. Por lo tanto, m茅todos de control de errores son requeridos para minimizar los errores de transmisi贸n y el retardo introducido. Sin embargo, aunque el ecocardiograma sea visualizado con errores debido a la transmisi贸n, esto no implica que el diagn贸stico no sea posible. Dados los retos previamente descritos, las siguientes soluciones para la evaluaci贸n cl铆nica, compresi贸n y transmisi贸n han sido propuestas: - Para garantizar que el ecocardiograma es visualizado sin perder informaci贸n diagn贸stica 2 tests han sido dise帽ados. El primer test define recomendaciones para la compresi贸n de los ecocardiogramas. Consiste en dos fases para un ahorro en el tiempo de realizaci贸n, pero sin perder por ello exactitud en el proceso de evaluaci贸n. Gracias a este test el ecocardiograma puede ser comprimido al m谩ximo sin perder calidad diagn贸stica y utilizando as铆 m谩s eficientemente los recursos. El segundo test define recomendaciones para la visualizaci贸n del ecocardiograma. Este test define rangos de tiempo en los que el ecocardiograma puede ser visualizado con inferior calidad a la establecida en el primer test. Gracias a este test se puede saber si el ecocardiograma es visualizado sin p茅rdida de calidad diagn贸stica cuando se introducen errores en la visualizaci贸n, sin la necesidad de realizar una evaluaci贸n para cada video transmitido o diferentes condiciones de canal. Adem谩s, esta metodolog铆a puede ser aplicada para la evaluaci贸n de otras t茅cnicas de diagn贸stico por imagen. - Para la compresi贸n de ecocardiogramas dos m茅todos de compresi贸n han sido dise帽ados, uno para el almacenamiento y otro para la transmisi贸n. Diferentes propuestas son dise帽adas, ya que los ecocardiogramas para los dos prop贸sitos tienen caracter铆sticas diferentes. Para ambos prop贸sitos un m茅todo de compresi贸n en la que las facilidades que incorporan los dispositivos de segmentar la imagen y en la que las caracter铆sticas de visualizaci贸n de los ecocardiogramas han sido tenidas en cuenta ha sido dise帽ado. Para la compresi贸n del ecocardiograma con el prop贸sito de almacenarlo un formato de almacenamiento f谩cilmente integrable con DICOM basado en regiones y en el que el tipo de datos y la importancia cl铆nica de cada regi贸n es tenido en cuenta ha sido dise帽ado. DICOM es el formato para el almacenamiento y transmisi贸n de im谩genes m谩s ampliamente utilizado actualmente. El formato de compresi贸n propuesto supone un ahorra de hasta el 75 % del espacio de almacenamiento con respecto a la compresi贸n con JPEG 2000, actualmente soportado por DICOM, sin perder calidad diagnostica de la imagen. Los ratios de compresi贸n para el formato propuesto dependen de la distribuci贸n de la imagen, pero para una base de datos de 105 ecocardiogramas correspondientes a 4 ec贸grafos los ratios obtenidos est谩n comprendidos entre 19 y 41. Para la compresi贸n del ecocardiograma con el prop贸sito de la transmisi贸n en tiempo real un m茅todo de compresi贸n basado en regiones en el que el tipo de dato y el modo de visualizaci贸n han sido tenidos en cuenta se ha dise帽ado. Dos modos de visualizaci贸n son distinguidos para la compresi贸n de la regi贸n con mayor importancia cl铆nica (ultrasonido), los modos de barrido y los modos 2-D. La evaluaci贸n cl铆nica dise帽ada para las recomendaciones de compresi贸n fue llevada a cabo por 3 cardiologos, 9 ecocardiogramas correspondientes a diferentes pacientes y 3 diferentes ec贸grafos. Los ratios de transmisi贸n recomendados fueron de 200 kbps para los modos 2-D y de 40 kbps para los modos de barrido. Si se comparan estos resultados con previas soluciones en la literatura un ahorro m铆nimo de entre 5 % y el 78 % es obtenido dependiendo del modo. - Para la transmisi贸n en tiempo real de ecocardiogramas un protocolo extremo a extremo basada en el m茅todo de compresi贸n por regiones ha sido dise帽ado. Este protocolo llamado ETP de las siglas en ingl茅s Echocardiogram Transmssion Protocol est谩 dise帽ado para la compresi贸n y transmisi贸n de las regiones por separado, pudiendo as铆 ofrecer diferentes ratios de compresi贸n y protecci贸n de errores para las diferentes regiones de acuerdo a su importancia diagnostica. Por lo tanto, con ETP el ratio de transmisi贸n m铆nimo recomendado para el m茅todo de compresi贸n propuesto puede ser utilizado, usando as铆 eficientemente el ancho de banda y siendo menos sensible a los errores introducidos por la red. ETP puede ser usado en cualquier red, sin embargo, en el caso de que la red introduzca errores se ha dise帽ado un m茅todo de correcci贸n de errores llamado SECM, de las siglas en ingl茅s State Error Control Method. SECM se adapta a las condiciones de canal usando m谩s protecci贸n cuando las condiciones empeoran y usando as铆 el ancho de banda eficientemente. Adem谩s, la evaluaci贸n cl铆nica dise帽ada para las recomendaciones de visualizaci贸n ha sido llevada a cabo con la base de datos de la evaluaci贸n previa. De esta forma se puede saber si el ecocardiograma es visualizado sin p茅rdida diagnostica aunque se produzcan errores de transmisi贸n. En esta tesis, por lo tanto, se ha ofrecido una soluci贸n para la transmisi贸n en tiempo real y el almacenamiento de ecocardiogramas preservando la informaci贸n diagn贸stica y usando eficientemente los recursos (disco de almacenamiento y ratio de transmisi贸n). Especial soporte se da para la transmisi贸n en redes sin cables, dando soluciones a las limitaciones que estas introducen. Adem谩s, las soluciones propuestas han sido probadas y comparadas con otras t茅cnicas con una red de acceso m贸vil WiMAX, demostrando que el ancho de banda es eficientemente utilizado y que el ecocardiograma es correctamente visualizado de acuerdo con las recomendaciones de visualizaci贸n dadas por la evaluaci贸n cl铆nica

    Media gateway utilizando um GPU

    Get PDF
    Mestrado em Engenharia de Computadores e Telem谩tic

    Layer-based coding, smoothing, and scheduling of low-bit-rate video for teleconferencing over tactical ATM networks

    Get PDF
    This work investigates issues related to distribution of low bit rate video within the context of a teleconferencing application deployed over a tactical ATM network. The main objective is to develop mechanisms that support transmission of low bit rate video streams as a series of scalable layers that progressively improve quality. The hierarchical nature of the layered video stream is actively exploited along the transmission path from the sender to the recipients to facilitate transmission. A new layered coder design tailored to video teleconferencing in the tactical environment is proposed. Macroblocks selected due to scene motion are layered via subband decomposition using the fast Haar transform. A generalized layering scheme groups the subbands to form an arbitrary number of layers. As a layering scheme suitable for low motion video is unsuitable for static slides, the coder adapts the layering scheme to the video content. A suboptimal rate control mechanism that reduces the kappa dimensional rate distortion problem resulting from the use of multiple quantizers tailored to each layer to a 1 dimensional problem by creating a single rate distortion curve for the coder in terms of a suboptimal set of kappa dimensional quantizer vectors is investigated. Rate control is thus simplified into a table lookup of a codebook containing the suboptimal quantizer vectors. The rate controller is ideal for real time video and limits fluctuations in the bit stream with no corresponding visible fluctuations in perceptual quality. A traffic smoother prior to network entry is developed to increase queuing and scheduler efficiency. Three levels of smoothing are studied: frame, layer, and cell interarrival. Frame level smoothing occurs via rate control at the application. Interleaving and cell interarrival smoothing are accomplished using a leaky bucket mechanism inserted prior to the adaptation layer or within the adaptation layerhttp://www.archive.org/details/layerbasedcoding00parkLieutenant Commander, United States NavyApproved for public release; distribution is unlimited

    Network streaming and compression for mixed reality tele-immersion

    Get PDF
    Bulterman, D.C.A. [Promotor]Cesar, P.S. [Copromotor
    corecore