OR1200 Vector Processor Design and Application in MPEG-4 by 贾磊
学校编码：10384                                    分类号    密级    








硕  士  学  位  论  文 
   
OR1200 向量处理器的设计及在 MPEG-4 中的应用 
OR1200 Vector Processor Design  
and Application in MPEG-4 
 
 
贾   磊 
 
指导教师姓名：谢 廷 贵 副教授 
专  业 名 称：电 路 与 系 统 
论文提交日期：2007 年 4 月 
论文答辩时间：2007 年 5 月 





答辩委员会主席：          
评    阅    人：          
 






















                   声明人（签名）： 
 























1.保密（  ），在    年解密后适用本授权书。 




作者签名：          日期：      年      月      日 














摘  要 














用于 MPEG-4 视频编码的单内核处理器结构的 OR1200 向量扩展处理器。研究了
基于 OR1200 处理器的标量扩展向量媒体处理技术，扩展了向量指令集，实现了
各个组成单元，比较相关多媒体运算算法并设计了适用于 MPEG-4 的可向量处
理的 NEDA DCT 单元。 后完成了 OR1200 向量扩展处理器的 RTL 级 verilog





















With the boosting in information area，multimedia technology has been rapidly 
adopted in our daily life and been an important part of people’s life. At the same time, 
large amount of data and rapid processing speed of mulimedia demand for a new-type 
multimedia embeded processor. The processor must offers low cost，high performance, 
effective capability of multimedia information processing and a strong capability of 
communicating with network and other equipments. Therefore, the research on the 
proceesor for multimedia is very important both on theory and application. 
By comparing each kind of media processor architectures and considering the 
compromise between cost and performance, the single core processor architecture is 
adapted in our design based on opencode processor core. 
Vector technology has been used in many high-end general microprocessor, and 
archieves good performances in many applications, such as multimedia applications. 
Apply vector technology in embeded microprocessor could improve its performance 
in multimedia applications. But the vector procesor can not be found in the main 
stream opencode processors. 
According to the requirements of MPEG-4 applications, each kind of opencode 
processor are compared and presents vector extending processors in this paper for 
MPEG-4 coding , based on OR1200 and using the single core processor architecture. 
Based on OR1200 processor, scalar processor’s extending to vector media processing 
is analyzed and the realization of every part is discussed in this paper. Correlative 
multimedia algorithms are also compared and the DCT unit of NEDA is realized in 
this paper. Finally, the full RTL verilog code of OR1200 vector proceesor has been 
given and verified on modelsim. 
On the whole, OR1200 vector proceesor using the single core processor 
architecture, not only has good multimedia proceesing capacity but also can make 













OR1200 向量处理器的设计及在 MPEG-4 中的应用 
 
MPEG-4 coding application of embeded processor because of its low cost, low power 
and high performance. 
 
















第一章 绪论 ..............................................................................................1 
1.1 论文的研究背景 .................................................................................................1 
1.2 视频压缩编码技术 .............................................................................................2 
1.3 媒体处理器的主要实现方法 .............................................................................3 
1.4 常用的 RISC 处理器核......................................................................................4 
1.5 向量处理技术 .....................................................................................................7 
1.6 本文的工作和结构 .............................................................................................8 
第二章 MPEG-4 标准概述 ....................................................................10 
2.1 MPEG-4 的特点和功能 ....................................................................................10 
2.2 MPEG-4 视频编码的主要内容........................................................................ 11 
2.2.1 系统框架.....................................................................................................11 
2.2.2 MPEG-4 视频流数据逻辑结构 ..................................................................14 
2.2.3 MPEG-4 视频编码步骤 ..............................................................................16 
2.2.4 MPEG-4 基于 VOP 的编码算法分析 .........................................................17 
第三章 RISC 技术和 OpenRISC1200 处理器.....................................20 
3.1 RISC 技术..........................................................................................................20 
3.1.1 RISC 的起源................................................................................................20 
3.1.2 RISC 的特点和本质....................................................................................21 




3.3.4 CPU/DSP 单元 ............................................................................................28 
3.2.5 存储器体系.................................................................................................30 
3.2.6 WISHBONE 互连总线................................................................................30 
3.2.7 软件开发环境(SDK)..................................................................................33 
第四章 OR1200 向量扩展及在 MPEG-4 中的应用............................34 
4.1 OR1200 向量处理技术的实现 .........................................................................35 
4.1.1 向量处理结构.............................................................................................35 
4.1.2 OR1200 向量处理微体系结构的实现 .......................................................37 
4.1.3 OR1200 向量指令的实现 ...........................................................................40 
4.2 MPEG-4 中的 DCT 算法研究 .........................................................................44 
4.2.1 DCT 基本概念与意义.................................................................................44 
4.2.2 DCT 快速算法.............................................................................................47 













OR1200 向量处理器的设计及在 MPEG-4 中的应用 
 2
第五章 仿真与验证 ................................................................................54 
5.1 组件及接口模块独立仿真 ...............................................................................54 




5.3 性能分析 ...........................................................................................................61 
第六章 总结和展望 ................................................................................62 
参考文献 ..................................................................................................64 
致   谢 ....................................................................................................68 
















Chapter 1 Foreword .................................................................................1 
1.1 Background of the Subject ................................................................................1 
1.2 Video Compression Coding Technology ...........................................................2 
1.3 Main Implement Methods of Media Processor................................................3 
1.4 Usual RISC Processor Core...............................................................................4 
1.5 Vetor Processing Technology .............................................................................7 
1.6 Main works of this article ..................................................................................8 
Chapter 2 Summary on MPEG-4 Standard.........................................10 
2.1 Functions and Features of MPEG-4 ...............................................................10 
2.2 Major contents of MPEG-4 Veido Coding .....................................................11 
2.2.1 Systems Framework.....................................................................................12 
2.2.2 Logic Structure of MPEG-4 Vedio Stream ..................................................14 
2.2.3 The Steps of MPEG-4 Vedio Voding ...........................................................16 
2.2.4 The analysis of MPEG-4 Coding algorithm based VOP .............................17 
Chapter 3 RISC Technology and OPENRISC1200 Processor ...........20 
3.1 RISC Technology ..............................................................................................20 
3.1.1 The Origin of RISC Technology..................................................................20 
3.1.2 The Essence and Features of RISC..............................................................21 
3.2 OPENRISC1200 Processor..............................................................................22 
3.2.1 Instrction Set and Addressing Mode ............................................................23 
3.2.2 Memory Addressing Mode and Data format ...............................................25 
3.3.3 Register Defination ......................................................................................26 
3.3.4 CPU/DSP Unit .............................................................................................28 
3.2.5 Storage Hierarchy ........................................................................................30 
3.2.6 WISHBONE Interconnection Bus ...............................................................30 
3.2.7 Software Development Environment...........................................................33 
Chapter 4 OR1200 Vector Processor and Application in MPEG-4 ...34 
4.1 Realization of Vector Processing Technology.................................................35 
4.1.1 Vector Processing architecture.....................................................................35 
4.1.2 The Realization of OR1200 Vector Processor Microarchitecture................37 
4.1.3 The Realization of OR1200 Vector Instruction............................................40 
4.2 Resarch of DCT Algorithms for MPEG-4......................................................44 
4.2.1 Basic Concept and Meaning of DCT ...........................................................44 
4.2.2 Fast Algorithms of DCT...............................................................................47 













OR1200 向量处理器的设计及在 MPEG-4 中的应用 
 2
Chapter 5 Simulation and Verification.................................................54 
5.1 Independent Simulation of Units and interface module ...............................54 
5.2 System Simulation ............................................................................................54 
5.2.1 Building of Simulation Model .....................................................................54 
5.2.2 Signls of System testing...............................................................................55 
5.2.3 Simulation result and analysis .....................................................................56 
5.3 Performance Analysis.......................................................................................61 
Chapter 6 Conclusion and Expectation ................................................62 
References................................................................................................64 
Acknowledgement...................................................................................68 








































































目前 为重要的数字视频压缩编码标准有国际电信联盟 ITU-T 的 H.261、
H.263 和 H.264 等和 ISO 的运动图像组专家的 MPEG-1、MPEG-2、MPEG-4 和
MPEG-7 等。下面对这些标准做简要介绍。 
CCITT（即后来的 ITU）用于覆盖 ISDN 基群信道满足会议电视和可视电话
业务发展的需要，在 1988 年提出了 H.261，1990 年定名为“p×64kbps 视听业务的
视频编码器”，其中 p=1~30。1995 年提出了 H.263 标准，即“甚低码率通信的视
频编码”，目标是在视频压缩率低于 64kbps，在诸如 28.8kbps 等速率的信道上进
行可视电话通信。MPEG-1制订于1992年，主要是针对数字存贮媒体，如CD-ROM
等，但也被用于数字电话网络上的视频传输。MPEG-2 制订于 1994 年，设计目
标是高级工业标准的图像质量以及更高的传输率，是实现 DVD 的标准技术。 






















2003 年 H.264/AVC 由 ITU-T 的视频编码专家组（Video Coding Experts 
Group）和 ISO/IEC 的活动图像专家组（Moving Picture Experts Group）联合推出，
被成为 ITU-T 的 H.264 协议或 ISO/IEC 的 MPEG-4 高级视频编码部分，是 新
的视频编码国际标准，压缩率显著提高，同时也标志着编码标准的融合趋势。 
总之，压缩标准各有优缺点和适用范围，而随着目前网络的普及在基于





















































1.4 常用的 RISC 处理器核 
RISC（Reduced Instruction Set Computer）处理器具有结构简单、处理速度
快和处理功能强等优点，嵌入式领域几乎都是 RISC 指令集的处理器内核。常见
的 RISC 核可以分为商业内核和开源内核两类。ARM 公司的 ARM 处理器，IBM
的 Power PC 处理器，MIPS 公司的的 MIPS 处理器，Motorola 的 Mcore 处理器，

















 LEON2 由 Jiri Gaisle 个人开发，受到欧洲航天局工作的支持，它使用 VHDL
描述，分为标准版和容错版两个版本。其中标准版是一种开源软核，使用 GUN 
LGPL 授权协议，可以免费的应用于研究、教学和商业目的。LENO2 的指令集
与 IEEE1754（SPARC V8）兼容，使用 5 级流水线，具有 8 个全局寄存器、2～
32 个本地寄存器、整数乘/除法器、16×16 的 DSP MAC 单元、浮点处理器和自
定义协处理器接口、Cache、MMU、硬件调试和跟踪缓冲。外部总线使用 ARM
的 AMBA 标准。LEON2 没有针对 FPGA 和 ASIC 工艺进行优化，其硬件开发环
境由具体的实现工艺而定，软件开发使用 GNU 交叉编译开发包。支持 LENO 的
操作系统有 linux 和 RTEMS。 
（2）OpenRISC 1200 
OpenRISC 是由 OpenCores 组织负责开发和维护的，开源的 32/64 位 RISC
处理器内核家族。OpenRISC 的设计强调了高性能、结构简洁、低功耗、可测量
性和多功能性，其设计目标是中高端的网络应用、便携设备、嵌入式系统和车载
应用等。 OpenRISC 包括 OpenRISCl000 和 OpenRISC2000 两个体系，
OpenRISC2000 目前还只处于计划阶段。OpenRISC1200（简称 OR1200）是
OpenRISCl000 体系中的 新成员，用 Verilog 语言描述，2001 年 7 月出现到 2002
年 8 月基本成熟，至今仍在改进和维护。OR1200 采用了自主设计的
OpenRISC1000 体系结构和 ORBIS32 指令集还可以根据需要自定义用户指令。它




OR1200 采用了 Silicore 公司提出的 WISHBONE 开放性总线标准，包括一个数
据 WISHBONE 接口和一个指令 WISHBONE 接口。总线管理模块将内存控制器、
调试单元、UART 接口、PCI 接口和 Ethernet 接口等模块连接在一起。OR1200
的软件开发同样使用 GNU 的交叉编译开发包，支持 OR1200 的操作系统有
uClinux、Linux、RTEMS 和 eC/OS。 OR1200 在 2002 年 9 月被 Flextronics 公司














OR1200 向量处理器的设计及在 MPEG-4 中的应用 
 6
（3）NiosII 
Nios 系列处理器是 Altera 公司推出的基于 RISC 体系结构的通用嵌入式处理
器软核，它是 Altera 的可编程逻辑和可编程片上系统(SoPC)设计综合解决方案的
核心部分。Altera 前后推出了两代 Nios 系列处理器：Nios 和 NiosII。NiosII 是第
二代完全 32 bit 的 RISC 处理器，具有 32bit 的指令集、数据通路和地址空间。
NiosII 处理器也是采用 5 级流水线和数据、指令分离的 Harvard 结构，拥有自己
专用的体系结构与指令集，支持 32 bit 的硬件乘除法指令，有 32 个通用寄存器。
用户还可以根据自己的需要自定义 多 256 条指令。NiosII 采用了 Altera 公司自
己的 Avalon 片内总线标准，用于连接定时器、UART 接口、LCD 接口、内存控
制器和以太网接口等片内模块。NiosII 同时还提供了一个 Debug 模块，支持 JTAG
在线调试。Altera 公司为 NiosII 提供了极为完善的软硬件开发环境。NiosII 处理
器方案是基于 HDL 源码构建的，提供了三种性能和资源消耗不同的基本软核： 
NiosII/f(快速型)，NiosII/s(标准型)和 NiosII/e (经济型)。通过 QuartusII 开发软件
中的 SOPCBuilder 系统开发工具，使用者可以在任何一种软核的基础上方便的配
置符合自己的需要 NiosII 内核。Altera 公司同时为 NiosII 提供了基于 GNU c/c+ + 
toolchain 和 Eclipse IDE 的软件开发环境。用户可以在这个开发环境下方便的完
成编码、仿真和调试等工作。NiosII 的开发套件内免费提供了一个 vc/OS-II 的实
时操作系统支持，同时 NiosII 还支持 uClinux，Nucleus Plus，KROS 等第三方操
作系统。和上面所提到的 LEON2 和 OpenR1SCl200 两种完全开放的处理器内核
不同，NiosII 内核属于“半开放”的内核。用户可以免费获得 NiosII 的开发平台，
不过 NiosII 只支持 Altera 的 Stratix 和 Cyclone 器件。用户只能在 Altera 的 FPGA
芯片上免费使用 NiosII，而且无法获得 NiosII 的 HDL 源代码。另外设计者若要




















Degree papers are in the “Xiamen University Electronic Theses and Dissertations Database”. Full
texts are available in the following ways: 
1. If your library is a CALIS member libraries, please log on http://etd.calis.edu.cn/ and submit
requests online, or consult the interlibrary loan department in your library. 
2. For users of non-CALIS member libraries, please mail to etd@xmu.edu.cn for delivery details.
厦
门
大
学
博
硕
士
论
文
摘
要
库
