遠程通信、計算機和電視/電影工業(yè)之間的傳統(tǒng)界限極為模糊。歷史上原本屬于某一領域的內(nèi)容現(xiàn)已滲透到其他兩個領域中。視頻、聲音和通信已進入計算機;交互性進入了電視;視頻和交互性則進入了遠程通信領域??雌饋硐褚环N聚集,實際上并非如此。這三種行業(yè)是從不同的技術角度來研究音像應用的。
在當今世界,應對三種主要趨勢予以關注:
1、向無線通信發(fā)展的趨勢;
2、向交互式計算機應用發(fā)展的趨勢;
3、視聽數(shù)據(jù)的綜合應用不斷增長的趨勢。
對于傳統(tǒng)意義上區(qū)分的各行業(yè)間的交叉,應綜合考慮這三種趨勢;目前的標準和正在制作的標準沒有充分涉及這些新的需求。而MPEG-4的重點就是解決這些需求,即綜合三種行業(yè)的通用應用,以提供便于交互的音頻-視頻編碼、高壓縮比和通用訪問能力。為了采用迅速發(fā)展的相關技術的優(yōu)點,MPEG-4標準將保證高度的靈活性和擴展性。
基于內(nèi)容的交互性包括人與音像畫面中有意義的對象相互作用的能力。目前,這種交互作用局限于計算機圖形,即人工合成的內(nèi)容。對于新的交互式音像應用,能夠提供與自然的、人工的及自然/人工混合的音像對象的相互作用極為重要。
為了有效使用存儲空間和傳送帶寬,需要有較高的壓縮比。對于低比特率的應用,改善壓縮效率非常重要。
通用訪問能力是指對有用的音像數(shù)據(jù)的訪問可以在存儲和傳送媒體的很大范圍內(nèi)進行的鑒于移動通信的迅速崛起,通過無線網(wǎng)絡進行這種應用的訪問尤為重要。
高度的靈活性和可擴展性由句法描述語言來保證,這種句法描述語言稱為‘MPEG-4句法描述語言’(MSDL)。MSDL將在下面介紹。
目前的視聽標準是為從照相機和麥克風獲取的自然內(nèi)容的編碼重現(xiàn)而設計的。由于上述三個領域的相互滲透,人工內(nèi)容的應用在不斷增長。因此,很顯然的需求是一種既適合于自然對象又適合于人工對象的模式,它能夠用來產(chǎn)生單一的音像序列。