內容提要本書主要介紹了圖象處理和分析的基本原理、典型方法和實用技術。考慮到圖象技術的飛速發(fā)展和廣泛應用,本書在講解基本理論的同時還介紹了許多近年來國際上有關的最新研究成果和應用實例。本書主要包括三大部分。第一部分(包含第1,2,3章)是圖象基礎,論述了圖象工程的定義,圖象技術整體概況和分類以及有關視覺和圖象模型,數(shù)字圖象采集、表達和象素關系,圖象的各種基本變換技術等。第二部分(包含第4,5,6章)論述了圖象處理的各重要分支,如圖象增強,圖象恢復,由投影重建圖象和圖象壓縮編碼等基礎理論、技術和方法。第三部分(包含第7,8章和附錄A)介紹了圖象分析的基本原理和技術,如圖象分割、目標表達和描述、特征測量、形態(tài)學方法等。書中還提供了大量例題與習題。本書可作為信息和信號處理、通信與電子系統(tǒng)、模式識別、生物醫(yī)學工程等學科大學本科和研究生專業(yè)基礎課教材,也可供上述學科及信息工程、電子工程、計算機科學與技術、機器人自動化、遙感和軍事偵察等領域的科技工作者和高等院校的師生參考。片斷:一個基本的圖象(處理和分析)系統(tǒng)構成可由圖1.2.1表示。圖中各模塊都有特定的功能,分別是采集、顯示、存儲、通信、處理和分析。圖中還列出了完成各功能所需的一些設備。圖象采集可采用電荷耦合器件(chargec0upleddevices,CCD)照相機、帶有視象管(vidicon)的視頻攝象機和掃描儀(scanners)等。圖象顯示可用電視顯示器(TVmonitors)、隨機讀取陰極射線管(cath0deraytubes,CRT)和各種打印機(printers)等。圖象存儲可采用磁帶(magnetictape)、磁盤(magneticdisks)、光盤(opticaldisks)和磁光盤(magneto-opticaldisks)等。圖象通信可借助綜合業(yè)務網(ISDN)、計算機局域網(LAN),甚至普通電話網(PSTN)等。最后,圖象處理和分析主要是運算,所使用的設備主要是計算機,當然必要時還可借助專用硬件。1.2.2圖象采集模塊為采集數(shù)字圖象,需要兩種裝置(器件)。一種是對某個電磁能量譜波段(如X射線、紫外線、可見光、紅外線等)敏感的物理器件,它能產生與所接受到的電磁能量成正比的(模擬)電信號。另一種稱為數(shù)字化器,它能將上述(模擬)電信號轉化為數(shù)字(離散)的形式。所有采集數(shù)字圖象的設備都需要這兩種裝置。以常見的X光透視成象儀為例,由X光源發(fā)出的射線穿越物體到達另一端的對X光敏感的媒體。這個媒體能獲得物體材料對X光不同吸收的圖象。它可以是膠片,一個帶有將X光轉化為光子的電視攝影機,或其它能輸出數(shù)字圖象的離散檢測器。用于可見光和紅外線成象的設備主要有顯微密度計(micro-densitometers)、析象管(imagedissector)、視象管和對光子敏感的固態(tài)陣(solid-statearrays)等。使用顯微密度計時,需要數(shù)字化的圖象應是透明底片或照片的形式。視象管和對光子敏感的固態(tài)陣除可接受以上形式的圖象外,還可以將有足夠光強人射檢測器的自然圖象數(shù)字化。在使用顯微密度計時,需要將透明底片或照片放在一個平板上或卷在一個圓鼓上。當光線聚焦在圖象上時,平移平板或轉動圓鼓就可以完成掃描。如果是透明底片,光穿過透明底片;如果是照片,光從表面反射。在這兩種情況下,光束都聚焦在光子檢測器上,各個檢測器根據(jù)光強度記錄下對應當前位置的圖象灰度值。如果灰度值和位置坐標都取整數(shù),就得到一幅數(shù)字圖象。盡管顯微密度計速度比較慢,但由于機械平移過程的連續(xù)本質,它的空間精確度很高。視象管攝影機的工作原理基于光導性質。聚焦在視象管表面的圖象能形成與光學圖象的輝度分布相對應的光導模式。用另一個獨立的電子束掃描光導管的另一面,由于中和作用,這個電子束在一個接受器上產生與輸入光亮度模式對應的壓差信號。如果量化這個信號并記錄下對應的掃描束位置,就可得到一幅數(shù)字圖象。固態(tài)陣是由稱為感光基元(photosites)的離散硅成象元素構成的。這樣的感光基元能產生與所接受的輸入光強成正比的輸出電壓。固態(tài)陣可按幾何組織形式分為兩種:線掃描器和平面掃描器。線掃描傳感器包括一行感光基元,它靠場景和檢測器之間的相對運動來獲得2-D圖象。平面掃描傳感器由排成方陣的感光基元組成,可直接得到2-D圖象。固態(tài)平面?zhèn)鞲衅麝嚨囊粋€顯著特點是它具有非??斓目扉T速度(可達10-4s),所以能將許多運動定格下來。固態(tài)陣中主要元件是電荷耦合器件CCD。圖1.2.2給出一個線掃描CCD傳感器的示意圖。這個傳感器由一行感光基元,兩個定時地將感光基元中的內容傳給傳輸寄存器的傳輸門,以及一個定時地將傳輸寄存器中的內容傳給放大器的輸出門構成。放大器輸出的電壓信號與感光基元行的內容成比例。電荷耦合平面陣的工作原理與線陣相似,但這里感光基元排列成一個矩陣形式(如圖1.2.3所示)。感光基元列由傳輸門和傳輸寄存器隔開。先將奇數(shù)列感光基元的內容順序送進垂直傳輸寄存器,然后再送進水平傳輸寄存器。把水平傳輸寄存器的內容送進放大器就得到1幀隔行的視頻信號。對偶數(shù)列感光基元重復以上過程就可得到另1幀隔行的視頻信號。將2幀合起來就得到隔行掃描電視的1場(f)。NTSC制的掃描速度是30f/s,PAL制的掃描速度是25f/s。現(xiàn)在常用的線掃描CCD一般有512到4096個象素或更多,而4096×4096個象素的平面掃描CCD也已在使用。利用圖象處理和分析的手段,還可以通過圖象的拼接用較小分辨率的CCD獲得較大視場的圖象[章1997b]。電視攝象機一般用CCD陣組成,要得到數(shù)字圖象需把攝象機的視頻輸出送到一個數(shù)字化器中。這常通過在計算機中插專門的硬件卡來實現(xiàn)。本書前言前言圖象是用各種觀測系統(tǒng)以不同形式和手段觀測客觀世界而獲得的,可以直接或間接作用于人眼并進而產生視知覺的實體。科學研究和統(tǒng)計表明,人類從外界獲得的信息約有75%是從圖象中獲得的。隨著計算機的發(fā)展,數(shù)字圖象技術近年來得到極大的重視和長足的進展,出現(xiàn)了許多有關的新理論、新方法、新算法、新手段和新設備,并已在科學研究、工業(yè)生產、醫(yī)療衛(wèi)生、教育、娛樂、管理和通信等方面得到了廣泛的應用,對推動社會發(fā)展改善人們生活水平都起到了重要的作用。為了對各種圖象技術進行綜合研究、集成應用,我們有必要建立一個整體框架——圖象工程。圖象工程是一門系統(tǒng)地研究各種圖象理論、技術和應用的新的交叉學科。它的研究方法與數(shù)學、物理學、生理學、心理學、電子學、計算機科學等學科相互借鑒,它的研究范圍與模式識別、計算機視覺、計算機圖形學等專業(yè)互相交叉,它的研究進展與人工智能、神經網絡、遺傳算法、模糊邏輯等理論和技術密切相關,它的發(fā)展應用與生物醫(yī)學、遙感、通信、文檔處理等許多領域緊密結合。圖象工程是一門綜合學科??紤]到其內容多、跨度大、覆蓋面廣以及教學的特點,本書分為相對獨立又互相聯(lián)系的上下兩冊:《圖象工程(上冊)——圖象處理和分析》和《圖象工程(下冊)——圖象理解與計算機視覺》。本書在編寫的方針上,力求具有理論性、實用性、系統(tǒng)性、實時性??紤]到圖象技術的飛速發(fā)展,本書在內容上,既認真選取了有代表性的經典內容,又注意選取了90年代國際上的最新研究成果。本書既參考了許多有關文獻,也結合了作者的一些研究工作和成果以及教案。本書主要介紹圖象工程的基本內容,但又有一定的深度和廣度,希望讀者能通過本書的學習獨立地和全面地了解該領域的基本理論、技術、應用和發(fā)展。本書在內容敘述上,力求理論概念嚴謹,論證簡明扼要??紤]到圖象技術的應用特點,書中列舉了大量實例使原理和概念具體化,引導讀者把這些概念和原理應用于實際??紤]到專業(yè)課教學的特點,本書從方便讀者學習的角度出發(fā)做了兩項工作:第一,在主要內容的編排上充分注意了理論的系統(tǒng)性和內容的結構化。全書將不同的圖象技術分支均納入圖象工程大框架進行介紹,而且正文都統(tǒng)一按照技術分章節(jié),互相關系清晰明確。除每冊書將第1章作為該書總綱外,之后每章(包括附錄)又將其第1節(jié)作為該章總綱,并以結構圖表示所屬內容及分類。希望這些能使讀者在學習中既有一個總體概念又可時刻把握當前學習內容在整體結構中的位置。第二,增加了兩方面的內容。其一是為方便讀者進一步查閱(尤其是聯(lián)網查閱)英文原文資料增加了英文目錄,這也相當于提供了英文關鍵詞。其二是本書不僅列舉了書中直接引用的具體文獻,還增加了一些重要專著、期刊和國際會議的名稱。這不僅對閱讀本書有益,為進一步深入學習提供了線索,而且對將來從事科研工作也會有幫助。本冊書為上冊,主要介紹了圖象處理和分析的基本概念、基本原理、典型方法、實用技術以及國際上有關研究的新成果。讀者能借此建立一個比較完整的圖象處理和分析理論體系并了解和掌握常用的圖象處理和分析技術。這樣一方面可幫助讀者進一步學習和研究圖象工程高層技術,另一方面使讀者能據(jù)此解決實際圖象應用中的具體問題。本冊書主要包括三大部分。第一部分(包含第1,2,3章)是圖象和圖象工程基礎,論述了圖象技術整體概況和分類以及有關視覺和圖象模型,數(shù)字圖象采集、表達和象素關系,對圖象的各種基本變換技術等。第二部分(包含第4,5,6章)論述了圖象處理的各重要分支,如圖象增強,圖象恢復,由投影重建圖象和圖象壓縮編碼等基礎理論,技術和方法。第三部分(包含第7,8章和附錄A)介紹了圖象分析的基本原理和技術,如圖象分割、目標表達描述、特征測量、形態(tài)學方法等。本冊書共有8章正文和2個附錄,在10個一級標題下有62個二級標題(節(jié)),再之下還有121個三級標題(小節(jié)),從內容上大體覆蓋了圖象處理的各個重要分支和圖象分析的基本技術。全冊書共有文字(也包括圖象、繪圖、表格、公式等)約46萬字。本冊書共有編了號的圖244個、表格34個、公式645個。為便于教學,本冊書共給出各類例題97個。為便于檢查教學效果,各章后均有練習題,本冊書共有練習題143個。另外書末列出了提供參考和直接引用的100多篇文獻的目錄。本冊書的編寫始于1996年,1997年開始作為課程教材陸續(xù)在多個學校不同年級試用。這次在此基礎上,主要結合教學實踐和反饋意見進行了修改,增加了許多例題、229幅圖片,并在每章后都加入了練習題。徐寅、李勍、黃英、楊勁波、羅沄、吳瑋、葛菁華等多名學生先后參與了可與本冊書配合使用的計算機輔助教學軟件IP