1.1 數(shù)據(jù)處理的目的
1) 把數(shù)據(jù)轉(zhuǎn)換成便于觀察分析、傳送或進(jìn)一步處理的形式;
2) 把數(shù)據(jù)加工成對(duì)正確決策有用的數(shù)據(jù);
3) 把數(shù)據(jù)編輯后存儲(chǔ)起來,供以后取用。
1.2 數(shù)據(jù)處理的基本內(nèi)容
數(shù)據(jù)收集、數(shù)據(jù)轉(zhuǎn)換、數(shù)據(jù)的篩選分組和排序、數(shù)據(jù)的組織、數(shù)據(jù)的運(yùn)算、數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)檢索、數(shù)據(jù)的輸出。
2. 數(shù)據(jù)組織的概念(簡單應(yīng)用)
2.1 數(shù)據(jù)結(jié)構(gòu)的兩種形式
外存結(jié)構(gòu)、內(nèi)存結(jié)構(gòu)
2.2 數(shù)據(jù)組織的四個(gè)層次
數(shù)據(jù)項(xiàng)、記錄、文件、數(shù)據(jù)庫
2.3 數(shù)據(jù)項(xiàng)、記錄、鑒別鍵、文件、數(shù)據(jù)庫等概念
數(shù)據(jù)項(xiàng):是描述一個(gè)數(shù)據(jù)處理對(duì)象的某些屬性的。與字段的概念相對(duì)應(yīng)。
記錄:是與一個(gè)公共標(biāo)志有關(guān)的數(shù)據(jù)項(xiàng)的集合。
主鍵:是用來唯一地標(biāo)志一個(gè)記錄的標(biāo)示符。
鑒別鍵:主鍵與副鍵的統(tǒng)稱,其功能是用來鑒別和搜索記錄。
文件:為了某一特定的目的而形成的相關(guān)記錄的集合。(如:輸入文件、報(bào)告文件)
數(shù)據(jù)庫:是數(shù)據(jù)組織層次中目前已達(dá)到的最高級(jí)別。
2.4 數(shù)據(jù)外存儲(chǔ)介質(zhì)的構(gòu)造
磁帶:是一條涂有磁性材料的塑料帶,上面有多條平行的磁道,上面每個(gè)磁點(diǎn)代表一個(gè)二進(jìn)位。
磁盤:柱面×磁道×扇區(qū)
3. 數(shù)據(jù)的物理組織和邏輯組織(簡單應(yīng)用)
3.1 邏輯記錄和物理記錄的概念和它們的區(qū)別
邏輯記錄:是數(shù)據(jù)在用戶或應(yīng)用程序員面前呈現(xiàn)的方式,即用戶對(duì)數(shù)據(jù)的標(biāo)示方式。
物理記錄:是與邏輯記錄怎樣具體地存儲(chǔ)到外存上有關(guān)的。
3.2 數(shù)據(jù)物理組織的兩種基本形式及其特點(diǎn)
1) 順序的數(shù)據(jù)組織
2) 直接的數(shù)據(jù)組織
3.3 數(shù)據(jù)邏輯組織的概念
數(shù)據(jù)的邏輯組織:指的是對(duì)相關(guān)記錄進(jìn)行邏輯上的編排。
三種結(jié)構(gòu)形式:鏈表、樹、網(wǎng)絡(luò)
3.4 按需要用指針在圖紙上將記錄聯(lián)結(jié)成鏈表
(需要理解P24)
3.5 用圖形表示樹和網(wǎng)狀組織兩種數(shù)據(jù)的邏輯組織
(需要理解P25)
4. 文件組織(簡單應(yīng)用)
4.1 文件組織、文件系統(tǒng)的概念和文件系統(tǒng)的功能
文件組織:是數(shù)據(jù)組織的一部分,主要指數(shù)據(jù)記錄在外設(shè)備上的組織。
文件系統(tǒng):指計(jì)算機(jī)操作系統(tǒng)中的文件管理系統(tǒng),實(shí)質(zhì)上是一個(gè)管理和存取文件的軟件系統(tǒng),它由文件和管理文件的程序組成。
文件系統(tǒng)功能:它能定義需要的文件組織方式,并提供建立和存取數(shù)據(jù)的環(huán)境。
4.2 記錄存入存儲(chǔ)器的物理順序和邏輯順序的區(qū)別
兩者并不一定完全一致,排好序的順序文件是物理順序和邏輯順序一致的文件。
4.3 各種文件組織方式的特征
1) 順序文件:存儲(chǔ)在順序存儲(chǔ)器上時(shí),只能按順序掃描法存??;存儲(chǔ)在隨機(jī)存取存儲(chǔ)器上時(shí),還可以按分塊查找法或折半查找法進(jìn)行存取。
2) 索引文件:分為索引區(qū)和數(shù)據(jù)區(qū),索引表的索引項(xiàng)按順序排列,數(shù)據(jù)文件本身可以按順序或不按順序排列。
3) 直接存取文件
①直接地址法:存取機(jī)構(gòu)動(dòng)作簡單,使用方便,不會(huì)產(chǎn)生重號(hào);不易記憶。
②相對(duì)鍵法:搜索時(shí)間短,處理速度快;若有空號(hào),造成空間浪費(fèi);需要占用一個(gè)連續(xù)的地址塊,空間利用率低。
公式: (100為假設(shè)的記錄長度,400為假設(shè)的文件存儲(chǔ)起點(diǎn)地址)
③雜湊法公式:存取速度快,節(jié)約存儲(chǔ)空間;不易找到一個(gè)良好的算法,有時(shí)碰撞現(xiàn)象發(fā)生過多時(shí),會(huì)加長存取時(shí)間。
存儲(chǔ)單元數(shù): (N記錄總數(shù),n單位存儲(chǔ)記錄數(shù))
質(zhì)數(shù)除法公式: (K需要轉(zhuǎn)變的鍵號(hào),P接近存儲(chǔ)單元的質(zhì)數(shù),INT表示取整)
4.4 在順序存取存儲(chǔ)器和隨機(jī)存取存儲(chǔ)器上順序文件可以采用的查找方法
(見4.3)
4.5 索引文件的特點(diǎn)以及查找、刪除、和插入操作過程
(見4.3)
4.6 實(shí)現(xiàn)直接存取文件組織的三種方法的原理
(見4.3)
4.7 雜湊函數(shù)的一種算法——質(zhì)數(shù)除余數(shù)
(見4.3)
4.8 用溢流表法解決存儲(chǔ)單元分配中碰撞現(xiàn)象的原理
(需要理解P30)
4.9 使用雜湊法的步驟,知道雜湊法的優(yōu)缺點(diǎn)
1) 確定記錄總數(shù)N;
2) 確定每一存儲(chǔ)單元可以存放的記錄數(shù)n;
3) 按公式計(jì)算應(yīng)準(zhǔn)備的單元數(shù): ;
4) 找出一個(gè)雜湊函數(shù)。
5. 數(shù)據(jù)處理技術(shù)(簡單應(yīng)用)
5.1 數(shù)據(jù)庫的概念
數(shù)據(jù)庫系統(tǒng):是由計(jì)算機(jī)系統(tǒng)、數(shù)據(jù)庫管理系統(tǒng)和有關(guān)人員造成的具有高度組織的總體。
5.2 數(shù)據(jù)庫的主要特征
1) 最小的數(shù)據(jù)重復(fù)性
2) 數(shù)據(jù)存儲(chǔ)的一致性
3) 數(shù)據(jù)的獨(dú)立性
4) 數(shù)據(jù)的安全性
5.3 數(shù)據(jù)庫與數(shù)據(jù)文件的主要區(qū)別
數(shù)據(jù)庫包含了若干個(gè)文件,通過聯(lián)結(jié)路徑實(shí)現(xiàn)記錄之間的聯(lián)系;
數(shù)據(jù)庫能反映顯示世界中信息間聯(lián)系及含義;
文件只包含數(shù)據(jù)本身,而數(shù)據(jù)庫則包含了基本數(shù)據(jù)和關(guān)于數(shù)據(jù)的數(shù)據(jù),如反映聯(lián)系的、反映語義的,為了管理控制而附加的各種數(shù)據(jù)。
5.4 數(shù)據(jù)模型的三種類型
層次數(shù)據(jù)模型、網(wǎng)狀數(shù)據(jù)模型、關(guān)系數(shù)據(jù)模型
5.5 數(shù)據(jù)庫管理系統(tǒng)的概念和功能
數(shù)據(jù)庫管理系統(tǒng):是由實(shí)現(xiàn)數(shù)據(jù)庫管理功能的許多系統(tǒng)程序組成的集合。
功能:①定義數(shù)據(jù)庫、②管理數(shù)據(jù)庫、③維護(hù)數(shù)據(jù)庫、④數(shù)據(jù)通訊功能、實(shí)現(xiàn)數(shù)據(jù)的傳送。
5.6 目前常用的幾種數(shù)據(jù)庫管理系統(tǒng)
1) Oracle數(shù)據(jù)庫
2) FoxPro(筆者注:老掉牙的東西,不學(xué)還不行,暈。換成DB2、SQl Server或者Sybase等還差不多)
5.7 用SQL語言查詢數(shù)據(jù)用的語句
(略,考過《數(shù)據(jù)庫原理》的應(yīng)該是沒有問題的。)
6. 數(shù)據(jù)處理技術(shù)(領(lǐng)會(huì))
6.1 定義數(shù)據(jù)文件的結(jié)構(gòu)
6.2 數(shù)據(jù)文件建立過程中設(shè)立控制點(diǎn)的重要性
控制點(diǎn)的目的:對(duì)輸入的數(shù)據(jù)項(xiàng)進(jìn)行校驗(yàn),避免由此而影響數(shù)據(jù)的正確性。
數(shù)據(jù)校驗(yàn)的方法:名稱校驗(yàn)、重復(fù)校驗(yàn)、范圍校驗(yàn)、類型校驗(yàn)、平衡校驗(yàn)等。
6.3 根據(jù)具體要求編寫建立和修改數(shù)據(jù)文件的程序
6.4 編寫對(duì)數(shù)據(jù)文件按選定字段進(jìn)行排序的程序
6.5 對(duì)數(shù)據(jù)文件進(jìn)行檢索的幾種方法
6.6 編寫按順序查找法對(duì)數(shù)據(jù)文件進(jìn)行檢索的程序
6.7 隨機(jī)檢索程序的編寫方法
6.8 數(shù)據(jù)文件合并和更新的含義和使用場合
6.9 用處理文件去更新文件的程序原理
7. 數(shù)據(jù)處理方式(識(shí)記)
7.1 數(shù)據(jù)處理方式的兩種類型
批處理方式、聯(lián)機(jī)實(shí)時(shí)處理方式
7.2 批處理的兩種類型及其處理過程
1) 順序處理:必須從第一個(gè)記錄開始,一個(gè)一個(gè)搜索下去,直至找到要修改的為止。
適合于:①定期處理的場合、②每次處理的記錄數(shù)量較大的情況。
2) 直接存取處理:每次更新都直接去修改主文件記錄,原有記錄被破壞。又叫破壞性更新或覆蓋更新。
7.3 分析直接存取處理的優(yōu)點(diǎn)
1) 用一個(gè)簡單的程可以更新多個(gè)文件
2) 當(dāng)更新的主記錄少時(shí),直接存取系統(tǒng)文件的維護(hù)比順序系統(tǒng)要快得多。
7.4 聯(lián)機(jī)實(shí)時(shí)系統(tǒng)和分時(shí)系統(tǒng)的概念
聯(lián)機(jī)實(shí)時(shí)系統(tǒng)優(yōu)點(diǎn):相應(yīng)及時(shí),適合于要求及時(shí)響應(yīng)的場合;不需要脫機(jī)轉(zhuǎn)換數(shù)據(jù),不需要人工干預(yù),使用方便,服務(wù)及時(shí)。缺點(diǎn):集中程度高,要求有嚴(yán)格的控制過程,對(duì)存取的安全控制要求較高,技術(shù)較復(fù)雜。