欧美精品一二区,性欧美一级,国产免费一区成人漫画,草久久久久,欧美性猛交ⅹxxx乱大交免费,欧美精品另类,香蕉视频免费播放

數據挖掘課程設計(共22頁)

上傳人:6**** 文檔編號:46403537 上傳時間:2021-12-13 格式:DOC 頁數:20 大?。?.29MB
收藏 版權申訴 舉報 下載
數據挖掘課程設計(共22頁)_第1頁
第1頁 / 共20頁
數據挖掘課程設計(共22頁)_第2頁
第2頁 / 共20頁
數據挖掘課程設計(共22頁)_第3頁
第3頁 / 共20頁

下載文檔到電腦,查找使用更方便

20 積分

下載資源

還剩頁未讀,繼續(xù)閱讀

資源描述:

《數據挖掘課程設計(共22頁)》由會員分享,可在線閱讀,更多相關《數據挖掘課程設計(共22頁)(20頁珍藏版)》請在裝配圖網上搜索。

1、精選優(yōu)質文檔-----傾情為你奉上 棗 莊 學 院 信息科學與工程學院課程設計任務書 題目: 數據挖掘在期末成績評估中的應用 小組成員: 趙尊強、 桂文學 成員學號: 6、 6 專業(yè)班級: 計算機科學與技術、2012級本1班 課 程: 數據挖掘 指導教師: 遲慶云 職稱: 副教授 完成時間: 2015年 5 月-

2、---------------2015年 6 月 棗莊學院信息科學與工程學院制 2015年5 月20日 開發(fā)小組成員分工及職責 趙尊強:設計規(guī)劃、文獻搜集 桂文學:挖掘資料、數據整合 課程設計任務書及成績評定 課程設計的任務和具體要求 任務: 1. 確定挖掘主題和方法:根據挖掘的主題和目標,確定合適的挖掘方法。 2. 數據選擇和預處理:根據所收集數據,填充缺失值,平滑噪聲數據,消除異常值,解決數據不一致等問題。 3.挖掘方法實現:規(guī)劃挖掘過程,界面設計,挖掘方法實現。4.挖掘數據:對預處理后的數據進行挖掘 4. 模式的可視化表

3、達與解釋:根據應用領域的信息和知識需求,以直觀有效的形式,如圖表等顯示數據挖掘出的模式,用特定領域的知識加以解釋,使得用戶能夠理解和接受。 要求:.撰寫出符合要求的軟件項目綜合實踐報告。 指導教師簽字: 遲慶云 日期: 指導教師評語 成績:____________ 指導教師簽字: 日期: 課程設計所需軟件、硬件等 n 硬件環(huán)境:Iterl(R) Core(TM)2 Duo CPU

4、,主頻2.31GHz;內存3G; 硬盤320G以上;1024768顯示分辨率 n 軟件環(huán)境: Delphi ,SQL Server2008 ,WEKA 課程設計進度計劃 起至日期 工作內容 備注 5月01日—06日 5月07日—20日 6月05日—08日 6月09日—18日 搜集資料 課程設計分析 系統設計、測試設計 寫報告書 參考文獻、資料索引 序號 文獻、資料名稱 編著者 出版單位 [1]Jamie MacLennan,ZhaoHui Tang,Bogdan Crivat 著.數據挖掘原理與應用(第2版)—

5、—SQL Server 2008數據庫.北京:清華大學出版社. [2]王麗珍、周麗華、陳紅梅、肖清,數據倉庫與數據挖掘原來及應用,北京:科學出版社 [3] 張興會 數據倉庫與數據挖掘技術 清華大學出版社 專心---專注---專業(yè) 目錄 1概述 1.1應用背景和問題的提出 在大學生活中,我們大學生在某種程度上還是比較重視自己的課程成績的。而有一個期末最終成績的評估系統,無疑對同學們而言是很有用的。在這個系統中,只需輸入你估計的平時成績以及表現和期

6、末考試的得分,就可以預測出最終的成績。而這個課程成績的組成以及得出是怎么樣的呢。這個最終的得分是受到什么影響呢?本論文就以上問題進行了探討和挖掘。 1.2設計內容的介紹 本課程設計主要是探討和研究在老師給定成績時考慮的因素,以及這些因素所占的比例。數據倉庫為一份記錄著600個同學的得分情況的數據,數據挖掘則采用決策樹探究出影響結婚年齡的因素。 2數據倉庫設計 2.1概念模型設計 數據倉庫里面有一個實體,也就是成績score。成績的決定因素有performance也就平時表現情況,即根據其在課堂上的活躍程度以及認真聽課的情況來給的分,還有averscore就是同學平時的作業(yè)得分以及平時

7、測試或者期中測試的平均成績,以及期末考試的成績lasttest。 score lasttest performance averscore 2.2邏輯模型設計 本數據倉庫只有一個表,邏輯模型設計如下: 2.3物理模型設計 在數據倉庫的物理設計中,主要解決數據的存儲結構、數據的索引策略、數據的存儲策略、存儲分配優(yōu)化等問題。物理設計的主要目的有兩個,一是提高性能,二是更好地管理存儲的數據。訪問的頻率、數據容量、選擇的RDBMS支持的特性和存儲介質的配置都會

8、影響物理設計的最終結果。在本數據挖掘中,數據的索引策略采取的并不是位圖索引而是按列索引 2.4 OLAP模型設計 在本設計中由于案例考慮的并不復雜,所以OLAP模型設計也就比較的簡單。 下面的數據是保存在Excel中的。大概的模型設計也就如下圖所示。 2.5 OLAP前端展示設計 3數據挖掘分析 3.1 期末成績評估系統應用挖掘概述 在本系統中,數據倉庫采用一個二維表來存儲和表示同學們的平時成績,平時表現得

9、分,以及期末成績等屬性。數據挖掘則采用關聯分析來將二維表中的實例分開,并探究這些數據所蘊含的規(guī)律。 3.2數據挖掘實驗 3.2.1實驗環(huán)境 Windows XP Microsoft SQL Server 2008 Microsoft Visual Studio 2008 Microsoft Office 2003 Excel Access 3.2.2數據準備及預處理 首先選擇數據源,以下幾個截圖是在做實驗時的幾個步驟。

10、 3.2.3 實驗內容 (輸入數據集,選擇算法,輸出結果,比較分析) 建立一個Analysis Services Project的項目,在數據源中輸入數據集: 說明: 以上實驗室在實驗室做的,由于時間不夠,回到宿舍自己安裝了中文版的SQL SERVER工具,并完成接下來的實驗步驟。 3.2.4 算法選擇 分類的任務是通過分析由已知類別數據對象組成的訓練數據集,建立描述并區(qū)分數據對象類別的分類函數或分類模型(也常常稱作分類器)。 分類算法有多種,例如,決策樹分類算法、神經網絡分類算法、貝葉斯分類算法等。

11、這里需要用的是決策樹分類算法。 在本挖掘中選擇是關聯分析,分析過程和結果如以下圖所示: 下面是挖掘模型: 關聯規(guī)則: 項集: 說明(項集是比較準確的) 分類矩陣: 依賴關系網絡圖: 提升圖: 通過整合做出散點圖如下圖: 通過以上的分析,我們得出一個結論,就是期末成績在最終得分中所占的比例最大,平時成績和平時表現的權重差不多,在這個結論中,期末考試的成績的重要性,不言而喻,增加期末考試的成績,最能提高最終成績,平時成績和表現的得分也很重要,但相對權重沒有期末成績大。一個分數高的學生,他的所有成績都應該是很高的。 4小結 由于團隊技術水平有限,在開發(fā)過程中遇到了很多技術問題,不過大多數都是一些小的細節(jié)問題,花了很長時間。 還有就是由于對軟件的不熟練,然后經常會搞錯多對一等的關系,或者是一些屬性的不對應,最后通過同學的幫忙,幫我查找到錯誤,并幫我們改正。 經過幾個星期的課程設計,過程曲折可謂一語難盡。生活就是這樣,汗水預示著結果也見證著收獲。通過這次的設計培養(yǎng)了我綜合應用所學知識,發(fā)現、提出、分析和解決實際問題,鍛煉了我的實踐能力。

展開閱讀全文
溫馨提示:
1: 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2: 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
3.本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
5. 裝配圖網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

相關資源

更多
正為您匹配相似的精品文檔
關于我們 - 網站聲明 - 網站地圖 - 資源地圖 - 友情鏈接 - 網站客服 - 聯系我們

copyright@ 2023-2025  zhuangpeitu.com 裝配圖網版權所有   聯系電話:18123376007

備案號:ICP2024067431-1 川公網安備51140202000466號


本站為文檔C2C交易模式,即用戶上傳的文檔直接被用戶下載,本站只是中間服務平臺,本站所有文檔下載所得的收益歸上傳人(含作者)所有。裝配圖網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對上載內容本身不做任何修改或編輯。若文檔所含內容侵犯了您的版權或隱私,請立即通知裝配圖網,我們立即給予刪除!