国产自操久久,9999在线观看,日韩中文字幕,中文字幕精品视频在线,5151精品国产人成在线观看,狠狠色综合久久婷婷色天使 ,国产精品一区二区男人吃奶

數(shù)據挖掘技術在WEB的運用論文

時間:2021-04-25 14:50:10 論文 我要投稿

數(shù)據挖掘技術在WEB的運用論文

  一、數(shù)據挖掘的背景

數(shù)據挖掘技術在WEB的運用論文

  互聯(lián)網、計算機信息技術迅猛的發(fā)展勢頭,數(shù)據從結構化存儲以及轉化為非結構化的存儲,數(shù)據存儲形式的轉變,不同數(shù)據類型的存儲變多,音頻、視頻等大格式的信息存儲在多個應用中實現(xiàn)。行業(yè)中的計算機化、信息化和網絡化,使計算機和服務器上積累了各種各樣海量的數(shù)據。傳統(tǒng)的人工分析已經不能滿足和適應如此大量的數(shù)據,各行各業(yè)都產生了巨大數(shù)據信息,包括生產加工、研究、物流運輸、客戶、營銷、售后等數(shù)據,人們卻不知道怎么利用這些數(shù)據實現(xiàn)價值的增長。如果能將這些數(shù)據進行挖掘分析,很可能會產生巨大的商業(yè)價值,很多有價值的信息可以被發(fā)現(xiàn),F(xiàn)在,越來越多的公司和企業(yè)意識到數(shù)據挖掘的重要性,但是怎么能從如此海量的數(shù)據中挖掘出有價值有用的信息,已經成為研究的熱門話題。在傳統(tǒng)的數(shù)據分析基礎上,相關人員結合新開發(fā)人工智能和數(shù)據挖掘等相關的技術,數(shù)據庫孕育而生,讓我們能從海量的數(shù)據中挖掘出有價值的信息,促使信息化的發(fā)展,稱之為數(shù)據挖掘。

  二、數(shù)據挖掘的過程

  1、數(shù)據收集。將要進行數(shù)據分析的海量數(shù)據資源收集到數(shù)據倉庫中。把不同來源、格式、特點性質的數(shù)據在邏輯上或物理上有機地集中,抽象出分析相關的數(shù)據,進行非結構化數(shù)據的分類,篩選出不相關或者無價值的數(shù)據,減少數(shù)據集的容量。

  2、數(shù)據清洗和轉換。數(shù)據清洗是為了刪除掉無用的數(shù)據信息。數(shù)據轉換的目的最直接的是把所有信息統(tǒng)一化。將完整,有效的`信息存入數(shù)據倉庫。

  3、模型建立。模型建立是數(shù)據挖掘的核心階段。首先,要和相關領域的專家組成團隊,進行需求分析,明確數(shù)據挖掘的目的和具體的數(shù)據挖掘任務。根據不同的任務,選擇相關算法,利用這些算法來建立模型,再用專業(yè)的模型評估工具比較模型的準確度。即使是同一種算法,參數(shù)選取的不同,所建模型的準確度也不一樣。

  4、模型評估。從商業(yè)角度來講,模型評估是對我們所建立的預測模型的正確性進行價值評估,如若模型中模式無價值,就要重復數(shù)據挖掘過程中的2~4步,即數(shù)據清洗和轉換、模型建立。

  5、知識表示。將數(shù)據挖掘最后的結果以最直觀的方式呈現(xiàn)給用戶,通常用數(shù)據圖形展示工具來表示。

  6、應用集成。將數(shù)據挖掘集成到現(xiàn)實的實際應用中。例如,CRM中有了數(shù)據挖掘功能,就可以對客戶進行等級分類。

  7、模型管理。根據不同數(shù)據模型的生命周期做好數(shù)據應用和管理。

  三、WEB數(shù)據挖掘

  基于WEB內容的挖掘就是針對網頁內容進行數(shù)據挖掘,通過用戶對網頁訪問的交互,留下的數(shù)據信息進行收集分類,完成數(shù)據挖掘。目前對文本內容的挖掘技術取得了一定的成果,對圖像、音頻、視頻等各種多媒體數(shù)據的數(shù)據挖掘技術都開始采用非結構化大數(shù)據應用技術來完成。基于WEB結構的挖掘是發(fā)現(xiàn)頁面、文檔和WEB的結構,主要是發(fā)現(xiàn)WEB潛在的結構模式,利用分析這些結構我們可以得到很多潛在有價值的信息;赪EB使用的數(shù)據挖掘,即針對用戶的訪問網頁的軌跡收集分析。WEB內容的挖掘和結構的挖掘面對的主要挖掘對象是大規(guī)模的軌跡數(shù)據,對挖掘數(shù)據進行分析可以讓管理者了解用戶的不同需求,從而為用戶提供個性化的服務。

  四、數(shù)據挖掘在WEB中個性化定制的應用

  通過網站與用戶的交互,可以得到用戶訪問的內容、時間、方式、頻率等,從中發(fā)現(xiàn)潛在的商業(yè)價值,通過價值數(shù)據進行數(shù)據挖掘以及算法分析得出商業(yè)結論。就可以根據挖掘到的信息對這些客戶進行特定的推銷策略,進行個性化定制。在商業(yè)領域中,通過對相似軌跡數(shù)據的客戶進行分類,分析他們的共性,幫助管理者發(fā)現(xiàn)不同客戶的需求和興趣,提供適宜各類人的服務。按照不同用戶的不同興趣和愛好,向用戶提供動態(tài)的瀏覽建議。對大多數(shù)用戶來說,如果可以訪問該網站可以體會到量身定做的服務,那么數(shù)據挖掘個性化定制就成功完成了。

  五、數(shù)據挖掘技術在WEB中的應用

  網站的功能設計及其版面的內容直接影響到網站的訪問率。相關人員發(fā)現(xiàn)用戶的需要和興趣,對需求強烈的地方提供優(yōu)化,使用數(shù)據挖掘去發(fā)現(xiàn)頁面間的關聯(lián),針對不同的用戶動態(tài)調整網站的設計和鏈接,使用戶可以便捷地訪問到自己想要訪問的頁面。將數(shù)據挖掘技術的在WEB中的應用,吸引更多的用戶。隨著數(shù)據挖掘技術在WEB中的應用,用戶可以通過分析挖掘的結果了解各種客戶的需求和喜好,得到各種定制個性化服務。隨著互聯(lián)網上軌跡數(shù)據信息量的急速增長,不斷復雜化的數(shù)據結構,挖掘技術也面臨著一系列新的問題和挑戰(zhàn)。

  參考文獻:

  [1]胡繼平、數(shù)據挖掘技術[J]、景德鎮(zhèn)高專學報,1998

  [2]NguyenT,SrinivasanV、AccessingrelationaldatabasesfromtheWorldWideWEB、In:ProcofIEEEDataEngineering[J]、NewOrleansLouisiana,2006

【數(shù)據挖掘技術在WEB的運用論文】相關文章:

《數(shù)據的波動》說課稿09-25

《數(shù)據的波動》說課稿范文09-27

積累運用二教學設計11-29

《積累與運用五》教學設計01-16

《積累與運用七》教學設計07-08

《積累·運用八》教學設計01-20

《積累·運用五》教學設計02-27

《積累運用二》教學設計03-03

《積累與運用二》教學設計03-03

《積累·運用三》教學設計03-03

开远市| 仙居县| 昌都县| 小金县| 当阳市| 博罗县| 盖州市| 台安县| 宁海县| 苍南县| 三台县| 板桥市| 上林县| 三河市| 句容市| 阿克| 青海省| 伊通| 图木舒克市| 浦县| 新泰市| 山阳县| 保亭| 融水| 尚义县| 安远县| 堆龙德庆县| 五华县| 安仁县| 钟山县| 宜兰县| 忻城县| 大连市| 游戏| 东乌珠穆沁旗| 昌都县| 勐海县| 巨鹿县| 宜州市| 新巴尔虎左旗| 卢龙县|