日韩欧美另类久久久精品_亚洲大色堂人在线无码_国产三级aⅴ在线播放_在线无码aⅴ精品动漫_国产精品精品国产专区

我要投稿 投訴建議

數(shù)據(jù)挖掘論文

時(shí)間:2023-07-29 07:18:28 畢業(yè)論文范文 我要投稿

數(shù)據(jù)挖掘論文(精品)

  在各領(lǐng)域中,大家肯定對(duì)論文都不陌生吧,論文的類(lèi)型很多,包括學(xué)年論文、畢業(yè)論文、學(xué)位論文、科技論文、成果論文等。寫(xiě)論文的注意事項(xiàng)有許多,你確定會(huì)寫(xiě)嗎?以下是小編幫大家整理的數(shù)據(jù)挖掘論文,歡迎大家分享。

數(shù)據(jù)挖掘論文(精品)

數(shù)據(jù)挖掘論文1

  摘要:近年來(lái),數(shù)據(jù)庫(kù)挖掘技術(shù)的普遍應(yīng)用,使數(shù)據(jù)價(jià)值實(shí)現(xiàn)最大化,在我國(guó)金融、商業(yè)、市場(chǎng)營(yíng)銷(xiāo)等領(lǐng)域得到廣泛應(yīng)用。然而在我國(guó)高校管理中并沒(méi)有得到推廣,為使高校管理系統(tǒng)中的數(shù)據(jù)充分發(fā)揮應(yīng)有價(jià)值,在該系統(tǒng)中使用數(shù)據(jù)庫(kù)挖掘技術(shù)意義深遠(yuǎn)。本文首先介紹了數(shù)據(jù)挖掘技術(shù)的流程,然后在教師教學(xué)質(zhì)量評(píng)估中應(yīng)用數(shù)據(jù)庫(kù)挖掘技術(shù),充分證明數(shù)據(jù)庫(kù)挖掘技術(shù)在高校管理中能發(fā)揮重大作用。

  關(guān)鍵詞:管理 決策 數(shù)據(jù)挖掘技術(shù)

  當(dāng)前,大部分高校都擁有配套的管理系統(tǒng),該系統(tǒng)具備海量數(shù)據(jù)儲(chǔ)存和管理功能,徹底告別了手工記錄信息和數(shù)據(jù)的年代。不但節(jié)約了紙張,更有效提高了高校管理數(shù)據(jù)和信息的效率。然而我國(guó)高校沒(méi)有有效利用應(yīng)用數(shù)據(jù)挖掘技術(shù),因此研究數(shù)據(jù)庫(kù)挖掘技術(shù)在高校管理中的應(yīng)用十分必要。

  1數(shù)據(jù)挖掘技術(shù)的流程

  數(shù)據(jù)挖掘技術(shù)能夠?qū)⒑A繑?shù)據(jù)展開(kāi)分析和處理,再把整體數(shù)據(jù)庫(kù)中存在規(guī)律的數(shù)據(jù)整合起來(lái),實(shí)施該技術(shù)主要包括以下五個(gè)環(huán)節(jié)。目標(biāo)定義:該環(huán)節(jié)中要與有關(guān)領(lǐng)域的背景知識(shí)相結(jié)合,清晰、精確的定義出數(shù)據(jù)挖掘目標(biāo)。數(shù)據(jù)準(zhǔn)備:在該環(huán)節(jié)中要搜集、選取數(shù)據(jù)源中的數(shù)據(jù),處理已選數(shù)據(jù),將其轉(zhuǎn)換為適合數(shù)據(jù)挖掘的`形態(tài)。數(shù)據(jù)挖掘:該環(huán)節(jié)是數(shù)據(jù)挖掘技術(shù)的核心,即采用關(guān)聯(lián)規(guī)則法、分類(lèi)分析法等各種數(shù)據(jù)挖掘方法把數(shù)據(jù)中隱藏的知識(shí)和規(guī)律發(fā)掘出來(lái)。結(jié)果表示:在該環(huán)節(jié)中可以以用戶(hù)需求為依據(jù),將挖掘出來(lái)的知識(shí)和規(guī)律轉(zhuǎn)變?yōu)橛脩?hù)能接受和理解的形態(tài)。知識(shí)吸收:該環(huán)節(jié)中,主要是把挖掘結(jié)果與指定領(lǐng)域中的需求相結(jié)合,在該領(lǐng)域中應(yīng)用發(fā)掘出來(lái)的結(jié)果,為決策者提供知識(shí),是數(shù)據(jù)挖掘的終極目標(biāo)。

  2數(shù)據(jù)挖掘技術(shù)在教學(xué)質(zhì)量評(píng)估中的應(yīng)用

  2。1運(yùn)用關(guān)聯(lián)規(guī)則法挖掘數(shù)據(jù)庫(kù)中的信息

  評(píng)估老師教學(xué)質(zhì)量不但是評(píng)定教學(xué)效果的重要部分,也是評(píng)定教師職稱(chēng)的重要根據(jù),因此是高校管理工作中不可或缺的部分。目前評(píng)估教學(xué)質(zhì)量的主要措施是搜集、統(tǒng)計(jì)學(xué)生的成績(jī)和以及對(duì)老師的評(píng)價(jià),然后加權(quán)算出老師的總得分,作為評(píng)估該老師教學(xué)質(zhì)量指標(biāo)。這種方法非但不科學(xué),其權(quán)威性也較低,因此需要深挖數(shù)據(jù)的相關(guān)性,本文采用了數(shù)據(jù)挖掘技術(shù)中的關(guān)聯(lián)規(guī)法挖掘數(shù)據(jù)中的規(guī)律和知識(shí),為評(píng)估老師教學(xué)質(zhì)量提供有力根據(jù)。運(yùn)用關(guān)聯(lián)規(guī)則法挖掘數(shù)據(jù),其規(guī)則方法為“XY,置信度為c%,,支持度為s%”。關(guān)聯(lián)規(guī)則中置信度為c%:在整體事件D集合中,如果既能夠符合事件X中擁有c%的需求,也能夠符合Y的要求。那么就用置信度來(lái)表示關(guān)聯(lián)規(guī)則的強(qiáng)度,被記錄為confidence(XY),置信度最小值用minConf來(lái)表示,通常置信度最小數(shù)值由客戶(hù)提供。關(guān)聯(lián)規(guī)則中置信度為s%:在整體事件D集合中,如果既能夠符合事件Y中的s%的需求,又能夠符合X要求。用支持度來(lái)表示關(guān)聯(lián)規(guī)則的頻度,把支持度的最小數(shù)記錄用minsup(X)來(lái)表示,通常支持度最小數(shù)值由客戶(hù)提供。頻繁項(xiàng)集合:當(dāng)X項(xiàng)集的支持度大于等于用戶(hù)設(shè)定好的最小支持度時(shí),那么頻繁項(xiàng)集是X。通常關(guān)聯(lián)規(guī)則包含兩個(gè)環(huán)節(jié):①把全部頻繁項(xiàng)集從整體事件集中選出;②運(yùn)用頻繁項(xiàng)集產(chǎn)生關(guān)聯(lián)規(guī)則。在這兩個(gè)環(huán)節(jié)中關(guān)聯(lián)規(guī)則效果和性能是否良好取決于第一個(gè)環(huán)節(jié)。

  2。2關(guān)聯(lián)規(guī)則分析在評(píng)估教學(xué)質(zhì)量中的運(yùn)用

  第一步是準(zhǔn)備數(shù)據(jù)期,在某大學(xué)的教學(xué)管理系統(tǒng)中將五百條與教學(xué)評(píng)價(jià)有關(guān)的記錄從數(shù)據(jù)庫(kù)中隨機(jī)抽取,并挑選出老師編號(hào)、學(xué)歷、性別、教齡、評(píng)估分和職稱(chēng)這六個(gè)屬性,并將相關(guān)數(shù)據(jù)從數(shù)據(jù)庫(kù)中提取。比如把講師、副教授和教授等職稱(chēng)轉(zhuǎn)化成11、01、00等編碼,表1就是制定的評(píng)價(jià)教師教學(xué)記錄表。第二步采用關(guān)聯(lián)規(guī)則分析法把90分以上評(píng)價(jià)分?jǐn)?shù)作為檢索目標(biāo)和判斷標(biāo)準(zhǔn),也就是將≥90分作為判斷是否是高教學(xué)質(zhì)量闕值。通過(guò)檢索有143條記錄符合標(biāo)準(zhǔn),即設(shè)定最小的支持度為10%,置信度則為15%,得出下表2的關(guān)聯(lián)規(guī)則。最后一步評(píng)價(jià)本次實(shí)驗(yàn)的結(jié)果。由上表得知,學(xué)生喜歡男老師和女老師的程度大致相同;學(xué)歷愈高的老師,給予他們的教學(xué)評(píng)價(jià)也就愈高,即學(xué)歷和教學(xué)評(píng)價(jià)成正比,這也說(shuō)明了學(xué)歷高的老師其基本功與學(xué)歷低的老師相比,前者基本功更為穩(wěn)固,也有較高的科學(xué)研究水平;有較長(zhǎng)教齡和較高職稱(chēng)的老師,其教學(xué)質(zhì)量也越高;此外,在支持度中可以看出,高校教授和高學(xué)歷人才越多,說(shuō)明其辦學(xué)能力也就越高。

  3結(jié)語(yǔ)

  高校管理系統(tǒng)作為教學(xué)信息化的重要舉措,只是起到搜集和儲(chǔ)存海量教學(xué)信息的作用,并沒(méi)有挖掘出海量數(shù)據(jù)之間的相關(guān)性,而在本文中把關(guān)聯(lián)規(guī)則法運(yùn)用在教師教學(xué)質(zhì)量評(píng)估中,在數(shù)據(jù)中挖掘有價(jià)值的知識(shí)和規(guī)律,使評(píng)估教師教學(xué)質(zhì)量更具有科學(xué)性,因此在高校管理中全面應(yīng)用數(shù)據(jù)挖掘技術(shù),能為高校深化教學(xué)改革提供新的契機(jī)。

  參考文獻(xiàn)

  [1]江敏,徐艷。數(shù)據(jù)挖掘技術(shù)在高校教學(xué)管理中的應(yīng)用[J]。電腦知識(shí)與技術(shù),20xx,(24):541—545+560。

  [2]楊雪霞。數(shù)據(jù)挖掘技術(shù)在高校圖書(shū)館管理系統(tǒng)中的應(yīng)用研究[J]。軟件,20xx(04):16—18。

數(shù)據(jù)挖掘論文2

  摘要:中醫(yī)臨床理論多是由著名醫(yī)家的經(jīng)驗(yàn)升華形成的,反映了臨床上不同學(xué)術(shù)派系以及不同學(xué)科的優(yōu)勢(shì)特征,但這其中不免摻雜了個(gè)人主觀(guān)經(jīng)驗(yàn),因此本文就中醫(yī)臨床理論研究中醫(yī)病案為基礎(chǔ),對(duì)應(yīng)用病案數(shù)據(jù)挖掘結(jié)果來(lái)總結(jié)和重建中醫(yī)臨床理論的方式進(jìn)行了探討,認(rèn)為該方法可為完善中醫(yī)臨床理論提供客觀(guān)的數(shù)據(jù)支持,使中醫(yī)臨床理論的來(lái)源更具有科學(xué)性。

  關(guān)鍵詞:病案;數(shù)據(jù)挖掘;中醫(yī)臨床理論;轉(zhuǎn)化醫(yī)學(xué);臨床

  科研一體化中醫(yī)臨床理論決定著中醫(yī)臨床學(xué)科的發(fā)展水平,是中醫(yī)臨床發(fā)展的動(dòng)力。從古至今,中醫(yī)名醫(yī)名家輩出,他們的臨床經(jīng)驗(yàn)和學(xué)術(shù)思想不斷提煉升華,逐步形成了傳統(tǒng)的中醫(yī)臨床理論。新中國(guó)成立以來(lái),中醫(yī)不斷汲取最新的科技成果,進(jìn)行了大量臨床實(shí)踐,而中醫(yī)臨床理論發(fā)展緩慢,己經(jīng)成為制約當(dāng)代中醫(yī)學(xué)術(shù)發(fā)展的瓶頸,對(duì)如何開(kāi)拓中醫(yī)臨床理論的研究,可謂見(jiàn)仁見(jiàn)智,但各種新的臨床理論常常裹挾著“各家學(xué)說(shuō)”。在當(dāng)今大數(shù)據(jù)和信息技術(shù)發(fā)達(dá)的背景下,運(yùn)用數(shù)據(jù)挖掘技術(shù)對(duì)中醫(yī)病案進(jìn)行大數(shù)據(jù)分析,客觀(guān)揭示當(dāng)前中醫(yī)臨床理論的本來(lái)面目,盡可能減少個(gè)人見(jiàn)解的偏倚,對(duì)于推動(dòng)中醫(yī)臨床理論發(fā)展具有重要的現(xiàn)實(shí)意義,本文就基于病案數(shù)據(jù)挖掘的中醫(yī)臨床理論重建進(jìn)行探討如下。

  1傳統(tǒng)中醫(yī)臨床理論的構(gòu)建框架

  1.1中醫(yī)古典文獻(xiàn)是傳統(tǒng)中醫(yī)臨床理論的基礎(chǔ)

  眾所周知,中醫(yī)之所以能夠屹立千年不倒,很大一部分原因是因?yàn)槠溆歇?dú)特的理論體系,而在這其中,中醫(yī)古典文獻(xiàn)做出的貢獻(xiàn)應(yīng)該是第一位的。因?yàn)檫@些古典文獻(xiàn)的記載和流傳,為后世的醫(yī)家提供了參考和借鑒,使得我們從前人的思維上不斷創(chuàng)新,與臨床進(jìn)行有機(jī)結(jié)合,不斷研究出新的適合于當(dāng)前時(shí)代的臨床理論。例如,中醫(yī)學(xué)無(wú)論在理論研究還是在臨床治療方面的豐富,許多根本性的理論都是源自于《內(nèi)經(jīng)》。該書(shū)創(chuàng)立了藏象、經(jīng)絡(luò)、診法等各方面的理論[1],勾畫(huà)了中醫(yī)理論的雛形,構(gòu)建了中醫(yī)理論體系的基本框架。到后期東漢時(shí)期張仲景的《傷寒論》則是創(chuàng)造了以六經(jīng)辨證和臟腑辨證為主的局面,其所倡導(dǎo)的“觀(guān)其脈證,知犯何逆,隨證治之”使得辨證論治登上新的高度。到了金元時(shí)期,就是百家爭(zhēng)鳴的時(shí)代,這期間以金元四大家為主的學(xué)派開(kāi)始萌生,留下了許多可供后世醫(yī)家參考的古典文獻(xiàn)并創(chuàng)建了不同的臨床理論,而明清時(shí)期以葉天士和吳鞠通為首確立的衛(wèi)氣營(yíng)血和三焦辨證,使溫病學(xué)的辨證理論逐步趨于完善,至今仍是指導(dǎo)臨床治療溫?zé)岵〉睦碚撘罁?jù)?傊瑐鹘y(tǒng)中醫(yī)臨床理論的構(gòu)建和完善,離不開(kāi)前人的摸索與貢獻(xiàn),也得益于著名醫(yī)學(xué)家創(chuàng)建的傳統(tǒng)中醫(yī)理論,使得我們現(xiàn)在的中醫(yī)體系不斷的飽滿(mǎn)和充實(shí)。

  1.2當(dāng)代著名中醫(yī)的臨床經(jīng)驗(yàn)不斷提升為中醫(yī)臨床理論

  傳統(tǒng)中醫(yī)的臨床理論,在很大程度上展示著著名醫(yī)家的臨床經(jīng)驗(yàn)。在中醫(yī)理論與實(shí)踐發(fā)展的相互促進(jìn)過(guò)程中,當(dāng)代醫(yī)家通過(guò)讀書(shū)、臨證、心悟?qū)?shí)踐經(jīng)驗(yàn)不斷總結(jié)并升華為理論,又在實(shí)踐中不斷完善既有的理論,成為中醫(yī)理論發(fā)展的重要途徑和模式,而當(dāng)代中醫(yī)理論的發(fā)展則需要將傳統(tǒng)理論與現(xiàn)代實(shí)踐相互融合起來(lái)。例如上世紀(jì)60年代時(shí),面對(duì)中醫(yī)基礎(chǔ)理論中新的思想相對(duì)匱乏的這一局面,鄧鐵濤結(jié)合其治療的臨床經(jīng)驗(yàn),首次提出了“五臟相關(guān)學(xué)說(shuō)”。盡管當(dāng)時(shí)的理論準(zhǔn)備并不完善,但是這一理論的提出,在很大程度上完善并且取代了“五行學(xué)說(shuō)”中某些模糊性和不確定性,并且隨著時(shí)代的發(fā)展,逐漸驗(yàn)證了鄧?yán)系倪@一經(jīng)驗(yàn)的正確性,也成為指導(dǎo)中醫(yī)臨床理論的一大重要體系[2]。又如,腦出血這一現(xiàn)代疾病在古代名為中風(fēng),多數(shù)是“從風(fēng)而治”,認(rèn)為肝臟與中風(fēng)的關(guān)系最為密切。隨著時(shí)代的推進(jìn),自20世紀(jì)80年代以來(lái),許多學(xué)者根據(jù)微觀(guān)辨證和中醫(yī)理論“離經(jīng)之血便是瘀”,提出急性出血中風(fēng)屬中醫(yī)血證,瘀血阻滯是急性期腦出血的最基本病機(jī),是治療的關(guān)鍵所在[3]。故現(xiàn)代中醫(yī)臨床治療上多以活血化瘀法治療腦出血、腦梗塞這一系列疾病。若是仔細(xì)研讀傳統(tǒng)中醫(yī)臨床理論后,我們不難得出其構(gòu)成和完善離不開(kāi)當(dāng)代著名醫(yī)家的臨床經(jīng)驗(yàn),它是在歷經(jīng)歲月的洗禮下不斷塑造成型的。

  1.3傳統(tǒng)中醫(yī)臨床理論不斷將現(xiàn)代醫(yī)學(xué)相關(guān)內(nèi)容中醫(yī)化

  傳統(tǒng)中醫(yī)臨床理論不斷吸收現(xiàn)代醫(yī)學(xué)的理論,將其相關(guān)內(nèi)容不斷中醫(yī)化,將病人的各種證型通過(guò)五臟辨證、陰陽(yáng)五行辨證以及八綱辨證劃分得越來(lái)越細(xì)化,以提供病人在中醫(yī)臨床上治療的理論依據(jù)。中醫(yī)吸取了現(xiàn)代醫(yī)學(xué)理論后正在不斷壯大其內(nèi)容,現(xiàn)代醫(yī)學(xué)相關(guān)內(nèi)容中醫(yī)化在許多難治疾病的辨證治療中都起到了良好的指導(dǎo)作用[4]。如艾滋病是古代傳統(tǒng)中醫(yī)辨證論治的空白,通過(guò)對(duì)艾滋病中醫(yī)病因病機(jī)、證候規(guī)律、治法方藥的系統(tǒng)研究,提出了“艾毒傷元”“脾為樞機(jī)”“氣虛為本”的病因病機(jī)學(xué)說(shuō),確立了艾滋病“培元解毒”“益氣健脾”的治療原則,為中醫(yī)藥防治艾滋病奠定了理論基礎(chǔ),為進(jìn)一步提高艾滋病的中醫(yī)藥臨床診療效果提供理論依據(jù)[5]。

  2當(dāng)前中醫(yī)臨床理論發(fā)展存在的不足

  2.1中醫(yī)主流理論不突出且與時(shí)俱進(jìn)力度不夠

  不可否認(rèn)的是,當(dāng)代的中醫(yī)臨床理論發(fā)展也是存在諸多不足的,中醫(yī)理論的完善和發(fā)展是中華五千年來(lái)集體智慧的結(jié)晶,個(gè)別醫(yī)家提出的臨床理論可能各有千秋,其所立的角度和思維也不盡相同。例如,同是治療輸卵管阻塞這一疾病時(shí),朱南孫教授認(rèn)為多是由于濕蘊(yùn)沖任所致,其用自擬的清熱利濕方來(lái)進(jìn)行治療;而李廣文教授則認(rèn)為這一疾病多是由于瘀血阻絡(luò)為主,治療上以活血祛瘀為法,擬通任種子湯進(jìn)行治療[6]。又如對(duì)于“和解法”這一治療方法的理解,當(dāng)代名醫(yī)蒲輔周老先生認(rèn)為“寒熱并用,補(bǔ)瀉合劑,表里雙解,苦辛分消,調(diào)和氣血,皆謂和解”。而方和謙教授則認(rèn)為“在治法上扶正祛邪,表里兼顧,此法就為和解法”。不同的醫(yī)家在面對(duì)不同的疾病,甚至是不同的理法方藥時(shí),所持的看法常常是“各家學(xué)說(shuō)”,這就導(dǎo)致了當(dāng)前中醫(yī)臨床理論發(fā)展比較混亂,不能全面地體現(xiàn)中國(guó)五千年來(lái)發(fā)展過(guò)程中的中醫(yī)主流理論。目前中醫(yī)基礎(chǔ)理論還存在一個(gè)缺陷就是它的與時(shí)俱進(jìn)力度還不夠,很多古代經(jīng)典方藥的主治病癥,在當(dāng)今時(shí)代已經(jīng)不再多見(jiàn)了。比如蛔蟲(chóng)導(dǎo)致的蛔厥這一致病因素在現(xiàn)代已經(jīng)不再常見(jiàn),對(duì)應(yīng)的烏梅丸的主要適應(yīng)病癥也不再是蛔厥;在針對(duì)沒(méi)有明顯臨床表現(xiàn)的疾病如乙肝時(shí),按傳統(tǒng)中醫(yī)往往體現(xiàn)出“無(wú)證可治”的狀態(tài);傳統(tǒng)的診斷與現(xiàn)代檢查相結(jié)合的力度也不夠,中醫(yī)臨床基礎(chǔ)理論在某些程度上忽略了其與生化、B超、X光、CT等現(xiàn)代檢查結(jié)果的結(jié)合,并沒(méi)有用中醫(yī)理論對(duì)其做一合理的陳述;且現(xiàn)在臨床上很多中藥的藥理作用、性味歸經(jīng)的研究作用還不夠深入、細(xì)致,其作用不能在微觀(guān)上得以解釋。這些都導(dǎo)致了臨床上很多情況沒(méi)有從中醫(yī)理論來(lái)認(rèn)識(shí)中醫(yī),不是“以中解中”,而是“以西解中”,形成了臨床拋棄中醫(yī)理論的狀態(tài)[7]。由于中醫(yī)學(xué)是一門(mén)實(shí)踐性很強(qiáng)的學(xué)科,它是在哲學(xué)辨證的思想指導(dǎo)下,與臨床經(jīng)驗(yàn)不斷結(jié)合,這與西醫(yī)知識(shí)體系相比較,難免存在一定的滯后性,這都會(huì)使得中醫(yī)臨床理論發(fā)展相對(duì)的落后。

  2.2部分中醫(yī)理論帶有權(quán)威專(zhuān)家的“個(gè)人學(xué)說(shuō)”偏見(jiàn)

  傳統(tǒng)中醫(yī)強(qiáng)調(diào)個(gè)人經(jīng)驗(yàn)和學(xué)說(shuō),以中醫(yī)內(nèi)科學(xué)為例,第八版中的腦系疾病在第九版中已經(jīng)刪除,其涉及到的各種腦系疾病大多數(shù)歸屬于心系疾病與肝系疾病。根據(jù)其版本的不同,我們可以明顯看出其凸顯的中心內(nèi)容及其思想不同,其多是體現(xiàn)編著者的理論思想,在一定程度上并沒(méi)有客觀(guān)地揭示疾病的本質(zhì),治療理論也不夠完善,一部分內(nèi)容與最新研究得出的論文理論不符,這使得當(dāng)代中醫(yī)臨床理論在某些程度上,帶有權(quán)威專(zhuān)家的“個(gè)人學(xué)說(shuō)”色彩。由于現(xiàn)代西方先進(jìn)的科技文化流入,使得中醫(yī)在一定程度上備受質(zhì)疑,而正是因?yàn)槿藗儗?duì)于中醫(yī)理論的一些偏見(jiàn),才使得中醫(yī)長(zhǎng)期讓人詬病。

  3新的時(shí)代背景下中醫(yī)臨床理論發(fā)展方向

  3.1臨床理論應(yīng)具有真實(shí)性與系統(tǒng)性

  中醫(yī)臨床理論的發(fā)展方形應(yīng)當(dāng)是建立在客觀(guān)并且真實(shí)的臨床實(shí)踐基礎(chǔ)上,從一次次臨床實(shí)踐中得出。由于歷史時(shí)代的原因以及假設(shè)推理、模式建設(shè)的廣泛使用,當(dāng)代中醫(yī)臨床理論中理論與假說(shuō)并存的現(xiàn)象較為普遍,如中醫(yī)的五運(yùn)六氣學(xué)說(shuō)對(duì)現(xiàn)代疫病預(yù)測(cè)和人體各經(jīng)絡(luò)臟腑在時(shí)間上對(duì)于人體治病效果的不同等,就需要我們?cè)谠鷮?shí)的文獻(xiàn)與臨床實(shí)踐基礎(chǔ)上,對(duì)醫(yī)案進(jìn)行認(rèn)真總結(jié),利用科學(xué)的方法深入挖掘,開(kāi)展中醫(yī)理論的去偽存真研究,以促進(jìn)中醫(yī)理論的科學(xué)與健康發(fā)展。另外,傳統(tǒng)的中醫(yī)臨床治療上所用的理法方藥,多是根據(jù)個(gè)人經(jīng)驗(yàn)所進(jìn)行的。隨著科技的不斷發(fā)展與時(shí)代的不斷進(jìn)步,當(dāng)代的中醫(yī)臨床理論應(yīng)該在成功的中醫(yī)醫(yī)案上進(jìn)行系統(tǒng)的總結(jié),不斷挖掘和研究其微觀(guān)的結(jié)構(gòu),并隨著年月的更迭不斷更新,不斷完善,使其具有科學(xué)性和理論依據(jù)。同時(shí),對(duì)近年來(lái)興起的傳染性非典型肺炎、艾滋病、禽流感等古人所沒(méi)有經(jīng)歷過(guò)的疾病的診治,中醫(yī)就其病因病機(jī)的認(rèn)識(shí)以及探究相應(yīng)的診療方法,無(wú)疑也是一種理論上的創(chuàng)新[8]。通過(guò)對(duì)其進(jìn)行深一層次的研究和發(fā)現(xiàn),歸納出合適的治則治法,找到針對(duì)這一疾病的理法方藥,使其更具有系統(tǒng)性,使得臨床上中醫(yī)治病可以循序漸進(jìn),注重整體,也是當(dāng)代臨床理論的一大發(fā)展方向。

  3.2臨床理論具有信息化的特點(diǎn)并可持續(xù)拓展

  隨著時(shí)代的`進(jìn)步,當(dāng)代的中醫(yī)臨床理論可以通過(guò)網(wǎng)絡(luò)等方式進(jìn)行共享,在大數(shù)據(jù)的這一時(shí)代背景下,隨著病案的不斷報(bào)道與積累,可以將各類(lèi)成功的中醫(yī)醫(yī)案進(jìn)行統(tǒng)計(jì)和挖掘,其結(jié)果也會(huì)不斷進(jìn)行更新和發(fā)展。不同的醫(yī)家對(duì)于某一疾病的認(rèn)識(shí)角度可能不同,其表現(xiàn)在病位、病性、病勢(shì)和證候的判斷標(biāo)準(zhǔn)也不一樣,因此方藥規(guī)律也不一樣。而通過(guò)統(tǒng)計(jì)某一中醫(yī)或西醫(yī)疾病的較大樣本病例,并對(duì)其進(jìn)行數(shù)據(jù)挖掘,可以得出整個(gè)中醫(yī)群體對(duì)于這一疾病診治的證候分布、治則治法、處方用藥等的規(guī)律,甚至可以根據(jù)統(tǒng)計(jì)的結(jié)果探索出新的方藥,分析他們的共同點(diǎn)和所在差異。將中醫(yī)臨床理論具有信息化的這一特點(diǎn)不斷地拓展下去,通過(guò)計(jì)算機(jī)等客觀(guān)科學(xué)的手段進(jìn)行分析,與主觀(guān)的名老中醫(yī)傳承模式相比,更具客觀(guān)性,更容易被臨床醫(yī)生接受,對(duì)各種疾病的中醫(yī)臨床用藥也更具有指導(dǎo)價(jià)值。

  4基于病案數(shù)據(jù)挖掘的中醫(yī)臨床理論重建

  4.1病案研究是中醫(yī)理論發(fā)展的重要基礎(chǔ)

  在當(dāng)今大數(shù)據(jù)的時(shí)代背景下,中醫(yī)固有的傳統(tǒng)整體論科學(xué)特征有了越來(lái)越多的可供改變的空間。這種變化既為其按照自身特有的規(guī)律發(fā)展特點(diǎn)帶來(lái)了機(jī)遇,也給未來(lái)中醫(yī)理論的發(fā)展提出了挑戰(zhàn)。同時(shí),學(xué)習(xí)醫(yī)案研究也是中醫(yī)學(xué)相關(guān)大學(xué)生們應(yīng)該學(xué)習(xí)的一項(xiàng)內(nèi)容。閱讀醫(yī)案是必要的訓(xùn)練,也是中醫(yī)入門(mén)的方法之一。醫(yī)案的故事性引人入勝,在自然而然中接受中醫(yī)思維方法和傳統(tǒng)文化知識(shí),同時(shí)醫(yī)案中所呈現(xiàn)的名醫(yī)風(fēng)范,醫(yī)德對(duì)學(xué)生起到潛移默化的影響,并培養(yǎng)對(duì)專(zhuān)業(yè)的熱愛(ài)[9]。病案客觀(guān)、真實(shí)地直接記錄疾病診斷和治療過(guò)程,醫(yī)案研究作為中醫(yī)理論發(fā)展過(guò)程中至關(guān)重要的一環(huán),是中醫(yī)理論發(fā)展的重要基礎(chǔ),以研究病案為基礎(chǔ),對(duì)于中醫(yī)理論的形成和臨床上中醫(yī)積累經(jīng)驗(yàn),都起到了一定的輔助提升作用。

  4.2數(shù)據(jù)挖掘方法是中醫(yī)理論發(fā)展的現(xiàn)代技術(shù)手段

  利用多種數(shù)據(jù)挖掘技術(shù)對(duì)中醫(yī)病案中的有關(guān)信息行進(jìn)行歸納、整理,是近年來(lái)傳承中醫(yī)臨床經(jīng)驗(yàn)的重要方法之一[10]。通過(guò)對(duì)同一種疾病的病案進(jìn)行數(shù)據(jù)挖掘以分析醫(yī)者的思路和探索其用藥的方法,對(duì)中醫(yī)臨床病案進(jìn)行規(guī)范化的整理,能夠深入總結(jié)其臨床經(jīng)驗(yàn),挖掘隱藏在大量病案背后的診治規(guī)律,甚至探索出新的方藥配伍,為中醫(yī)理論的發(fā)展提供一定的科學(xué)依據(jù)的同時(shí),使得中醫(yī)理論的發(fā)展越來(lái)越現(xiàn)代化,不僅僅只是停留在以前的靠讀書(shū)和個(gè)人經(jīng)驗(yàn)的結(jié)合,也為廣大的中醫(yī)在日后的臨床治療上提供了新的思路和方向。

  4.3臨床實(shí)踐推動(dòng)理論發(fā)展,賦予轉(zhuǎn)化醫(yī)學(xué)新的內(nèi)涵

  目前,我們通過(guò)并按數(shù)據(jù)挖掘來(lái)總結(jié)一些中醫(yī)對(duì)于治療同一種疾病所采取的診斷和用藥,可以獲得新的思路,并且為完善我們現(xiàn)有的中醫(yī)理論基礎(chǔ)可以提供可靠的理論支持。采用數(shù)據(jù)挖掘技術(shù)對(duì)中醫(yī)學(xué)術(shù)思想和臨證經(jīng)驗(yàn)進(jìn)行研究,可以全面解析其中的規(guī)律,分析中醫(yī)個(gè)體化診療信息特征,提煉出臨證經(jīng)驗(yàn)中蘊(yùn)藏的新理論、新力法,可以實(shí)現(xiàn)經(jīng)驗(yàn)的有效總結(jié)與傳承[11]。與此同時(shí),要求我們用發(fā)展的眼光將現(xiàn)代的科技手段整合加入到傳統(tǒng)的中醫(yī)學(xué)理論中去,推陳出新,通過(guò)臨床實(shí)踐與基礎(chǔ)理論的不斷結(jié)合,不斷完善,推動(dòng)祖國(guó)醫(yī)學(xué)現(xiàn)代化,譜寫(xiě)有關(guān)于中醫(yī)學(xué)在轉(zhuǎn)化醫(yī)學(xué)上新的篇章。

  參考文獻(xiàn)

  [1]劉向哲.中醫(yī)理論創(chuàng)新與發(fā)展的基礎(chǔ)和機(jī)遇[J].中醫(yī)學(xué)報(bào),2010,25(5):884-885.

  [2]邱仕君,吳玉生.在基礎(chǔ)理論與臨床醫(yī)學(xué)之間———對(duì)鄧鐵濤教授五臟相關(guān)學(xué)說(shuō)的理論思考[J].湖北民族學(xué)院學(xué)報(bào)(醫(yī)學(xué)版),2005,22(2):36-39.

  [3]顧寧,周仲英.通下法治療急性腦出血研究進(jìn)展[J].中國(guó)中醫(yī)急診,2000,9(5):227.

  [4]靳士英.鄧鐵濤教授學(xué)術(shù)成就管[J].現(xiàn)代醫(yī)院,2004(9):1-6.

  [5]許前磊,徐立然,郭會(huì)軍,等.艾滋病發(fā)病與防治中醫(yī)理論的初步構(gòu)建[J].中醫(yī)雜志,2015,56(11):909-911.

  [6]張少聰,周偉生.名老中醫(yī)驗(yàn)方治療輸卵管阻塞性不孕癥概況[J].中華中醫(yī)藥學(xué)刊,2010(3):489-491.

  [7]孟靜巖,應(yīng)森林.試論中醫(yī)基礎(chǔ)理論指導(dǎo)臨床研究的思考與途徑[J].上海中醫(yī)藥大學(xué)學(xué)報(bào),2009(3):3-5.

  [8]邢玉瑞.新形勢(shì)下中醫(yī)理論發(fā)展的思考[J].中醫(yī)雜志,2016,57(18):1540-1542.

  [9]盧峰,聶達(dá)榮,彭美玉,等.中醫(yī)內(nèi)科學(xué)應(yīng)用名老中醫(yī)病案教學(xué)法的探索[J].中國(guó)中醫(yī)藥現(xiàn)代遠(yuǎn)程教育,2014(18):80-82.

  [10]郭軍.基于數(shù)據(jù)挖掘分析前名老中醫(yī)病案整理的思路與方法[J].中醫(yī)藥信息,2011,28(2):49-50.

  [11]吳嘉瑞,唐仕歡,郭位先,等.基于數(shù)據(jù)挖掘的名老中醫(yī)經(jīng)驗(yàn)傳承研究述評(píng)[J].中國(guó)中藥雜志,2014,39(4):614-617.

數(shù)據(jù)挖掘論文3

  引言 數(shù)據(jù)挖掘是指從數(shù)據(jù)集合中自動(dòng)抽取隱藏在數(shù)據(jù)中的那些有用信息的非平凡過(guò)程,這些信息的表現(xiàn)形式為:規(guī)則、概念、規(guī)律及模式等。它可幫助決策者分析歷史數(shù)據(jù)及當(dāng)前數(shù)據(jù),并從中發(fā)現(xiàn)隱藏的關(guān)系和模式,進(jìn)而預(yù)測(cè)未來(lái)可能發(fā)生的行為。數(shù)據(jù)挖掘的過(guò)程也叫知識(shí)發(fā)現(xiàn)的過(guò)程。

  一、數(shù)據(jù)挖掘技術(shù) 數(shù)據(jù)挖掘就是指

  從數(shù)據(jù)庫(kù)中發(fā)現(xiàn)知識(shí)的過(guò)程。包括存儲(chǔ)和處理數(shù)據(jù),選擇處理大量數(shù)據(jù)集的算法、解釋結(jié)果、使結(jié)果可視化。整個(gè)過(guò)程中支持人機(jī)交互的模式。數(shù)據(jù)挖掘從許多交叉學(xué)科中得到發(fā)展,并有很好的前景。這些學(xué)科包括數(shù)據(jù)庫(kù)技術(shù)、機(jī)器學(xué)習(xí)、人工智能、模式識(shí)別、統(tǒng)計(jì)學(xué)、模糊推理、專(zhuān)家系統(tǒng)、數(shù)據(jù)可視化、空間數(shù)據(jù)分析和高性能計(jì)算等。數(shù)據(jù)挖掘綜合以上領(lǐng)域的理論、算法和方法,已成功應(yīng)用在超市、金融、銀行、生產(chǎn)企業(yè)和電信,并有很好的表現(xiàn)。

  二、數(shù)據(jù)挖掘的過(guò)程

  挖掘數(shù)據(jù)過(guò)程可以分為3個(gè)步驟:數(shù)據(jù)預(yù)處理、模式發(fā)現(xiàn)、模式分析。

  (1)數(shù)據(jù)預(yù)處理。實(shí)際系統(tǒng)中的數(shù)據(jù)一般都具有不完全性、冗余性和模糊性。因此,數(shù)據(jù)挖掘一般不對(duì)原始數(shù)據(jù)進(jìn)行挖掘,要通過(guò)預(yù)處理提供準(zhǔn)確、簡(jiǎn)潔的數(shù)據(jù)。預(yù)處理主要完成以下工作:包括合并數(shù)據(jù),將多個(gè)文件或多個(gè)數(shù)據(jù)庫(kù)中的數(shù)據(jù)進(jìn)行合并處理;選擇數(shù)據(jù),提取出適合分析的數(shù)據(jù)集合;數(shù)據(jù)清洗、過(guò)濾,剔除一些無(wú)關(guān)記錄,將文件、圖形、圖像及多媒體等文件轉(zhuǎn)換成可便于數(shù)據(jù)挖掘的格式等。

  (2)模式發(fā)現(xiàn)。模式發(fā)現(xiàn)階段就是利用挖掘算法挖掘出有效的、新穎的、潛在的、有用的以及最終可以理解的信息和知識(shí)?捎糜赪eb的挖掘技術(shù)有路徑選擇、關(guān)聯(lián)分析、分類(lèi)規(guī)則、聚類(lèi)分析、序列分析、依賴(lài)性建模等等。

  (3)模式分析。模式分析是從模式發(fā)現(xiàn)階段獲得的模式、規(guī)則中過(guò)濾掉不感興趣的規(guī)則和模式。通過(guò)技術(shù)手段,對(duì)得到的模式進(jìn)行數(shù)據(jù)分析,得出有意義的結(jié)論。常用的技術(shù)手段有:關(guān)聯(lián)規(guī)則、分類(lèi)、聚類(lèi)、序列模式等。

  三、數(shù)據(jù)挖掘在電力系統(tǒng)負(fù)荷預(yù)測(cè)中的應(yīng)用

  電力負(fù)荷預(yù)測(cè)是能量管理系統(tǒng)及配電管理系統(tǒng)的重要組成部分,是電力系統(tǒng)規(guī)劃和運(yùn)行調(diào)度的依據(jù),也是電力市場(chǎng)化商業(yè)運(yùn)營(yíng)所必需的基本內(nèi)容。負(fù)荷預(yù)測(cè)工作的關(guān)鍵在于收集大量的歷史數(shù)據(jù),建立科學(xué)有效的預(yù)測(cè)模型,采用有效的算法,以歷史數(shù)據(jù)為基礎(chǔ),進(jìn)行大量試驗(yàn)性研究,總結(jié)經(jīng)驗(yàn),不斷修正模型和算法,以真正反映負(fù)荷變化規(guī)律。其過(guò)程為:

  (1) 調(diào)查和選擇歷史負(fù)荷數(shù)據(jù)資料

  多方面調(diào)查收集資料,包括電力企業(yè)內(nèi)部資料和外部資料,從眾多的資料中挑選出有用的一小部分,即把資料濃縮到最小量。挑選資料時(shí)的標(biāo)準(zhǔn)要直接、可靠并且是最新的資料。如果資料的收集和選擇得不好,會(huì)直接影響負(fù)荷預(yù)測(cè)的質(zhì)量。通過(guò)建立計(jì)算機(jī)數(shù)據(jù)管理系統(tǒng),利用計(jì)算機(jī)軟件系統(tǒng)來(lái)自動(dòng)管理數(shù)據(jù)。

  (2) 負(fù)載數(shù)據(jù)預(yù)處理

  經(jīng)過(guò)初步整理,還用于數(shù)據(jù)分析的預(yù)處理,平滑異常值的歷史數(shù)據(jù)和缺失數(shù)據(jù)的異常數(shù)據(jù)主要是水平的,垂直的方法附錄。正在分析數(shù)據(jù)之前和之后的兩個(gè)時(shí)間的負(fù)載數(shù)據(jù)作為基準(zhǔn),來(lái)設(shè)置要處理的數(shù)據(jù)時(shí),要處理的數(shù)據(jù)的范圍中最大的變化的數(shù)據(jù)的處理的水平超過(guò)該范圍時(shí),它被認(rèn)為是壞的數(shù)據(jù),使用平均法平滑變化;垂直負(fù)載數(shù)據(jù)預(yù)處理中的數(shù)據(jù)處理的考慮其24小時(shí)的小循環(huán),即,相同的時(shí)間的日期不同的負(fù)載應(yīng)具有相似的,同時(shí)負(fù)載值應(yīng)保持在一定范圍內(nèi),校正外的范圍內(nèi)的數(shù)據(jù)進(jìn)行處理,在最近幾天的壞數(shù)據(jù),力矩載荷的意思。

  (3) 歷史資料的整理

  一般來(lái)說(shuō),由于預(yù)測(cè)的質(zhì)量不會(huì)超過(guò)所用資料的質(zhì)量,所以要對(duì)所收集的與負(fù)荷有關(guān)的統(tǒng)計(jì)資料進(jìn)行審核和必要的加工整理,來(lái)保證資料的質(zhì)量,從而為保證預(yù)測(cè)質(zhì)量打下基礎(chǔ),即要注意資料的完整無(wú)缺,數(shù)字準(zhǔn)確無(wú)誤,反映的都是正常狀態(tài)下的水平,資料中沒(méi)有異常的.“分離項(xiàng)”,還要注意資料的補(bǔ)缺,并對(duì)不可靠的資料加以核實(shí)調(diào)整。通過(guò)建立數(shù)據(jù)完整性、一致性約束模型,來(lái)建立海量數(shù)據(jù)集為后面的數(shù)據(jù)挖掘做好充分的準(zhǔn)備。

  (4) 建立負(fù)荷預(yù)測(cè)模型

  負(fù)荷預(yù)測(cè)模型是統(tǒng)計(jì)資料軌跡的概括,預(yù)測(cè)模型是多種多樣的,因此,對(duì)于具體資料要選擇恰當(dāng)?shù)念A(yù)測(cè)模型,這是負(fù)荷預(yù)測(cè)過(guò)程中至關(guān)重要的一步。當(dāng)由于模型選擇不當(dāng)而造成預(yù)測(cè)誤差過(guò)大時(shí),就需要改換模型,必要時(shí),還可同時(shí)采用幾種數(shù)學(xué)模型進(jìn)行運(yùn)算,以便對(duì)比、選擇。

  (5) 選擇算法

  選擇聚類(lèi)法又稱(chēng)聚類(lèi)分析法,它是對(duì)一組負(fù)荷影響因素?cái)?shù)據(jù)進(jìn)行聚類(lèi)的方法,聚類(lèi)后的數(shù)據(jù)即構(gòu)成了一組分類(lèi)。聚類(lèi)的標(biāo)準(zhǔn)是以數(shù)據(jù)的表象(即數(shù)據(jù)屬性 值)為依據(jù)的,聚類(lèi)的工具是將一組數(shù)據(jù)按表象而將相近的歸并成類(lèi),最終形成若干個(gè)類(lèi),在類(lèi)內(nèi)數(shù)據(jù)具有表象的相似性,而類(lèi)間的數(shù)據(jù)具有表象的相異性。聚類(lèi)的算法也有很多,有遺傳算法,劃分法,層次法,基于密度方法,基于網(wǎng)格方法等。 四、CURE算法在負(fù)荷預(yù)測(cè)中的應(yīng)用 CURE算法是一種分層聚類(lèi)算法。典型的數(shù)據(jù)點(diǎn)來(lái)表示一個(gè)具有固定數(shù)目的聚類(lèi)。的CURE算法需要作為參數(shù)輸入的群集數(shù)?。由于CURE聚類(lèi)的代表點(diǎn)的某些有代表性的,可以發(fā)現(xiàn)具有任何尺寸和形狀的聚類(lèi)。同時(shí),在一個(gè)集群代表點(diǎn)的選擇方式的中心“縮水”排除“噪音”。

  歷史上第一個(gè)數(shù)據(jù)庫(kù)負(fù)荷預(yù)測(cè),數(shù)據(jù)提取樣品。的數(shù)據(jù)樣本聚類(lèi),可以分為兩種方法:一個(gè)是所有樣本數(shù)據(jù)進(jìn)行聚類(lèi),這個(gè)方法會(huì)使主內(nèi)存容量是遠(yuǎn)遠(yuǎn)不夠的,系統(tǒng)無(wú)法掃描一次完成。我們使用所有的樣本數(shù)據(jù)被分成多個(gè)區(qū)域,每個(gè)區(qū)域的數(shù)據(jù)進(jìn)行聚類(lèi),使每個(gè)分區(qū)可以品嘗到所有的數(shù)據(jù)加載到主內(nèi)存。然后,針對(duì)每個(gè)分區(qū),使用分層算法的聚類(lèi)。

  電力系統(tǒng)的應(yīng)用SCADA系統(tǒng)中的數(shù)據(jù)測(cè)量、記錄、轉(zhuǎn)換、傳輸、收集數(shù)據(jù),并可能導(dǎo)致故障和負(fù)載數(shù)據(jù)丟失或異常。異常數(shù)據(jù)的生成是隨機(jī)的,因此,在數(shù)據(jù)庫(kù)中的不確定性的分布,不同類(lèi)型的異常數(shù)據(jù)出現(xiàn)單獨(dú)或在一個(gè)特定的時(shí)刻,或交叉混合發(fā)生在同一天連續(xù),或在相同的連續(xù)天期的橫分布,以及許多其他場(chǎng)合。異常數(shù)據(jù)的處理的關(guān)鍵影響的預(yù)測(cè)結(jié)果的準(zhǔn)確性。使用兩種不同的技術(shù),以刪除異常。第一種技術(shù)是要?jiǎng)h除的集群增長(zhǎng)緩慢。當(dāng)簇的數(shù)量低于某一閾值,將只包含一個(gè)或兩個(gè)集群成員的刪除,第二種方法是在集群的最后階段,非常小的集群中刪除。

  最后對(duì)樣本中的全部數(shù)據(jù)進(jìn)行聚類(lèi),為了保證可以在內(nèi)存中處理,輸入只包括各個(gè)分區(qū)獨(dú)自聚類(lèi)時(shí)發(fā)現(xiàn)的簇的代表性點(diǎn)。使用c個(gè)點(diǎn)代表每個(gè)簇,對(duì)磁盤(pán)上的整個(gè)數(shù)據(jù)庫(kù)進(jìn)行聚類(lèi)。數(shù)據(jù)庫(kù)中的數(shù)據(jù)項(xiàng)被分配到與最近的代表性點(diǎn)表示的簇中。代表性點(diǎn)的集合必須足夠小以適應(yīng)主存的大小。

  結(jié)束語(yǔ)

  數(shù)據(jù)挖掘技術(shù)雖然得到了一定程度的應(yīng)用,并取得了顯著成效,但仍存在著許多尚未解決的問(wèn)題。隨著人們對(duì)數(shù)據(jù)挖掘技術(shù)的深人研究,數(shù)據(jù)挖掘技術(shù)必將更加成熟,并取得更加顯著的效果。

數(shù)據(jù)挖掘論文4

  摘要:該文通過(guò)介紹電子商務(wù)及數(shù)據(jù)挖掘基本知識(shí),分別從幾個(gè)方面分析了電子商務(wù)中WEB數(shù)據(jù)挖掘技術(shù)的應(yīng)用。

  關(guān)鍵詞:電子商務(wù);數(shù)據(jù)挖掘;應(yīng)用

  1概述

  電子商務(wù)是指企業(yè)或個(gè)人以網(wǎng)絡(luò)為載體,應(yīng)用電子手段,利用現(xiàn)代信息技術(shù)進(jìn)行商務(wù)數(shù)據(jù)交換和開(kāi)展商務(wù)業(yè)務(wù)的活動(dòng)。隨著互聯(lián)網(wǎng)的迅速發(fā)展,電子商務(wù)比傳統(tǒng)商務(wù)具有更明顯的優(yōu)勢(shì),由于電子商務(wù)具有方便、靈活、快捷的特點(diǎn),使它已逐漸成為人們生活中不可缺少的活動(dòng)。目前電子商務(wù)平臺(tái)網(wǎng)站多,行業(yè)競(jìng)爭(zhēng)強(qiáng),為了獲得更多的客戶(hù)資源,電子商務(wù)網(wǎng)站必須加強(qiáng)客戶(hù)關(guān)系管理、改善經(jīng)營(yíng)理念、提升售后服務(wù)。數(shù)據(jù)挖掘是從數(shù)據(jù)集中識(shí)別出隱含的、潛在有用的、有效的,新穎的、能夠被理解的信息和知識(shí)的過(guò)程。由數(shù)據(jù)集合做出歸納推理,從中挖掘并進(jìn)行商業(yè)預(yù)判,能夠幫助電子商務(wù)企業(yè)決策層依據(jù)預(yù)判,對(duì)市場(chǎng)策略調(diào)整,將企業(yè)風(fēng)險(xiǎn)降低,從而做出正確的決策,企業(yè)利潤(rùn)將最大化。隨著電子商務(wù)的應(yīng)用日益廣泛,電子商務(wù)活動(dòng)中會(huì)產(chǎn)生大量有用的數(shù)據(jù),如何能夠數(shù)據(jù)挖掘出數(shù)據(jù)的參考價(jià)值?研究客戶(hù)的興趣和愛(ài)好,對(duì)客戶(hù)分門(mén)別類(lèi),將客戶(hù)心儀的商品分別推薦給相關(guān)客戶(hù)。因此,如何在電子商務(wù)平臺(tái)上進(jìn)行數(shù)據(jù)挖掘成為研究的熱點(diǎn)問(wèn)題。

  2數(shù)據(jù)挖掘技術(shù)概述

  數(shù)據(jù)挖掘(DataMining),也稱(chēng)數(shù)據(jù)庫(kù)中的知識(shí)發(fā)現(xiàn)(KnowledgeDiscoveryinDatabase,KDD)。數(shù)據(jù)挖掘一般是指從海量數(shù)據(jù)中應(yīng)用算法查找出隱藏的、未知的信息的過(guò)程。數(shù)據(jù)挖掘是一個(gè)在大數(shù)據(jù)資源中利用分析工具發(fā)現(xiàn)模型與數(shù)據(jù)之間關(guān)系的一個(gè)過(guò)程,數(shù)據(jù)挖掘?qū)Q策者尋找數(shù)據(jù)間潛在的某種關(guān)聯(lián),發(fā)現(xiàn)隱藏的因素起著關(guān)鍵作用。這些模式是有潛在價(jià)值的、并能夠被理解的。數(shù)據(jù)挖掘?qū)⑷斯ぶ悄、機(jī)器學(xué)習(xí)、數(shù)據(jù)庫(kù)、統(tǒng)計(jì)、可視化、信息檢索、并行計(jì)算等多個(gè)領(lǐng)域的理論與技術(shù)融合在一起的一門(mén)多學(xué)科交叉學(xué)問(wèn),這些學(xué)科也對(duì)數(shù)據(jù)挖掘提供了很大的技術(shù)支撐。

  3Web數(shù)據(jù)挖掘特點(diǎn)

  Web數(shù)據(jù)挖掘就是數(shù)據(jù)挖掘在Web中的應(yīng)用。Web數(shù)據(jù)挖掘的目的是從萬(wàn)維網(wǎng)的網(wǎng)頁(yè)的內(nèi)容、超鏈接的結(jié)構(gòu)及使用日志記錄中找到有價(jià)值的'數(shù)據(jù)或信息。依據(jù)挖掘過(guò)程中使用的數(shù)據(jù)類(lèi)別,Web數(shù)據(jù)挖掘任務(wù)可分為:Web內(nèi)容挖掘、Web結(jié)構(gòu)挖掘、Web使用記錄挖掘。

  1)Web內(nèi)容挖掘指從網(wǎng)頁(yè)中提取文字、圖片或其他組成網(wǎng)頁(yè)內(nèi)容的信息,挖掘?qū)ο笸ǔ0谋、圖形、音視頻、多媒體以及其他各種類(lèi)型數(shù)據(jù)。

  2)Web結(jié)構(gòu)挖掘是對(duì)Web頁(yè)面之間的結(jié)構(gòu)進(jìn)行挖掘,挖掘描述內(nèi)容是如何組織的,從Web的超鏈接結(jié)構(gòu)中尋找Web結(jié)構(gòu)和頁(yè)面結(jié)構(gòu)中的有價(jià)值模式。例如從這些鏈接中,我們可以找出哪些是重要的網(wǎng)頁(yè),依據(jù)網(wǎng)頁(yè)的主題,進(jìn)行自動(dòng)的聚類(lèi)和分類(lèi),為了不同的目的從網(wǎng)頁(yè)中根據(jù)模式獲取有用的信息,從而提高檢索的質(zhì)量及效率。

  3)Web使用記錄挖掘是根據(jù)對(duì)服務(wù)器上用戶(hù)訪(fǎng)問(wèn)時(shí)的訪(fǎng)問(wèn)記錄進(jìn)行挖掘的方法。Web使用挖掘?qū)⑷罩緮?shù)據(jù)映射為關(guān)系表并采用相應(yīng)的數(shù)據(jù)挖掘技術(shù)來(lái)訪(fǎng)問(wèn)日志數(shù)據(jù),對(duì)用戶(hù)點(diǎn)擊事件的搜集和分析發(fā)現(xiàn)用戶(hù)導(dǎo)航行為。它用來(lái)提取關(guān)于客戶(hù)如何瀏覽和使用訪(fǎng)問(wèn)網(wǎng)頁(yè)的鏈接信息。如訪(fǎng)問(wèn)了哪些頁(yè)面?在每個(gè)頁(yè)面中所停留的時(shí)間?下一步點(diǎn)擊了什么?在什么樣的路線(xiàn)下退出瀏覽的?這些都是Web使用記錄挖掘所關(guān)心要解決的問(wèn)題。

  4電子商務(wù)中Web挖掘中技術(shù)的應(yīng)用分析

  1)電子商務(wù)中序列模式分析的應(yīng)用

  序列模式數(shù)據(jù)挖掘就是要挖掘基于時(shí)間或其他序列的模式。如在一套按時(shí)間順序排列的會(huì)話(huà)或事務(wù)中一個(gè)項(xiàng)目有存在跟在另一個(gè)項(xiàng)目后面。通過(guò)這個(gè)方法,WEB銷(xiāo)售商可以預(yù)測(cè)未來(lái)的訪(fǎng)問(wèn)模式,以幫助針對(duì)特定用戶(hù)組進(jìn)行廣告排放設(shè)置。發(fā)現(xiàn)序列模式容易使客戶(hù)的行為被電子商務(wù)的組織者預(yù)測(cè),當(dāng)用戶(hù)瀏覽站點(diǎn)時(shí),盡可能地迎合每個(gè)用戶(hù)的瀏覽習(xí)慣并根據(jù)用戶(hù)感興趣的內(nèi)容不斷調(diào)整網(wǎng)頁(yè),盡可能地使每個(gè)用戶(hù)滿(mǎn)意。使用序列模式分析挖掘日志,可以發(fā)現(xiàn)客戶(hù)的訪(fǎng)問(wèn)序列模式。在萬(wàn)維網(wǎng)使用記錄挖掘應(yīng)用中,序列模式挖掘可以用于捕捉用戶(hù)路徑之中常用的導(dǎo)航路徑。當(dāng)用戶(hù)訪(fǎng)問(wèn)電子商務(wù)網(wǎng)站時(shí),網(wǎng)站管理員能夠搜索出這個(gè)訪(fǎng)問(wèn)者的對(duì)該網(wǎng)站的訪(fǎng)問(wèn)序列模式,將訪(fǎng)問(wèn)者感興趣但尚未瀏覽的頁(yè)面推薦給他。序列模式分析還能分析出商品購(gòu)買(mǎi)的前后順序,從而向客戶(hù)提出推薦。例如在搜索引擎是發(fā)出查詢(xún)請(qǐng)求、瀏覽網(wǎng)頁(yè)信息等,會(huì)彈出與這些信息相關(guān)的廣告。例如購(gòu)買(mǎi)了打印機(jī)的用戶(hù),一般不久就會(huì)購(gòu)買(mǎi)如打印紙、硒鼓等打印耗材。優(yōu)秀的推薦系統(tǒng)將為客戶(hù)建立一個(gè)專(zhuān)屬商店,由每個(gè)客戶(hù)的特征來(lái)調(diào)整網(wǎng)站的內(nèi)容。也能由挖掘出的一些序列模式分析網(wǎng)站及產(chǎn)品促銷(xiāo)的效果。

  2)電子商務(wù)中關(guān)聯(lián)規(guī)則的應(yīng)用

  關(guān)聯(lián)規(guī)則是揭示數(shù)據(jù)之間隱含的相互關(guān)系,關(guān)聯(lián)分析的任務(wù)是發(fā)現(xiàn)事物間的關(guān)聯(lián)規(guī)則或相關(guān)程序。關(guān)聯(lián)規(guī)則挖掘的目標(biāo)是在數(shù)據(jù)項(xiàng)目中找出每一個(gè)數(shù)據(jù)信息的內(nèi)在關(guān)系。關(guān)聯(lián)規(guī)則挖掘就是要搜索出用戶(hù)在服務(wù)器上訪(fǎng)問(wèn)的內(nèi)容、頁(yè)面、文件之間的聯(lián)系,從而改進(jìn)電子商務(wù)網(wǎng)站設(shè)計(jì)?梢愿迷诮M織站點(diǎn),減少用戶(hù)過(guò)濾網(wǎng)站信息的負(fù)擔(dān),哪些商品顧客會(huì)可能在一次購(gòu)物時(shí)同時(shí)購(gòu)買(mǎi)?關(guān)聯(lián)規(guī)則技術(shù)能夠通過(guò)購(gòu)物籃中的不同商品之間的聯(lián)系,分析顧客的購(gòu)物習(xí)慣。例如購(gòu)買(mǎi)牛奶的顧客90%會(huì)同時(shí)還購(gòu)買(mǎi)面包,這就是一條關(guān)聯(lián)規(guī)則,如果商店或電子商務(wù)網(wǎng)站將這兩種商品放在一起銷(xiāo)售,將會(huì)提高它們的銷(xiāo)量。關(guān)聯(lián)規(guī)則挖掘目標(biāo)是利用工具分析出顧客購(gòu)買(mǎi)商品間的聯(lián)系,也即典型購(gòu)物籃數(shù)據(jù)分析應(yīng)用。關(guān)聯(lián)規(guī)則是發(fā)現(xiàn)同類(lèi)事件中不同項(xiàng)目的相關(guān)性,例如手機(jī)加充電寶,鼠標(biāo)加鼠標(biāo)墊等購(gòu)買(mǎi)習(xí)慣就屬于關(guān)聯(lián)分析。關(guān)聯(lián)規(guī)則挖掘技術(shù)可以用相應(yīng)算法找出關(guān)聯(lián)規(guī)則,例如在上述例子中,商家可以依據(jù)商品間的關(guān)聯(lián)改進(jìn)商品的擺放,如果顧客購(gòu)買(mǎi)了手機(jī)則將充電寶放入推薦的商品中,如果一些商品被同時(shí)購(gòu)買(mǎi)的概率較大,說(shuō)明這些商品存在關(guān)聯(lián)性,商家可以將這些有關(guān)聯(lián)的商品鏈接放在一起推薦給客戶(hù),有利于商品的銷(xiāo)售,商家也根據(jù)關(guān)聯(lián)有效搭配進(jìn)貨,提升商品管理水平。如買(mǎi)了燈具的顧客,多半還會(huì)購(gòu)買(mǎi)開(kāi)關(guān)插座,因此,一般會(huì)將燈具與開(kāi)關(guān)插座等物品放在一個(gè)區(qū)域供顧客選購(gòu)。依據(jù)分析找出顧客所需要的商品的關(guān)聯(lián)規(guī)則,由挖掘分析結(jié)果向顧客推薦所需商品,也即向顧客提出可能會(huì)感興趣的商品推薦,將會(huì)大大提高商品的銷(xiāo)售量。

  3)電子商務(wù)中路徑分析技術(shù)的應(yīng)用

  路徑分析技術(shù)通過(guò)對(duì)Web服務(wù)器的日志文件中客戶(hù)訪(fǎng)問(wèn)站點(diǎn)的訪(fǎng)問(wèn)次數(shù)的分析,用來(lái)發(fā)現(xiàn)Web站點(diǎn)中最經(jīng)常訪(fǎng)問(wèn)的路徑來(lái)調(diào)整站點(diǎn)結(jié)構(gòu),從而幫助使用用戶(hù)以最快的速度找到其所需要的產(chǎn)品或是信息。例如在用戶(hù)訪(fǎng)問(wèn)某網(wǎng)站時(shí),如果有很多用戶(hù)不感興趣的頁(yè)面存在,就會(huì)影響用戶(hù)的網(wǎng)頁(yè)瀏覽速度,從而降低用戶(hù)的瀏覽興趣,同時(shí)也會(huì)使整個(gè)站點(diǎn)的維護(hù)成本提高。而利用路徑分析技術(shù)能夠全面地掌握網(wǎng)站各個(gè)頁(yè)面之間的關(guān)聯(lián)以及超鏈接之間的聯(lián)系,通過(guò)分析得出訪(fǎng)問(wèn)頻率最高的頁(yè)面,從而改進(jìn)網(wǎng)站結(jié)構(gòu)及頁(yè)面的設(shè)計(jì)。

  4)電子商務(wù)中分類(lèi)分析的應(yīng)用

  分類(lèi)技術(shù)在根據(jù)各種預(yù)定義規(guī)則進(jìn)行用戶(hù)建模的Web分析應(yīng)用中扮演著很重要的角色。例如,給出一組用戶(hù)事務(wù),可以計(jì)算每個(gè)用戶(hù)在某個(gè)期間內(nèi)購(gòu)買(mǎi)記錄總和;谶@些數(shù)據(jù),可以建立一個(gè)分類(lèi)模型,將用戶(hù)分成有購(gòu)買(mǎi)傾向和沒(méi)有購(gòu)買(mǎi)傾向兩類(lèi),考慮的特征如用戶(hù)統(tǒng)計(jì)屬性以及他們的導(dǎo)航活動(dòng)。分類(lèi)技術(shù)既可以用于預(yù)測(cè)哪些購(gòu)買(mǎi)客戶(hù)對(duì)于哪類(lèi)促銷(xiāo)手段感興趣,也可以預(yù)測(cè)和劃分顧客類(lèi)別。在電子商務(wù)中通過(guò)分類(lèi)分析,可以得知各類(lèi)客戶(hù)的興趣愛(ài)好和商品購(gòu)買(mǎi)意向,因而發(fā)現(xiàn)一些潛在的購(gòu)買(mǎi)客戶(hù),從而為每一類(lèi)客戶(hù)提供個(gè)性化的網(wǎng)絡(luò)服務(wù)及開(kāi)展針對(duì)性的商務(wù)活動(dòng)。通過(guò)分類(lèi)定位模型輔助決策人員定位他們的最佳客戶(hù)和潛在客戶(hù),提高客戶(hù)滿(mǎn)意度及忠誠(chéng)度,最大化客戶(hù)收益率,以降低成本,增加收入。

  5)電子商務(wù)中聚類(lèi)分析的應(yīng)用

  聚類(lèi)技術(shù)可以將具有相同特征的數(shù)據(jù)項(xiàng)聚成一類(lèi)。聚類(lèi)分析是對(duì)數(shù)據(jù)庫(kù)中相關(guān)數(shù)據(jù)進(jìn)行對(duì)比并找出各數(shù)據(jù)之間的關(guān)系,將不同性質(zhì)特征的數(shù)據(jù)進(jìn)行分類(lèi)。聚類(lèi)分析的目標(biāo)是在相似的基礎(chǔ)上收集數(shù)據(jù)來(lái)分類(lèi)。根據(jù)具有相同或相似的顧客購(gòu)買(mǎi)行為和顧客特征,利用聚類(lèi)分析技術(shù)將市場(chǎng)有效地細(xì)分,細(xì)分后應(yīng)可每類(lèi)市場(chǎng)都制定有針對(duì)性的市場(chǎng)營(yíng)銷(xiāo)策略。聚類(lèi)分別有頁(yè)面聚類(lèi)和用戶(hù)聚類(lèi)兩種。用戶(hù)聚類(lèi)是為了建立擁有相同瀏覽模式的用戶(hù)分組,可以在電子中商務(wù)中進(jìn)行市場(chǎng)劃分或給具有相似興趣的用戶(hù)提供個(gè)性化的Web內(nèi)容,更多在用戶(hù)分組上基于用戶(hù)統(tǒng)計(jì)屬性(如年齡、性別、收入等)的分析可以發(fā)現(xiàn)有價(jià)值的商業(yè)智能。在電子商務(wù)中將市場(chǎng)進(jìn)行細(xì)化的區(qū)分就是運(yùn)用聚類(lèi)分析技術(shù)。聚類(lèi)分析可根據(jù)顧客的購(gòu)買(mǎi)行為來(lái)劃分不同顧客特征的不同顧客群,通過(guò)聚類(lèi)具有類(lèi)似瀏覽行為的客戶(hù),讓市場(chǎng)人員對(duì)顧客進(jìn)行類(lèi)別細(xì)分,能夠給顧客提供更人性化的貼心服務(wù)。比如通過(guò)聚類(lèi)技術(shù)分析,發(fā)現(xiàn)一些顧客喜歡訪(fǎng)問(wèn)有關(guān)汽車(chē)配件網(wǎng)頁(yè)內(nèi)容,就可以動(dòng)態(tài)改變站點(diǎn)內(nèi)容,讓網(wǎng)絡(luò)自動(dòng)地給這些顧客聚類(lèi)發(fā)送有關(guān)汽車(chē)配件的新產(chǎn)品信息或郵件。分類(lèi)和聚類(lèi)往往是相互作用的。在電子商務(wù)中通過(guò)聚類(lèi)行為或習(xí)性相似的顧客,給顧客提供更滿(mǎn)意的服務(wù)。技術(shù)人員在分析中先用聚類(lèi)分析將要分析的數(shù)據(jù)進(jìn)行聚類(lèi)細(xì)分,然后用分類(lèi)分析對(duì)數(shù)據(jù)集合進(jìn)行分類(lèi)標(biāo)記,再將該標(biāo)記重新進(jìn)行分類(lèi),一直如此循環(huán)兩種分析方法得到相對(duì)滿(mǎn)意的結(jié)果。

  5結(jié)語(yǔ)

  隨著互聯(lián)網(wǎng)的飛速發(fā)展,大數(shù)據(jù)分析應(yīng)用越來(lái)越廣。商業(yè)貿(mào)易中電子商務(wù)所占比例越來(lái)越大,使用web挖掘技術(shù)對(duì)商業(yè)海量數(shù)據(jù)進(jìn)行挖掘處理,分析客戶(hù)購(gòu)買(mǎi)喜好、跟蹤市場(chǎng)變化,調(diào)整銷(xiāo)售策略,對(duì)決策者做出有效決策及提高企業(yè)的市場(chǎng)競(jìng)爭(zhēng)力有重要意義。

  參考文獻(xiàn):

  [1]龐英智.Web數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中的應(yīng)用[J].情報(bào)科學(xué),20xx,29(2):235-240.

  [2]馬宗亞,張會(huì)彥.Web數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中的應(yīng)用研究[J].現(xiàn)代經(jīng)濟(jì)信息,20xx(6):23-24.

  [3]徐劍彬.Web數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中的應(yīng)用[J].時(shí)代金融,20xx(4):234-235.208

  [4]周世東.Web數(shù)據(jù)挖掘在電子商務(wù)中的應(yīng)用研究[D].北京交通大學(xué),20xx.

  [5]段紅英.Web數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中的應(yīng)用[J].隴東學(xué)院學(xué)報(bào),20xx(3):32-34.

數(shù)據(jù)挖掘論文5

  隨著互聯(lián)網(wǎng)技術(shù)的快速發(fā)展,學(xué)術(shù)研究環(huán)境較以前更加開(kāi)放,對(duì)傳統(tǒng)的科技出版業(yè)提出了開(kāi)放性、互動(dòng)性和快速性的要求; 因此,以信息技術(shù)為基礎(chǔ)的現(xiàn)代數(shù)字化出版方式對(duì)傳統(tǒng)的科技出版業(yè)產(chǎn)生著深刻的影響。為了順應(yīng)這一趨勢(shì),不少科技期刊都進(jìn)行了數(shù)字化建設(shè),構(gòu)建了符合自身情況、基于互聯(lián)網(wǎng)B /S 結(jié)構(gòu)的稿件處理系統(tǒng)。

  以中華醫(yī)學(xué)會(huì)雜志社為代表的部分科技期刊出版集團(tuán)均開(kāi)發(fā)使用了發(fā)行系統(tǒng)、廣告登記系統(tǒng)、在線(xiàn)銷(xiāo)售系統(tǒng)以及站。這些系統(tǒng)雖然積累了大量的原始用戶(hù)業(yè)務(wù)數(shù)據(jù); 但從工作系統(tǒng)來(lái)看,由于數(shù)據(jù)本身只屬于編輯部的業(yè)務(wù)數(shù)據(jù),因此一旦相關(guān)業(yè)務(wù)工作進(jìn)行完畢,將很少再對(duì)這些數(shù)據(jù)進(jìn)行分析使用。

  隨著目前人工智能和機(jī)器學(xué)習(xí)技術(shù)的發(fā)展,研究人員發(fā)現(xiàn)利用最新的數(shù)據(jù)挖掘方法可以對(duì)原始用戶(hù)業(yè)務(wù)數(shù)據(jù)進(jìn)行有效分析和學(xué)習(xí),找出其中數(shù)據(jù)背后隱含的內(nèi)在規(guī)律。這些有價(jià)值的規(guī)律和寶貴的經(jīng)驗(yàn)將對(duì)后續(xù)科技期刊經(jīng)營(yíng)等工作提供巨大的幫助。

  姚偉欣等指出,從STM 期刊出版平臺(tái)的技術(shù)發(fā)展來(lái)看,利用數(shù)據(jù)存取、數(shù)據(jù)管理、關(guān)聯(lián)數(shù)據(jù)分析、海量數(shù)據(jù)分析等數(shù)據(jù)挖掘技術(shù)將為科技期刊的出版和發(fā)行提供有力的幫助。通過(guò)使用數(shù)據(jù)挖掘( data mining) 等各種數(shù)據(jù)處理技術(shù),人們可以很方便地從大量不完全且含有噪聲或相對(duì)模糊的實(shí)際數(shù)據(jù)中,提取隱藏在其中有價(jià)值的信息,從而對(duì)后續(xù)科技期刊出版工作起到重要的知識(shí)發(fā)現(xiàn)和決策支持的作用。

  1 數(shù)據(jù)挖掘在科技期刊中應(yīng)用的現(xiàn)狀

  傳統(tǒng)的數(shù)據(jù)庫(kù)對(duì)數(shù)據(jù)的處理功能包括增、刪、改、查等。這些技術(shù)均無(wú)法發(fā)現(xiàn)數(shù)據(jù)內(nèi)在的關(guān)聯(lián)和規(guī)則,更無(wú)法根據(jù)現(xiàn)有數(shù)據(jù)對(duì)未來(lái)發(fā)展的趨勢(shì)進(jìn)行預(yù)測(cè),F(xiàn)有數(shù)據(jù)挖掘的任務(wù)可以分為對(duì)數(shù)據(jù)模型進(jìn)行分類(lèi)或預(yù)測(cè)、數(shù)據(jù)總結(jié)、數(shù)據(jù)聚類(lèi)、關(guān)聯(lián)規(guī)則發(fā)現(xiàn)、序列模式發(fā)現(xiàn)、依賴(lài)關(guān)系發(fā)現(xiàn)、異;蚶恻c(diǎn)檢測(cè)以及趨勢(shì)發(fā)現(xiàn)等,但目前國(guó)內(nèi)科技期刊行業(yè)利用數(shù)據(jù)挖掘方法進(jìn)行大規(guī)模數(shù)據(jù)處理仍處在起步階段。張品純等對(duì)中國(guó)科協(xié)所屬的科技期刊出版單位的現(xiàn)狀進(jìn)行分析后發(fā)現(xiàn),中國(guó)科協(xié)科技期刊出版單位多為單刊獨(dú)立經(jīng)營(yíng),單位的規(guī)模較小、實(shí)力較弱,多數(shù)出版單位不具備市場(chǎng)主體地位。這樣就導(dǎo)致國(guó)內(nèi)大部分科技期刊既沒(méi)有能力進(jìn)行數(shù)據(jù)挖掘,也沒(méi)有相應(yīng)的數(shù)據(jù)資源準(zhǔn)備。以數(shù)據(jù)挖掘技術(shù)應(yīng)用于期刊網(wǎng)站為例,為了進(jìn)行深入的數(shù)據(jù)分析,期刊經(jīng)營(yíng)人員需要找到稿件與讀者之間、讀者群體之間隱藏的內(nèi)在聯(lián)系。目前,數(shù)據(jù)挖掘的基本步驟為: 1) 明確數(shù)據(jù)挖掘的對(duì)象與目標(biāo);2) 確定數(shù)據(jù)源; 3) 建立數(shù)據(jù)模型; 4) 建立數(shù)據(jù)倉(cāng)庫(kù); 5)數(shù)據(jù)挖掘分析; 6) 對(duì)象與目標(biāo)的數(shù)據(jù)應(yīng)用和反饋。

  2 期刊數(shù)據(jù)的資源整合

  編輯部從稿件系統(tǒng)、發(fā)行系統(tǒng)、廣告系統(tǒng)、站等各個(gè)系統(tǒng)中將相關(guān)數(shù)據(jù)進(jìn)行清洗、轉(zhuǎn)換和整理,然后加載到數(shù)據(jù)倉(cāng)庫(kù)中。進(jìn)一步,根據(jù)業(yè)務(wù)應(yīng)用的范圍和緊密度,建立相關(guān)數(shù)據(jù)集市。期刊數(shù)據(jù)資源的整合過(guò)程從數(shù)據(jù)體系上可分為數(shù)據(jù)采集層、數(shù)據(jù)存儲(chǔ)處理層和數(shù)據(jù)展現(xiàn)層。

  要獲得能夠適合企業(yè)內(nèi)部多部門(mén)均可使用、挖掘和分析的數(shù)據(jù),可以從業(yè)務(wù)的關(guān)聯(lián)性分析數(shù)據(jù)的準(zhǔn)確性、一致性、有效性和數(shù)據(jù)的內(nèi)在關(guān)聯(lián)性。

  3 期刊數(shù)據(jù)的信息挖掘

  信息挖掘?yàn)榱藦牟煌N類(lèi)和形式的業(yè)務(wù)進(jìn)行抽取、變換、集成數(shù)據(jù),最后將其存儲(chǔ)到數(shù)據(jù)倉(cāng)庫(kù),并要對(duì)數(shù)據(jù)的質(zhì)量進(jìn)行維護(hù)和管理。數(shù)據(jù)挖掘可以有效地識(shí)別讀者的閱讀行為,發(fā)現(xiàn)讀者的閱讀模式和趨勢(shì),對(duì)網(wǎng)站改進(jìn)服務(wù)質(zhì)量、取得更好的用戶(hù)黏稠度和滿(mǎn)意度、提高科技期刊經(jīng)營(yíng)能力有著重要的意義。作為一個(gè)分析推薦系統(tǒng),我們將所分析的統(tǒng)計(jì)結(jié)果存儲(chǔ)于服務(wù)器中,在用戶(hù)或決策者需要查詢(xún)時(shí),只需輸入要找尋的用戶(hù)信息,系統(tǒng)將從數(shù)據(jù)庫(kù)中抽取其個(gè)人信息,并處理返回到上網(wǎng)時(shí)間分布、興趣點(diǎn)所在、適配業(yè)務(wù)及他對(duì)于哪些業(yè)務(wù)是有價(jià)值客戶(hù),甚至包括他在什么時(shí)段對(duì)哪類(lèi)信息更感興趣等。只有這些信息才是我們的使用對(duì)象所看重和需要的。

  網(wǎng)站結(jié)構(gòu)挖掘是挖掘網(wǎng)站中潛在的鏈接結(jié)構(gòu)模式。通過(guò)分析一個(gè)網(wǎng)頁(yè)的鏈接、鏈接數(shù)量以及鏈接對(duì)象,建立網(wǎng)站自身的鏈接結(jié)構(gòu)模式。在此過(guò)程中,如果發(fā)現(xiàn)某一頁(yè)面被較多鏈接所指向,則說(shuō)明該頁(yè)面信息是有價(jià)值的,值得期刊工作人員做更深層次的挖掘。網(wǎng)站結(jié)構(gòu)挖掘在具體應(yīng)用時(shí)采用的結(jié)構(gòu)和技術(shù)各不相同; 但主要過(guò)程均包括預(yù)處理、模式發(fā)現(xiàn)和模式分析3 部分。為了反映讀者興趣取向,就需要對(duì)數(shù)據(jù)庫(kù)中的數(shù)據(jù)按用戶(hù)進(jìn)行抽樣分析,得到興趣點(diǎn)的統(tǒng)計(jì)結(jié)果,而個(gè)人的興趣分析也可基于此思路進(jìn)行。下面以《中華醫(yī)學(xué)雜志》為例做一介紹。

  預(yù)處理預(yù)處理是網(wǎng)站結(jié)構(gòu)挖掘最關(guān)鍵的一個(gè)環(huán)節(jié),其處理得到的數(shù)據(jù)質(zhì)量直接關(guān)系到使用數(shù)據(jù)挖掘和模式分析方法進(jìn)行分析的結(jié)果。預(yù)處理步驟包括數(shù)據(jù)清洗、用戶(hù)識(shí)別、會(huì)話(huà)識(shí)別、路徑補(bǔ)充和事件識(shí)別。以《中華醫(yī)學(xué)雜志》網(wǎng)站www. nmjc. net. cn 的日志分析為例。首先給出一條已有的Log,其內(nèi)容為“20xx-03-04 12: 13: 47 W3SVC80003692 172. 22. 4. 3GET /index. asp-80-123. 185. 247. 49Mozilla /5. 0 +( Windows + NT + 6. 1; + WOW64 ) + AppleWebKit /537. 36 + ( KHTML,+ like + Gecko) + Chrome /28. 0.1500. 95 + Safari /537. 36 + SE + 2. X + MetaSr + 1. 0200 0 0”。從Log 的內(nèi)容,工作人員可以得到相關(guān)信息,如用戶(hù)IP、用戶(hù)訪(fǎng)問(wèn)頁(yè)面事件、用戶(hù)訪(fǎng)問(wèn)的頁(yè)面、用戶(hù)請(qǐng)求的方法、返回HTTP 狀態(tài)以及用戶(hù)瀏覽的上一頁(yè)面等內(nèi)容。

  由于服務(wù)器同時(shí)部署了多個(gè)編輯部網(wǎng)站,這就要求工作人員必須對(duì)得到的訪(fǎng)問(wèn)www. nmjc. net. cn 日志,去除由爬蟲(chóng)軟件產(chǎn)生的記錄。這些記錄一般都會(huì)在日志結(jié)尾包含“Spider”的字樣。同時(shí),還需要去除不是由GET 請(qǐng)求產(chǎn)生的日志以及請(qǐng)求資源不是頁(yè)面類(lèi)型的日志。最后,工作人員還需要去除訪(fǎng)問(wèn)錯(cuò)誤的請(qǐng)求,可以根據(jù)日志中請(qǐng)求的狀態(tài)進(jìn)行判斷。一般認(rèn)為,請(qǐng)求狀態(tài)在( 200, 300) 范圍內(nèi)是訪(fǎng)問(wèn)正確的日志,其他如403、400 和500 等都是訪(fǎng)問(wèn)錯(cuò)誤的日志。用戶(hù)識(shí)別可以根據(jù)用戶(hù)的IP 地址和用戶(hù)的系統(tǒng)信息來(lái)完成。只有在IP 地址和系統(tǒng)信息都完全一致的情況下,才識(shí)別為一個(gè)用戶(hù)。會(huì)話(huà)識(shí)別是利用面向時(shí)間的探索法,根據(jù)超時(shí)技術(shù)來(lái)識(shí)別一個(gè)用戶(hù)的多次會(huì)話(huà)。如果用戶(hù)在一段時(shí)間內(nèi)沒(méi)有任何操作,則認(rèn)為會(huì)話(huà)結(jié)束。用戶(hù)在規(guī)定時(shí)間后重新訪(fǎng)問(wèn),則被認(rèn)為不屬于此次會(huì)話(huà),而是下次會(huì)話(huà)的開(kāi)始。

  利用WebLogExplore 分析日志、用戶(hù)和網(wǎng)頁(yè)信息在獲得了有效的日志數(shù)據(jù)后,工作人員可以利用一些有效數(shù)據(jù)挖掘算法進(jìn)行模式發(fā)現(xiàn)。目前,主要的數(shù)據(jù)挖掘方法有統(tǒng)計(jì)分析、關(guān)聯(lián)規(guī)則、分類(lèi)、聚類(lèi)以及序列模式等技術(shù)。本文主要討論利用Apriori 算法來(lái)發(fā)現(xiàn)科技期刊日志數(shù)據(jù)中的關(guān)聯(lián)規(guī)則。本質(zhì)上數(shù)據(jù)挖掘不是用來(lái)驗(yàn)證某個(gè)假定的模式的正確性,而是在數(shù)據(jù)庫(kù)中自己尋找模型,本質(zhì)是一個(gè)歸納的過(guò)程。支持度( Support) 的公式定義為: Support ( A≥B) = P( A ∪B) 。支持度可以用于度量事件A 與B 同時(shí)出現(xiàn)的概率。如果事件A 與B 同時(shí)出現(xiàn)的概率較小,說(shuō)明事件A 與B 的關(guān)系不大; 如果事件A 與B 同時(shí)出現(xiàn)非常頻繁,則說(shuō)明事件A 與B 總是相關(guān)的。置信度( Confidence) 的公式定義為: Confidence( A≥B) = P( A | B) 。置信度揭示了事件A 出現(xiàn)時(shí),事件B 是否也會(huì)出現(xiàn)或有多大概率出現(xiàn)。如果置信度為100%,則事件A 必然會(huì)導(dǎo)致事件B 出現(xiàn)。置信度太低,說(shuō)明事件A 的出現(xiàn)與事件B 是否出現(xiàn)關(guān)系不大。

  對(duì)所有的科技期刊日志數(shù)據(jù)進(jìn)行預(yù)處理后,利用WebLogExplore 軟件可得到日志匯總表。表中存儲(chǔ)了所有用戶(hù)訪(fǎng)問(wèn)網(wǎng)站頁(yè)面的詳細(xì)信息,工作人員可將其導(dǎo)入數(shù)據(jù)庫(kù)中。以查看到所選擇用戶(hù)訪(fǎng)問(wèn)期刊頁(yè)面的詳細(xì)信息。

  同樣,在WebLogExplore 軟件中選擇感興趣的頁(yè)面,可以查看所有用戶(hù)訪(fǎng)問(wèn)該頁(yè)面的統(tǒng)計(jì)信息,如該頁(yè)面的訪(fǎng)問(wèn)用戶(hù)數(shù)量等。工作人員可以對(duì)用戶(hù)訪(fǎng)問(wèn)排名較高的頁(yè)面進(jìn)行進(jìn)一步的模式分析。

  步驟1: 將圖2 日志信息匯總表中的數(shù)據(jù)導(dǎo)入數(shù)據(jù)庫(kù)中,建立日志總表。

  步驟2: 在數(shù)據(jù)庫(kù)中建立一個(gè)新表命名為tj。

  步驟3: 通過(guò)查詢(xún)程序得到日志總表中每一個(gè)用戶(hù)訪(fǎng)問(wèn)的頁(yè)面,同時(shí)做distinct 處理。

  步驟4: 將查詢(xún)得到的用戶(hù)訪(fǎng)問(wèn)頁(yè)面記錄進(jìn)行判斷。如果用戶(hù)訪(fǎng)問(wèn)過(guò)排名前20 位的某個(gè)頁(yè)面,則在數(shù)據(jù)庫(kù)中寫(xiě)入true,否則寫(xiě)入false。依次循環(huán)判斷寫(xiě)入數(shù)據(jù)庫(kù)中。

  步驟5: 統(tǒng)計(jì)每個(gè)訪(fǎng)問(wèn)排名靠前頁(yè)面的支持度,設(shè)置一維項(xiàng)目集的最小閥值( 10%) 。

  步驟6: 統(tǒng)計(jì)大于一維閥值的頁(yè)面,寫(xiě)入數(shù)組,并對(duì)數(shù)組內(nèi)部頁(yè)面進(jìn)行兩兩組合,統(tǒng)計(jì)每個(gè)組合2 個(gè)頁(yè)面值均為true 時(shí)的二維項(xiàng)目集的支持度。

  步驟7: 設(shè)置二維項(xiàng)目集支持度的閥值,依次統(tǒng)計(jì)三維項(xiàng)目集支持度和置信度( A≥B) ,即當(dāng)A 頁(yè)面為true 時(shí),統(tǒng)計(jì)B 頁(yè)面為true 的數(shù)量,除以A 為true 的數(shù)量。設(shè)置相應(yīng)的置信度閥值,找到訪(fǎng)問(wèn)排名靠前頁(yè)面之間較強(qiáng)的關(guān)聯(lián)規(guī)則。

  4 數(shù)據(jù)挖掘技術(shù)應(yīng)用的意義

  1) 對(duì)頻繁訪(fǎng)問(wèn)的用戶(hù),可以使用用戶(hù)識(shí)別技術(shù)分析此用戶(hù)的歷史訪(fǎng)問(wèn)記錄,得到他經(jīng)常訪(fǎng)問(wèn)的頁(yè)面。當(dāng)該用戶(hù)再次登錄系統(tǒng)時(shí),可以對(duì)其進(jìn)行個(gè)性化提示或推薦。這樣,既方便用戶(hù)使用,也可將系統(tǒng)做得更加友好。很多OA 期刊網(wǎng)站,不具備歷史瀏覽記錄的功能; 但瀏覽記錄對(duì)用戶(hù)來(lái)講其實(shí)十分重要,隱含了用戶(hù)對(duì)文章的篩選過(guò)程,所以對(duì)用戶(hù)經(jīng)常訪(fǎng)問(wèn)的頁(yè)面需要進(jìn)行優(yōu)化展示,不能僅僅提供鏈接地址,需要將文章題名、作者、關(guān)鍵詞等信息以列表的方式予以顯示。

  2) 由數(shù)據(jù)挖掘技術(shù)而產(chǎn)生的頻繁項(xiàng)目集的分析,可以對(duì)網(wǎng)站的結(jié)構(gòu)進(jìn)行改進(jìn)。支持度很高的頁(yè)面,說(shuō)明該頁(yè)面的用戶(hù)訪(fǎng)問(wèn)量大。為了方便用戶(hù)以及吸引更多的讀者,可以將這些頁(yè)面放置在更容易被訪(fǎng)問(wèn)的位置,科技期刊的'網(wǎng)站內(nèi)容一般以年、卷、期的形式展示。用戶(hù)如果想查看某一篇影響因子很高的文章,也必須通過(guò)年卷期的方式來(lái)查看,非常不方便而且頁(yè)面友好性不高。通過(guò)數(shù)據(jù)挖掘的分析,編輯部可以把經(jīng)常被訪(fǎng)問(wèn)或者高影響因子的文章放在首頁(yè)展示。

  3) 對(duì)由數(shù)據(jù)挖掘技術(shù)產(chǎn)生的頻繁項(xiàng)目集的分析,可以發(fā)現(xiàn)用戶(hù)的關(guān)注熱點(diǎn)。若某些頁(yè)面或項(xiàng)目被用戶(hù)頻繁訪(fǎng)問(wèn),則可以用這些數(shù)據(jù)對(duì)用戶(hù)進(jìn)行分析。一般來(lái)說(shuō)科技期刊的讀者,每個(gè)人的專(zhuān)業(yè)和研究方向都是不同的,編輯部可以通過(guò)數(shù)據(jù)挖掘技術(shù)來(lái)判斷讀者的研究方向和感興趣的熱點(diǎn),對(duì)每一個(gè)用戶(hù)進(jìn)行有針對(duì)性的內(nèi)容推送和消息發(fā)送。

  4) 網(wǎng)站管理者可以根據(jù)在不同時(shí)間內(nèi)頻繁項(xiàng)目集的變化情況對(duì)科技期刊網(wǎng)站進(jìn)行有針對(duì)性的調(diào)整,比如加入更多關(guān)于該熱點(diǎn)的主題資源。目前大多數(shù)科技期刊網(wǎng)站首頁(yè)的內(nèi)容,均為編輯部工作人員后臺(tái)添加、置頂、高亮來(lái)吸引用戶(hù)的; 通過(guò)數(shù)據(jù)挖掘技術(shù),完全可以擯棄這種展示方式。編輯部網(wǎng)站的用戶(hù)訪(fǎng)問(wèn)哪些頁(yè)面頻繁,系統(tǒng)便會(huì)自動(dòng)將這些頁(yè)面的文章推向首頁(yè),不需要編輯部的人工干預(yù),整個(gè)網(wǎng)站實(shí)現(xiàn)自動(dòng)化運(yùn)行。

  5 后記

  本文重點(diǎn)討論了數(shù)據(jù)挖掘技術(shù)與科技期刊網(wǎng)站頁(yè)面之間的關(guān)系。其實(shí)我們還可以從很多方面進(jìn)行數(shù)據(jù)挖掘,比如可以對(duì)網(wǎng)站的用戶(hù)和內(nèi)容進(jìn)行數(shù)據(jù)挖掘,通過(guò)分析可以為后期的期刊經(jīng)營(yíng)做好鋪墊。

  有一點(diǎn)很重要,沒(méi)有一種數(shù)據(jù)挖掘的分析方法可以應(yīng)付所有的需求。對(duì)于某一種問(wèn)題,數(shù)據(jù)本身的特性會(huì)影響你的選擇,需要用到許多不同的數(shù)據(jù)挖掘方法以及技術(shù)從數(shù)據(jù)中找到最佳的模型。

  在目前深化文化體制改革,推動(dòng)社會(huì)主義文化大發(fā)展、大繁榮的政治形勢(shì)下,利用數(shù)據(jù)挖掘技術(shù)從中進(jìn)行提取、分析和應(yīng)用,能有效地幫助企業(yè)了解客戶(hù)、改進(jìn)系統(tǒng)、制訂合理的市場(chǎng)策略、提高企業(yè)的銷(xiāo)售水平和利潤(rùn)。通過(guò)利用數(shù)據(jù)挖掘技術(shù)準(zhǔn)確定位優(yōu)質(zhì)客戶(hù),向客戶(hù)提供更精確、更有價(jià)值的個(gè)性化服務(wù)。這將成為未來(lái)科技期刊經(jīng)營(yíng)十分重要的突破點(diǎn)和增長(zhǎng)點(diǎn)。

數(shù)據(jù)挖掘論文6

  摘要:隨著科學(xué)技術(shù)的不斷發(fā)展,數(shù)據(jù)挖掘技術(shù)也應(yīng)運(yùn)而生。為了高效有序的醫(yī)療信息管理,需要加強(qiáng)數(shù)據(jù)挖掘技術(shù)在醫(yī)療信息管理中的實(shí)際應(yīng)用,從而提升醫(yī)院的管理水平,為醫(yī)院的管理工作及資源的合理配置提供多樣化發(fā)展的可能性。筆者將針對(duì)數(shù)據(jù)挖掘技術(shù)在醫(yī)療信息管理中的應(yīng)用這一課題進(jìn)行相應(yīng)的探究,從而提出合理的改進(jìn)建議。

  關(guān)鍵詞:挖掘技術(shù);醫(yī)療信息管理;應(yīng)用方式

  數(shù)據(jù)挖掘作為一種數(shù)據(jù)信息再利用的有效技術(shù),能夠有效地為醫(yī)院的管理決策提供重要信息。它以數(shù)據(jù)庫(kù)、人工智能以及數(shù)理統(tǒng)計(jì)為主要技術(shù)支柱進(jìn)行技術(shù)管理與決策。而在醫(yī)療信息管理過(guò)程之中應(yīng)用數(shù)據(jù)挖掘技術(shù)能夠較好地針對(duì)醫(yī)療衛(wèi)生信息進(jìn)行整理與歸類(lèi)來(lái)建立管理模型,形成有效的總結(jié)數(shù)據(jù)的同時(shí)能夠?yàn)獒t(yī)療工作的高效進(jìn)行提供有價(jià)值的信息。所以筆者將以數(shù)據(jù)挖掘技術(shù)在醫(yī)療信息管理中的應(yīng)用為著手點(diǎn),從而針對(duì)其應(yīng)用現(xiàn)狀進(jìn)行探究,以此提出加強(qiáng)數(shù)據(jù)挖掘技術(shù)在醫(yī)療信息管理中應(yīng)用的具體措施,希望能夠在理論層面上推動(dòng)醫(yī)療信息管理工作的飛躍。

  1在醫(yī)療信息管理中應(yīng)用數(shù)據(jù)挖掘技術(shù)的基本內(nèi)涵

  數(shù)據(jù)挖掘是結(jié)合信息收集技術(shù)、人工智能處理技術(shù)以及分析檢測(cè)技術(shù)等所形成的功能強(qiáng)大的技術(shù)。它能夠?qū)崿F(xiàn)對(duì)于數(shù)據(jù)的收集、問(wèn)題的定義與處理,并且能夠較好地對(duì)于結(jié)果進(jìn)行解釋與評(píng)估。在醫(yī)療信息管理工作進(jìn)行的過(guò)程之中,應(yīng)用數(shù)據(jù)挖掘技術(shù)可以較好地加強(qiáng)醫(yī)療信息數(shù)據(jù)模型的建立,同時(shí)以多種形式出現(xiàn),例如文字信息、基本信號(hào)信息、圖像收集等,也能夠用來(lái)進(jìn)行醫(yī)療信息的科普與宣傳。并且,數(shù)據(jù)挖掘技術(shù)在醫(yī)療信息中所體現(xiàn)出的應(yīng)用方式有所不同,在數(shù)據(jù)挖掘技術(shù)應(yīng)用過(guò)程之中,既可以針對(duì)同一類(lèi)的實(shí)物反應(yīng)出共同性質(zhì)的基本特征,同時(shí)也能夠根據(jù)具有一定關(guān)聯(lián)性的事物信息來(lái)探究差異。這些功能不僅僅能夠在醫(yī)療信息的管理層面上給予醫(yī)療人員較大的信息管理指導(dǎo),同時(shí)在實(shí)際的醫(yī)療診斷過(guò)程之中,也可以向醫(yī)生提供患者的患病信息,并且輔助治療的進(jìn)行[1]。所以,在醫(yī)療信息管理中應(yīng)用數(shù)據(jù)挖掘技術(shù)不僅僅能夠推動(dòng)醫(yī)療信息管理水平的提升,也是醫(yī)院實(shí)現(xiàn)現(xiàn)代化、信息化建設(shè)的重要體現(xiàn),需要從根本上明確醫(yī)療信息管理應(yīng)用數(shù)據(jù)挖掘技術(shù)的必要性與基本內(nèi)涵,從而針對(duì)醫(yī)院的管理現(xiàn)狀實(shí)現(xiàn)其管理方式與技術(shù)應(yīng)用的轉(zhuǎn)變與優(yōu)化。

  2在醫(yī)療信息管理過(guò)程之中加強(qiáng)數(shù)據(jù)挖掘技術(shù)應(yīng)用的重要措施

  2.1實(shí)現(xiàn)建模環(huán)節(jié)以及數(shù)據(jù)收集環(huán)節(jié)的優(yōu)化

  在應(yīng)用數(shù)據(jù)挖掘技術(shù)的過(guò)程之中,必須基于數(shù)據(jù)庫(kù)信息的基礎(chǔ)之上,其數(shù)據(jù)挖掘技術(shù)才能夠進(jìn)行相應(yīng)的規(guī)律探究與信息分析,所以需要在源頭處加強(qiáng)數(shù)據(jù)收集環(huán)節(jié)以及建模環(huán)節(jié)的優(yōu)化。以醫(yī)院中醫(yī)部門(mén)為例,在對(duì)于中醫(yī)處方經(jīng)驗(yàn)的挖掘方法使用過(guò)程之中,需要針對(duì)不同的藥物進(jìn)行關(guān)聯(lián)性建模,比如數(shù)據(jù)庫(kù)中有基礎(chǔ)性藥物,針對(duì)藥物進(jìn)行頻數(shù)和次數(shù)的統(tǒng)計(jì),然后以此類(lèi)推,將所有藥物都按照出現(xiàn)的頻數(shù)進(jìn)行降數(shù)排列,從而探究參考價(jià)值。建模環(huán)節(jié)以及數(shù)據(jù)收集環(huán)節(jié)是醫(yī)療信息管理過(guò)程的根本,所以需要做好對(duì)于建模環(huán)節(jié)以及數(shù)據(jù)收集環(huán)節(jié)的優(yōu)化,才能夠?yàn)閿?shù)據(jù)挖掘技術(shù)的應(yīng)用奠定相應(yīng)的基礎(chǔ)[2]。

  2.2細(xì)化數(shù)據(jù)挖掘技術(shù)應(yīng)用類(lèi)別

  想要在醫(yī)療信息管理過(guò)程之中,加強(qiáng)對(duì)于數(shù)據(jù)挖掘技術(shù)的有效應(yīng)用,就需要從數(shù)據(jù)挖掘技術(shù)應(yīng)用類(lèi)別處進(jìn)行著手,從而提升技術(shù)應(yīng)用的針對(duì)性與有效性。常見(jiàn)的技術(shù)應(yīng)用類(lèi)別有:醫(yī)院資源配置方面、病患區(qū)域管理方面、醫(yī)療衛(wèi)生質(zhì)量管理方面、醫(yī)療急診管理方面、醫(yī)院經(jīng)濟(jì)管理方面以及醫(yī)療衛(wèi)生常見(jiàn)病宣傳方面等,數(shù)據(jù)挖掘技術(shù)都可以在這些類(lèi)別之中實(shí)現(xiàn)應(yīng)用,但是在應(yīng)用的過(guò)程之中也有所不同。以病房區(qū)域管理為例,在應(yīng)用數(shù)據(jù)挖掘技術(shù)之前,首先需要明確不同的科室狀況以及病房區(qū)域分配狀況等,加強(qiáng)病患區(qū)域的指標(biāo)分析,因?yàn)椴》抗芾聿粌H僅影響到科室的工作效率與工作效果,同時(shí)也是醫(yī)療物資分配與人員編制的主要參考標(biāo)準(zhǔn)。其次利用數(shù)據(jù)挖掘技術(shù)能夠較好地實(shí)現(xiàn)不同科室工作效率、質(zhì)量管理質(zhì)量以及經(jīng)濟(jì)收益等多種指標(biāo)的評(píng)估,建立其科室的運(yùn)營(yíng)模型,從而實(shí)現(xiàn)科室的又好又快發(fā)展。比如使用數(shù)據(jù)挖掘技術(shù)建立其病區(qū)管理的標(biāo)準(zhǔn)模型以及統(tǒng)計(jì)指標(biāo),從而計(jì)算出科室動(dòng)態(tài)的工作模型以及病床動(dòng)態(tài)的周轉(zhuǎn)次數(shù)等[3]。另外在醫(yī)療質(zhì)量管理過(guò)程之中,數(shù)據(jù)挖掘技術(shù)提供的不僅僅是資料數(shù)據(jù)的參考以及疾病的.診斷,也能夠針對(duì)臨床的治療效果進(jìn)行分析與評(píng)價(jià),并且能夠預(yù)測(cè)治療狀況:可以利用醫(yī)院的醫(yī)療數(shù)據(jù)庫(kù),對(duì)于病人的基本患病信息進(jìn)行分類(lèi),從而比對(duì)死亡率、治愈率等多個(gè)數(shù)據(jù),實(shí)現(xiàn)治療方案的制訂。而在醫(yī)療質(zhì)量管理過(guò)程之中也有很多的影響因素,例如基礎(chǔ)醫(yī)療設(shè)備、病床周轉(zhuǎn)次數(shù)、病種治愈記錄等,所以也可以利用數(shù)據(jù)挖掘技術(shù)來(lái)進(jìn)一步加強(qiáng)其多種數(shù)據(jù)之間的關(guān)聯(lián)性,從而為提升醫(yī)院的社會(huì)效益與經(jīng)濟(jì)效益提出合理的參考性建議。

  2.3明確數(shù)據(jù)挖掘技術(shù)的應(yīng)用方向

  醫(yī)院加強(qiáng)數(shù)據(jù)挖掘技術(shù)應(yīng)用方向的探索上,可以從客戶(hù)拓展這個(gè)角度出發(fā)實(shí)現(xiàn)對(duì)于醫(yī)療信息管理。例如通過(guò)數(shù)據(jù)挖掘技術(shù)多方進(jìn)行患者信息比對(duì),同時(shí)制訂完善的醫(yī)療服務(wù)影響策略方式,加強(qiáng)對(duì)于客戶(hù)行為的分析;在數(shù)據(jù)挖掘的基礎(chǔ)之上,增強(qiáng)其技術(shù)應(yīng)用的實(shí)用性,在分析的基礎(chǔ)之上比對(duì)自身的競(jìng)爭(zhēng)優(yōu)勢(shì),實(shí)現(xiàn)醫(yī)院資源的合理規(guī)劃與合理配置,例如藥品、資金以及疾病診斷等,從而實(shí)現(xiàn)經(jīng)營(yíng)狀況的優(yōu)化。目前醫(yī)院也逐步向現(xiàn)代化、信息化方向發(fā)展,無(wú)論是信息管理還是醫(yī)療技術(shù)方面,醫(yī)院都已經(jīng)成為了一個(gè)信息化的綜合行業(yè)體系,所以在加強(qiáng)數(shù)據(jù)挖掘應(yīng)用的過(guò)程之中,還需要加強(qiáng)數(shù)據(jù)信息的管理,實(shí)現(xiàn)數(shù)據(jù)挖掘結(jié)果的維護(hù),從而提升醫(yī)院的決策能力,實(shí)現(xiàn)數(shù)據(jù)挖掘技術(shù)的高效應(yīng)用。

  3結(jié)語(yǔ)

  醫(yī)院在目前的醫(yī)療信息管理過(guò)程之中,還有很大的發(fā)展空間,需要綜合利用數(shù)據(jù)挖掘技術(shù),實(shí)現(xiàn)其信息管理水平的提升。通過(guò)明確數(shù)據(jù)挖掘技術(shù)的應(yīng)用方向、應(yīng)用類(lèi)別以及建模數(shù)據(jù)環(huán)節(jié)的優(yōu)化等,促進(jìn)醫(yī)院管理水平的提升,實(shí)現(xiàn)數(shù)據(jù)挖掘技術(shù)應(yīng)用效果的提升.

  參考文獻(xiàn):

  [1]鄭勝前.數(shù)據(jù)挖掘技術(shù)在社區(qū)醫(yī)療服務(wù)系統(tǒng)中的應(yīng)用與研究[J].數(shù)字技術(shù)與應(yīng)用,20xx(09):81-82.

  [2]廖亮.數(shù)據(jù)挖掘技術(shù)在醫(yī)療信息管理中的應(yīng)用[J].中國(guó)科技信息,20xx(11):54,56.

  [3]牟勇.數(shù)據(jù)挖掘技術(shù)在醫(yī)院信息化系統(tǒng)中應(yīng)用[J].電子測(cè)試,20xx(11):23-24,22.

數(shù)據(jù)挖掘論文7

  摘要:文章首先對(duì)數(shù)據(jù)挖掘技術(shù)及其具體功能進(jìn)行簡(jiǎn)要分析,在此基礎(chǔ)上對(duì)科研管理中數(shù)據(jù)挖掘技術(shù)的應(yīng)用進(jìn)行論述。期望通過(guò)本文的研究能夠?qū)蒲泄芾硭降倪M(jìn)一步提升有所幫助。

  關(guān)鍵詞:科研管理;數(shù)據(jù)挖掘;技術(shù)應(yīng)用

  1數(shù)據(jù)挖掘技術(shù)及其具體功能分析

  所謂的數(shù)據(jù)挖掘具體是指通過(guò)相關(guān)的算法在大量的數(shù)據(jù)當(dāng)中對(duì)隱藏的、有利用價(jià)值的信息進(jìn)行搜索的過(guò)程。數(shù)據(jù)挖掘是一門(mén)綜合性較強(qiáng)的科學(xué)技術(shù),其中涉及諸多領(lǐng)域的知識(shí),如人工智能、機(jī)器學(xué)習(xí)、數(shù)據(jù)庫(kù)、數(shù)理統(tǒng)計(jì)等等。數(shù)據(jù)挖掘技術(shù)具有如下幾個(gè)方面的功能:1.1關(guān)聯(lián)規(guī)則分析。這是數(shù)據(jù)挖掘技術(shù)較為重要的功能之一,可從給定的數(shù)據(jù)集當(dāng)中,找到出現(xiàn)比較頻繁的項(xiàng)集,該項(xiàng)集具體是指行形如X->Y,在數(shù)據(jù)庫(kù)當(dāng)中,X和Y所代表的均為屬性取值。在關(guān)聯(lián)規(guī)則下,只要數(shù)據(jù)滿(mǎn)足X條件,就一定滿(mǎn)足Y條件,數(shù)據(jù)挖掘技術(shù)的這個(gè)功能在商業(yè)金融等領(lǐng)域中的應(yīng)用較為廣泛。1.2回歸模式分析回歸模式主要是通過(guò)對(duì)連續(xù)數(shù)值的預(yù)測(cè),來(lái)達(dá)到挖掘數(shù)據(jù)的目的。例如,已知企業(yè)某個(gè)人的教育背景、工作年限等條件,可對(duì)其年薪的范圍進(jìn)行判定,整個(gè)分析過(guò)程是利用回歸模型予以實(shí)現(xiàn)的。在該功能中,已知的條件越多,可進(jìn)行挖掘的信息就越多。1.3聚類(lèi)分析聚類(lèi)具體是指將相似程度較高的數(shù)據(jù)歸為同一個(gè)類(lèi)別,通過(guò)聚類(lèi)分析能夠從數(shù)據(jù)集中找出類(lèi)似的數(shù)據(jù),并組成不同的組。在聚類(lèi)分析的過(guò)程中,需要使用聚類(lèi)算法,借助該算法對(duì)數(shù)據(jù)進(jìn)行檢測(cè)后,可以判斷其隱藏的屬性,并將數(shù)據(jù)庫(kù)分為若干個(gè)相似的組。

  2科研管理中數(shù)據(jù)挖掘技術(shù)的應(yīng)用

  科研是科學(xué)研究的簡(jiǎn)稱(chēng),具體是指為認(rèn)識(shí)客觀(guān)事物在內(nèi)在本質(zhì)及其運(yùn)動(dòng)規(guī)律,而借助某些技術(shù)手段和設(shè)備,開(kāi)展調(diào)查研究、實(shí)驗(yàn)等活動(dòng),并為發(fā)明和創(chuàng)造新產(chǎn)品提供理論依據(jù)。科研管理是對(duì)科研項(xiàng)目全過(guò)程的管理,如課題管理、經(jīng)費(fèi)管理、成果管理等等。由于科學(xué)研究中涉及的內(nèi)容較多,從而給科研管理工作增添了一定的難度。為進(jìn)一步提升科研管理水平,可在不同的管理環(huán)節(jié)中,對(duì)數(shù)據(jù)挖掘技術(shù)進(jìn)行應(yīng)用。下面就此展開(kāi)詳細(xì)論述。

  2.1在立項(xiàng)及可行性評(píng)估中的應(yīng)用

  科研管理工作的開(kāi)展需要以相關(guān)的科研課題作為依托,當(dāng)課題選定之后,需要對(duì)其可行性及合理性進(jìn)行全面系統(tǒng)地評(píng)估,由此使得科研課題的立項(xiàng)及評(píng)估成為科研管理的主要工作內(nèi)容,F(xiàn)階段,國(guó)內(nèi)的科研課題立項(xiàng)采用的是申請(qǐng)審批制,具體的流程是:由科研機(jī)構(gòu)的相關(guān)人員負(fù)責(zé)提出申請(qǐng),然后再由科技主管部門(mén)從申請(qǐng)中進(jìn)行篩選,經(jīng)過(guò)業(yè)內(nèi)專(zhuān)家的評(píng)審論證之后,擇優(yōu)選取科研項(xiàng)目的承接單位。在進(jìn)行科研課題立項(xiàng)的過(guò)程中,涉及諸多方面的內(nèi)容,具體包括申請(qǐng)單位、課題的研究領(lǐng)域、經(jīng)費(fèi)安排、主管單位以及評(píng)審專(zhuān)家等。通過(guò)調(diào)查發(fā)現(xiàn),由于國(guó)家宏觀(guān)調(diào)控政策的缺失,導(dǎo)致科研立項(xiàng)中存在低水平、重復(fù)性研究的情況,從而造成大量的研究經(jīng)費(fèi)浪費(fèi),所取得的研究成果也不顯著?蒲泄芾聿块T(mén)雖然建立了相對(duì)完善的數(shù)據(jù)庫(kù)系統(tǒng),并且系統(tǒng)也涵蓋與項(xiàng)目申請(qǐng)、審評(píng)等方面有關(guān)的基本操作流程,如上傳項(xiàng)目申報(bào)文件、將文件發(fā)給相關(guān)的評(píng)審專(zhuān)家、對(duì)評(píng)審結(jié)果進(jìn)行自動(dòng)統(tǒng)計(jì)等。從本質(zhì)的角度上講,數(shù)據(jù)庫(kù)管理系統(tǒng)所完成的這些工作流程,就是將傳統(tǒng)管理工作轉(zhuǎn)變?yōu)樾畔⒒9蚀,?yīng)當(dāng)對(duì)已有的數(shù)據(jù)進(jìn)行深入挖掘,從而找出其中更具利用價(jià)值的信息,據(jù)此對(duì)科研立項(xiàng)進(jìn)行指導(dǎo),這樣不但能夠使有限的科技資源得到最大限度地利用,而且還能使科研經(jīng)費(fèi)的使用效益獲得全面提升。在科研立項(xiàng)階段,可對(duì)數(shù)據(jù)挖掘技術(shù)進(jìn)行合理運(yùn)用,借此來(lái)對(duì)課題申請(qǐng)中涉及的各種因素進(jìn)行挖掘,找出其中潛在的規(guī)則,為指標(biāo)體系的構(gòu)建和遴選方法的選擇提供可靠依據(jù),最大限度地降低不合理因素對(duì)課題立項(xiàng)帶來(lái)的影響,對(duì)確需資助的科研項(xiàng)目進(jìn)行準(zhǔn)確選擇,并給予相應(yīng)的資助。在科研立項(xiàng)環(huán)節(jié)中,對(duì)數(shù)據(jù)挖掘技術(shù)進(jìn)行應(yīng)用時(shí),可以借助改進(jìn)后的Apriori算法進(jìn)行數(shù)據(jù)挖掘,從中找出關(guān)聯(lián)規(guī)則,在對(duì)該規(guī)則進(jìn)行分析的基礎(chǔ)上,對(duì)立項(xiàng)的'合理性進(jìn)行評(píng)價(jià)。

  2.2在項(xiàng)目管理中的應(yīng)用

  項(xiàng)目管理是科研管理的關(guān)鍵環(huán)節(jié),為提高項(xiàng)目管理的效率和水平,可對(duì)數(shù)據(jù)挖掘技術(shù)進(jìn)行合理運(yùn)用。在信息時(shí)代到來(lái)的今天,計(jì)算機(jī)技術(shù)、網(wǎng)絡(luò)技術(shù)的普及程度越來(lái)越高,國(guó)內(nèi)很多科研機(jī)構(gòu)都紛紛構(gòu)建起了相關(guān)的管理信息系統(tǒng),其中涵蓋了諸多的信息,如課題、科研人員、研究條件等等,而在這些信息當(dāng)中,隱藏著諸多具有特定意義的規(guī)則,為找出這些規(guī)則,需要借助數(shù)據(jù)挖掘技術(shù),對(duì)信息進(jìn)行深入分析,進(jìn)而獲取對(duì)科研項(xiàng)目有幫助的信息。由于大部分科研管理部門(mén)建立的科研管理信息系統(tǒng)時(shí)間較早,從而使得系統(tǒng)本身的功能比較單一,如信息刪減、修改、查詢(xún)、統(tǒng)計(jì)等等,雖然這些功能可以滿(mǎn)足對(duì)科研課題進(jìn)展、經(jīng)費(fèi)使用等方面的管理,但其面向的均為數(shù)據(jù)庫(kù)管理人員,處理的也都是常規(guī)事務(wù)。而從科研課題的管理者與決策者的角度上看,管理信息系統(tǒng)這些功能顯然是有所不足的,因?yàn)樗麄冃枰獙?duì)歷史進(jìn)行分析和提煉,從中獲取相應(yīng)的數(shù)據(jù),為決策和管理工作的開(kāi)展提供支撐。對(duì)此,可應(yīng)用數(shù)據(jù)挖掘技術(shù)的OLAP,即數(shù)據(jù)庫(kù)聯(lián)機(jī)分析處理,由此能夠幫助管理者從不同的方面對(duì)數(shù)據(jù)進(jìn)行觀(guān)察,進(jìn)而深入了解數(shù)據(jù)并獲取所需的信息。利用OLAP可以發(fā)現(xiàn)多種于科研課題有關(guān)信息之間的內(nèi)在聯(lián)系,這樣管理者便能及時(shí)發(fā)現(xiàn)其中存在的相關(guān)問(wèn)題,并針對(duì)問(wèn)題采取有效的方法和措施加以應(yīng)對(duì)。運(yùn)用數(shù)據(jù)挖掘技術(shù)能夠?qū)蒲许?xiàng)目的相關(guān)數(shù)據(jù)進(jìn)行分析,找出其中存在的矛盾,從而使管理工作的開(kāi)展更具針對(duì)性。

  3結(jié)論

  綜上所述,科研管理是一項(xiàng)較為復(fù)雜且系統(tǒng)的工作,其中涵蓋的信息相對(duì)較多。為此,可將數(shù)據(jù)挖掘技術(shù)在科研管理中進(jìn)行合理應(yīng)用,對(duì)相關(guān)信息進(jìn)行深入分析,從中挖掘出有利用價(jià)值的信息,為科研管理工作的開(kāi)展提供可靠的依據(jù),由此除了能夠確?蒲许(xiàng)目順利進(jìn)行之外,還能提高科研管理水平。

  參考文獻(xiàn):

 。1]劉占波,王立偉,王曉麗.大數(shù)據(jù)環(huán)境下基于數(shù)據(jù)挖掘技術(shù)的高?蒲泄芾硐到y(tǒng)的設(shè)計(jì)[J].電子測(cè)試,20xx(1):21-22.

 。2]史子靜.高?蒲泄芾硐到y(tǒng)中計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù)的運(yùn)用研究[J].科技資訊,20xx(6):65-66.

 。3]丁磊.?dāng)?shù)據(jù)挖掘技術(shù)在高校教師科研管理中的應(yīng)用研究[D].大連海事大學(xué),20xx.

數(shù)據(jù)挖掘論文8

  數(shù)據(jù)挖掘技術(shù)在金融業(yè)、醫(yī)療保健業(yè)、市場(chǎng)業(yè)、零售業(yè)和制造業(yè)等很多領(lǐng)域都得到了很好的應(yīng)用。針對(duì)交通安全領(lǐng)域中交通事故數(shù)據(jù)利用率低的現(xiàn)狀,可以通過(guò)數(shù)據(jù)挖掘?qū)ο嚓P(guān)交通事故數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析,從而發(fā)現(xiàn)其中的關(guān)聯(lián),這對(duì)提升交通安全水平具有非常重要的意義。

  1數(shù)據(jù)挖掘技術(shù)概述

  數(shù)據(jù)挖掘(DataMining)即對(duì)大量數(shù)據(jù)進(jìn)行有效的分類(lèi)統(tǒng)計(jì),從而整理出有規(guī)律的、有價(jià)值的、潛在的未知信息。一般來(lái)講,這些數(shù)據(jù)存在極大的隨機(jī)性和不完全性,其包括各行各業(yè)各個(gè)方面的數(shù)據(jù)。數(shù)據(jù)挖掘是一個(gè)結(jié)合了數(shù)據(jù)庫(kù)、人工智能、機(jī)器學(xué)習(xí)的學(xué)科,涉及統(tǒng)計(jì)數(shù)據(jù)和技術(shù)理論等領(lǐng)域。

  2數(shù)據(jù)挖掘關(guān)聯(lián)分析研究

  關(guān)聯(lián)分析作為數(shù)據(jù)挖掘中的重要組成部分,其主要作用就是通過(guò)數(shù)據(jù)之間的相互關(guān)聯(lián)從而發(fā)現(xiàn)數(shù)據(jù)集中某種未知的聯(lián)系。關(guān)聯(lián)分析最初是在20世紀(jì)90年代初被提出來(lái)的,一直備受關(guān)注。已被廣泛應(yīng)用于各行各業(yè),包括醫(yī)療體檢、電子商務(wù)、商業(yè)金融等各個(gè)領(lǐng)域。關(guān)聯(lián)規(guī)則的挖掘一般可分成兩個(gè)步驟[1]:

 。1)找出頻繁項(xiàng)集,不小于最小支持度的項(xiàng)集;

 。2)生成強(qiáng)關(guān)聯(lián)規(guī)則,不小于最小置信度的關(guān)聯(lián)規(guī)則。相對(duì)于生成強(qiáng)關(guān)聯(lián)規(guī)則,找出頻繁項(xiàng)集這一步比較麻煩。由R.Agrawal等人在1994年提出的Apriori算法是生成頻繁項(xiàng)集的經(jīng)典算法[2]。Apriori算法使用了Level-wise搜索的迭代方法,即用k-項(xiàng)集探索(k+1)-項(xiàng)集。Apriori算法在整體上可分為兩個(gè)部分。

  (1)發(fā)現(xiàn)頻集。這個(gè)部分是最重要的,開(kāi)銷(xiāo)相繼產(chǎn)生了各種各樣的頻集算法,專(zhuān)門(mén)用于發(fā)現(xiàn)頻集,以降低其復(fù)雜度、提高發(fā)現(xiàn)頻集的效率。

 。2)利用所獲得的頻繁項(xiàng)集各種算法主要致力產(chǎn)生強(qiáng)關(guān)聯(lián)規(guī)則。當(dāng)然頻集構(gòu)成的聯(lián)規(guī)則未必是強(qiáng)關(guān)聯(lián)規(guī)則,還要檢驗(yàn)構(gòu)成的關(guān)聯(lián)規(guī)則的支持度和支持度是否超過(guò)它們的閾值。Apriori算法找出頻繁項(xiàng)集分為兩步:連接和剪枝。

 。1)連接。集合Lk-1為頻繁k-1項(xiàng)集的集合,它通過(guò)與自身連接就可以生成候選k項(xiàng)集的集合,記作Ck。

 。2)剪枝。頻繁k項(xiàng)集的集合Lk是Ck的子集。剪枝首先利用Apriori算法的性質(zhì)(頻繁項(xiàng)集的所有非空子集都是頻繁的,如果不滿(mǎn)足這個(gè)條件,就從候選集合Ck中刪除)對(duì)Ck進(jìn)行壓縮;然后,通過(guò)掃描所有的事務(wù),確定壓縮后Ck中的每個(gè)候選的支持度;最后與設(shè)定的最小支持度進(jìn)行比較,如果支持度不小于最小支持度,則認(rèn)為該候選項(xiàng)是頻繁的。目前,在互聯(lián)網(wǎng)技術(shù)及科學(xué)技術(shù)的快速發(fā)展下,人工智能、機(jī)器識(shí)別等技術(shù)興起,關(guān)聯(lián)分析也被越來(lái)越多應(yīng)用其中,并在不斷發(fā)展中提出了大量的改進(jìn)算法。

  3數(shù)據(jù)挖掘關(guān)聯(lián)分析在道路交通事故原因分析當(dāng)中的應(yīng)用

  近年來(lái),我國(guó)越來(lái)越多的學(xué)者將數(shù)據(jù)挖掘關(guān)聯(lián)分析應(yīng)用于道路交通事故的研究中,主要是分析道路、車(chē)輛、行人以及環(huán)境等因素與交通事故之間的某種聯(lián)系。Pande和Abdel-Aty[3]通過(guò)關(guān)聯(lián)分析研究了美國(guó)佛羅里達(dá)州20xx年非交叉口發(fā)生的道路交通事故,重點(diǎn)分析了各個(gè)不同的影響因素與交通事故之間的內(nèi)在聯(lián)系,通過(guò)研究得出如下結(jié)論,道路照明條件不足是引發(fā)道路交通事故的主要因素,除此之外,還發(fā)現(xiàn)天氣惡劣的環(huán)境下道路彎道的直線(xiàn)段也極易發(fā)生交通事故。Graves[4]利用數(shù)據(jù)挖掘技術(shù)中的關(guān)聯(lián)規(guī)則對(duì)歐洲道路交通事故進(jìn)行了分析,主要研究了交通事故與道路設(shè)施狀況之間的關(guān)聯(lián),通過(guò)研究發(fā)現(xiàn)了易導(dǎo)致交通事故發(fā)生的`各個(gè)道路設(shè)施狀況因素,此研究為歐洲路面建設(shè)及投資提供了強(qiáng)大的決策支持。我國(guó)學(xué)者董立巖在研究道路交通事故數(shù)據(jù)的文獻(xiàn)中,將粗糙集與關(guān)聯(lián)分析進(jìn)行了融合,提出了基于偏好信息的決策規(guī)則簡(jiǎn)約算法并將其應(yīng)用其中,通過(guò)分析發(fā)現(xiàn)了道路交通事故的未知規(guī)律。王艷玲通過(guò)關(guān)聯(lián)分析中的因子關(guān)聯(lián)樹(shù)模型重點(diǎn)分析了影響道路交通事故最重要的因子,發(fā)現(xiàn)在道路交通事故常見(jiàn)的誘因人、車(chē)、路及環(huán)境中對(duì)事故影響最大的因子是環(huán)境。許卉瑩等利用關(guān)聯(lián)分析、聚類(lèi)分析以及決策樹(shù)分析三種數(shù)據(jù)挖掘技術(shù)對(duì)道路交通事故數(shù)據(jù)進(jìn)行分析,最終得出了科學(xué)的道路交通事故預(yù)防和交通安全管理決策依據(jù)。尚威等在研究中,對(duì)大量的道路交通數(shù)據(jù)進(jìn)行了有效整合,并在此基礎(chǔ)上按照交通事故相關(guān)因素的不同特點(diǎn)整理出與事故發(fā)生有關(guān)的字段數(shù)據(jù),形成新的事故數(shù)據(jù)記錄表,然后再根據(jù)多維關(guān)聯(lián)規(guī)則對(duì)記錄的相關(guān)數(shù)據(jù)進(jìn)行分析,從而發(fā)現(xiàn)了事故誘導(dǎo)因素記錄字段值和事故結(jié)果字段值組成的道路交通事故頻繁字段的組合。張聽(tīng)等在充分掌握聚類(lèi)數(shù)據(jù)挖掘理論與方法的基礎(chǔ)上,提出了多目標(biāo)聚類(lèi)分析框架和一個(gè)啟發(fā)式的聚類(lèi)算法k-WANMI,并將其用在道路交通事故的聚類(lèi)研究中對(duì)不同權(quán)重的屬性進(jìn)行了多目標(biāo)分析。同樣,許宏科也利用該方法對(duì)公路隧道交通流數(shù)據(jù)進(jìn)行了聚類(lèi)分析,其在研究中不僅明確了隧道交通流的峰值規(guī)律,而且還根據(jù)這種規(guī)律制訂了隧道監(jiān)控設(shè)備的不同控制方案,對(duì)提高隧道交通安全的水平做了極大的貢獻(xiàn)。徐磊和方源敏在研究中,提出了由簡(jiǎn)化信息熵構(gòu)造的改進(jìn)C4.5決策樹(shù)算法,并將其應(yīng)用在交通事故數(shù)據(jù)的研究中,對(duì)交通數(shù)據(jù)進(jìn)行了正確分類(lèi),發(fā)現(xiàn)了一些隱藏的規(guī)則和知識(shí),為交通管理提供了依據(jù)。劉軍、艾力斯木吐拉、馬曉松運(yùn)用多維關(guān)聯(lián)規(guī)則分析交通事故記錄,從而找到導(dǎo)致交通事故發(fā)生次數(shù)多的主要原因,并且指導(dǎo)相關(guān)部門(mén)作出相應(yīng)的決策。楊希剛運(yùn)用關(guān)聯(lián)規(guī)則為現(xiàn)實(shí)中的交通事故的預(yù)防提供依據(jù)。吉林大學(xué)的吳昊等人,基于關(guān)聯(lián)規(guī)則的理論基礎(chǔ),定義了公路交通事故屬性模型,并結(jié)合改進(jìn)后的Apriori算法,分析了交通事故歷史數(shù)據(jù)信息,為有關(guān)單位和用戶(hù)尋找道路黑點(diǎn)(即事故多發(fā)點(diǎn))提供了技術(shù)支援和決策幫助。

  4結(jié)語(yǔ)

  通過(guò)數(shù)據(jù)挖掘中的關(guān)聯(lián)分析方法雖然能夠?qū)Φ缆方煌ㄊ鹿实南嚓P(guān)因素進(jìn)行清晰的分析,但是目前在這一方面的研究仍有不足之處。因?yàn)殛P(guān)聯(lián)分析在道路交通事故的研究中往往只能片面發(fā)現(xiàn)某一種或幾種因素影響交通事故的規(guī)律,很難將所有影響因素結(jié)合起來(lái)進(jìn)行全面系統(tǒng)的分析。然而道路交通事故的發(fā)生通常都是由相應(yīng)因素導(dǎo)致,而后事故當(dāng)事人意識(shí)到危險(xiǎn)源的存在并采取措施,直到事故發(fā)生的連續(xù)過(guò)程,整體來(lái)看體現(xiàn)了時(shí)序性。也就是說(shuō),道路交通事故是受到一系列按照時(shí)間先后順序排列的影響因素組合共同作用而發(fā)生的,從整體的角度出發(fā)研究事故發(fā)生機(jī)理更加科學(xué)。

  參考文獻(xiàn)

  [1]楊秀萍.大數(shù)據(jù)下關(guān)聯(lián)規(guī)則算法的改進(jìn)及應(yīng)用[J].計(jì)算機(jī)與現(xiàn)代化,20xx(12):23-26.

  [2]王云,蘇勇.關(guān)聯(lián)規(guī)則挖掘在道路交通事故分析中的應(yīng)用[J].科學(xué)技術(shù)與工程,20xx(7):1824-1827.

  [3]徐磊,方源敏.基于決策樹(shù)C4.5改進(jìn)算法的交通數(shù)據(jù)挖掘[J].微處理機(jī),20xx,31(6):57-59.

  [4]楊希剛.數(shù)據(jù)挖掘在交通事故中的應(yīng)用[[J].軟件導(dǎo)刊,20xx,7(26):18-20.

數(shù)據(jù)挖掘論文9

  摘要:隨著信息技術(shù)的發(fā)展與進(jìn)步,大數(shù)據(jù)時(shí)代已經(jīng)悄然走進(jìn)人們身邊,云計(jì)算技術(shù)的運(yùn)用已經(jīng)隨處可見(jiàn),并改變和影響著人們的生活。在此基礎(chǔ)上,數(shù)據(jù)挖掘技術(shù)產(chǎn)生并發(fā)展,其在信息安全系統(tǒng)開(kāi)發(fā)和建設(shè)方面產(chǎn)生重要影響和作用,以數(shù)據(jù)挖掘技術(shù)為依托構(gòu)建相應(yīng)的信息安全系統(tǒng)則更加能夠讓網(wǎng)絡(luò)信息建設(shè)可靠、安全。

  關(guān)鍵詞:數(shù)據(jù)挖掘技術(shù);信息安全系統(tǒng);開(kāi)發(fā)研究

  一、數(shù)據(jù)挖掘的主要任務(wù)

  在數(shù)據(jù)挖掘的主要任務(wù)中,包含關(guān)聯(lián)分析、聚類(lèi)分析、異常檢測(cè)等任務(wù)。關(guān)聯(lián)分析也叫頻繁模式分析,其指的是就同一任務(wù)或者統(tǒng)一事件的查找過(guò)程中,另一事件也同樣會(huì)發(fā)生相同規(guī)律,兩者之間具有緊密聯(lián)系。聚類(lèi)分析主要是的是對(duì)各個(gè)數(shù)據(jù)內(nèi)在的規(guī)律摸索,以及特點(diǎn)分析,通過(guò)對(duì)特點(diǎn)和規(guī)律進(jìn)行對(duì)比,依照特點(diǎn)和規(guī)律進(jìn)行數(shù)據(jù)源分類(lèi),使其成為若干個(gè)數(shù)據(jù)庫(kù)。異常檢測(cè)指的是對(duì)數(shù)據(jù)樣本的范本進(jìn)行建設(shè),利用這一范本,與數(shù)據(jù)源中所存在的數(shù)據(jù)開(kāi)展對(duì)比分析工作,將數(shù)據(jù)中的異常樣本查找出來(lái)[1]。在監(jiān)督學(xué)習(xí)中,主要包含分類(lèi)與預(yù)測(cè)兩種形式,利用已知樣本的類(lèi)型與大小,對(duì)新到樣本開(kāi)展有關(guān)預(yù)測(cè)活動(dòng)。

  二、基于數(shù)據(jù)挖掘的網(wǎng)絡(luò)信息安全策略

  1.安全的網(wǎng)絡(luò)環(huán)境

 。1)對(duì)控制技術(shù)進(jìn)行隔離與訪(fǎng)問(wèn),包括物理隔離、可信網(wǎng)絡(luò)隔離、邏輯隔離與不可信網(wǎng)絡(luò)隔離,相關(guān)用戶(hù)如果需要進(jìn)行網(wǎng)絡(luò)資源搜集或者訪(fǎng)問(wèn),需要得到相關(guān)授權(quán)。

  (2)對(duì)防病毒技術(shù)進(jìn)行運(yùn)用,由于網(wǎng)絡(luò)安全已受到病毒的嚴(yán)重威脅,應(yīng)當(dāng)對(duì)病毒預(yù)警、防護(hù)以及應(yīng)急機(jī)制進(jìn)行建設(shè),確保網(wǎng)絡(luò)的安全性;

 。3)通過(guò)網(wǎng)絡(luò)入侵檢測(cè)技術(shù)的應(yīng)用,能夠?qū)Ψ欠ㄈ肭终叩钠茐男袨榧皶r(shí)發(fā)現(xiàn),并依照存在的隱患進(jìn)行預(yù)警機(jī)制的建設(shè)。網(wǎng)絡(luò)安全環(huán)境的建設(shè)還包括對(duì)系統(tǒng)安全性開(kāi)展定期分析,在第一時(shí)間對(duì)系統(tǒng)漏洞進(jìn)行查找,并制定有關(guān)解決措施;

 。4)通過(guò)有關(guān)分析審計(jì)工作的開(kāi)展,可以對(duì)計(jì)算機(jī)網(wǎng)絡(luò)中的各種運(yùn)行活動(dòng)進(jìn)行記錄,不僅可以對(duì)網(wǎng)絡(luò)訪(fǎng)問(wèn)者予以確定,而且還能夠?qū)ο到y(tǒng)的使用情況進(jìn)行記錄;

 。5)通過(guò)網(wǎng)絡(luò)備份與災(zāi)難恢復(fù)工作,能夠利用最短的時(shí)間回復(fù)已破壞的系統(tǒng)。

  2.保證數(shù)據(jù)挖掘信息安全的策略。安全的數(shù)據(jù)挖掘信息指的是數(shù)據(jù)挖掘信息的儲(chǔ)存、傳送以及運(yùn)用工作的安全性。在數(shù)據(jù)挖掘信息的.存儲(chǔ)安全中,主要包括其物理完整性、邏輯完整性以及保密性。利用數(shù)據(jù)完整性技術(shù)、數(shù)據(jù)傳輸加密技術(shù)以及防抵賴(lài)性技術(shù),使數(shù)據(jù)挖掘信息傳送的安全性得到充分保障。數(shù)據(jù)挖掘信息運(yùn)用的安全性指的是針對(duì)網(wǎng)絡(luò)中的主體,應(yīng)當(dāng)開(kāi)展有關(guān)驗(yàn)證工作,預(yù)防非授權(quán)主體對(duì)網(wǎng)絡(luò)資源進(jìn)行私自運(yùn)用。

  3.基于數(shù)據(jù)挖掘的網(wǎng)絡(luò)安全數(shù)據(jù)分析策略

 。1)關(guān)聯(lián)性分析。在一次攻擊行為中,利用源地址、目的地址以及攻擊類(lèi)型這三要素,通過(guò)三要素之間的隨意指定或組合,都能夠?qū)⒕邆湟欢ㄒ饬x的網(wǎng)絡(luò)攻擊態(tài)勢(shì)反映出來(lái)。

 。2)事件預(yù)測(cè)機(jī)制。對(duì)某一事件的發(fā)展情況進(jìn)行跟蹤,通過(guò)數(shù)據(jù)聚類(lèi)算法的應(yīng)用,對(duì)依照網(wǎng)絡(luò)事件所構(gòu)建的模型進(jìn)行分析,進(jìn)而做出判定。一般來(lái)說(shuō),規(guī)模比較大的網(wǎng)絡(luò)事件中,擴(kuò)散一般是其所呈現(xiàn)的重要特征。

 。3)可控?cái)?shù)量預(yù)測(cè)模型。利用對(duì)事件中受控主機(jī)狀態(tài)增長(zhǎng)數(shù)量進(jìn)行觀(guān)測(cè),判斷該事件的感染能力。所謂的受控主機(jī)狀態(tài)增長(zhǎng)指的是,先前未檢測(cè)出主機(jī)受到某類(lèi)攻擊,利用有關(guān)檢測(cè),對(duì)其狀態(tài)變化增長(zhǎng)情況予以發(fā)現(xiàn)[2]。

 。4)分析處理模型。通過(guò)分析處理模型,能夠科學(xué)分析運(yùn)營(yíng)商事件處理反饋情況,并對(duì)其針對(duì)被控主機(jī)的處理能力進(jìn)行判定。利用對(duì)所有運(yùn)營(yíng)商所開(kāi)展的綜合評(píng)估,能夠?qū)ζ涔茌牱秶鷥?nèi)的主機(jī)處理能力予以綜合判斷。

 。5)網(wǎng)絡(luò)安全數(shù)據(jù)分析模型。針對(duì)網(wǎng)絡(luò)事件進(jìn)行數(shù)據(jù)分析,通過(guò)分析構(gòu)建相應(yīng)模型,結(jié)合模型進(jìn)行異常情況的跟進(jìn)和跟蹤,從而為網(wǎng)絡(luò)安全環(huán)境的營(yíng)造創(chuàng)造條件。其運(yùn)行過(guò)程主要包括兩個(gè)階段:

  ①在學(xué)習(xí)階段中,用戶(hù)主要是對(duì)事件進(jìn)行確定,并在計(jì)算機(jī)系統(tǒng)中進(jìn)行定義,對(duì)各個(gè)時(shí)間段所發(fā)生的安全事件數(shù)量進(jìn)行統(tǒng)計(jì)。一般來(lái)說(shuō),統(tǒng)計(jì)以小時(shí)為單位,單位時(shí)間內(nèi)的安全事件平均數(shù)為x,方差為σ。

  ②在實(shí)時(shí)檢測(cè)階段中,根據(jù)時(shí)間間隔各類(lèi)安全事件的數(shù)量ix對(duì)安全事件數(shù)量是否出現(xiàn)異常情況進(jìn)行判定,正常的安全事件數(shù)量輕度異常的安全事件數(shù)量中度異常的安全事件數(shù)量重度異常的安全事件數(shù)量在建設(shè)模型的過(guò)程中開(kāi)展有關(guān)配置工作,依據(jù)不同的情形,對(duì)該參數(shù)進(jìn)行調(diào)整,各類(lèi)安全事件數(shù)量異常的最高值也就是安全事件數(shù)量指標(biāo)值。

  三、結(jié)語(yǔ)

  云計(jì)算和大數(shù)據(jù)時(shí)代都對(duì)信息技術(shù)提出了更高的安全要求和標(biāo)準(zhǔn),網(wǎng)絡(luò)安全系統(tǒng)的構(gòu)建影響著人們的生活和生產(chǎn),并對(duì)相關(guān)的數(shù)據(jù)起到重要保護(hù)作用。結(jié)合數(shù)據(jù)挖掘技術(shù)進(jìn)行信息安全系統(tǒng)的開(kāi)發(fā)和建設(shè),則能夠更好地促進(jìn)網(wǎng)絡(luò)安全性的提升,能夠有效抵制網(wǎng)絡(luò)不法分子的侵襲,讓網(wǎng)絡(luò)安全性真正為人們的生活工作提供幫助。

  參考文獻(xiàn)

  [1]趙悅品.網(wǎng)絡(luò)信息安全防范與Web數(shù)據(jù)挖掘系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J].現(xiàn)代電子技術(shù),20xx,40(04):61-65.

  [2]梁雪霆.數(shù)據(jù)挖掘技術(shù)的計(jì)算機(jī)網(wǎng)絡(luò)病毒防御技術(shù)研究[J].科技經(jīng)濟(jì)市場(chǎng),20xx(01):25.

數(shù)據(jù)挖掘論文10

  摘 要:數(shù)據(jù)挖掘技術(shù)在各行業(yè)都有廣泛運(yùn)用,是一種新興信息技術(shù)。而在線(xiàn)考試系統(tǒng)中存在著很多的數(shù)據(jù)信息,數(shù)據(jù)挖掘技在在線(xiàn)考試系統(tǒng)有著重要的意義,和良好的應(yīng)用前景,從而在眾多技術(shù)中脫穎而出。本文從對(duì)數(shù)據(jù)挖掘技術(shù)的初步了解,簡(jiǎn)述數(shù)據(jù)挖掘技術(shù)在在線(xiàn)考試系統(tǒng)中成績(jī)分析,以及配合成績(jī)分析,完善教學(xué)。

  關(guān)鍵詞:數(shù)據(jù)挖掘技術(shù);在線(xiàn)考試;成績(jī)分析 ;完善教學(xué)

  隨著計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)的快速發(fā)展,計(jì)算機(jī)輔助教育的不斷普及,在線(xiàn)考試是一種利用網(wǎng)絡(luò)技術(shù)的重要輔助教育手段,其改革有著重要的意義。數(shù)據(jù)挖掘技術(shù)作為一種新興的信息技術(shù),其包括了人工智能、數(shù)據(jù)庫(kù)、統(tǒng)計(jì)學(xué)等學(xué)科的內(nèi)容,是一門(mén)綜合性的技術(shù)。這種技術(shù)的主要特點(diǎn)是對(duì)數(shù)據(jù)庫(kù)中大量的數(shù)據(jù)進(jìn)行抽取、轉(zhuǎn)換和分析,從中提取出能夠?qū)處熡凶饔玫年P(guān)鍵性數(shù)據(jù)。將其運(yùn)用于在線(xiàn)考試系統(tǒng)中,能夠很好的處理在線(xiàn)考試中涉及到的數(shù)據(jù),讓在線(xiàn)考試的實(shí)用性和高效性得到進(jìn)一步的增強(qiáng),幫助教師更加快速、完整的統(tǒng)計(jì)考試信息,完善教學(xué)。

  1.初步了解數(shù)據(jù)挖掘技術(shù)

  數(shù)據(jù)挖掘技術(shù)是從大量數(shù)據(jù)中"挖掘"出對(duì)使用者有用的知識(shí),即從大量的、隨機(jī)的、有噪聲的、模糊的、不完全的實(shí)際應(yīng)用數(shù)據(jù)中,"挖掘"出隱含在其中但人們事先卻不知道的,而又是對(duì)人們潛在有用的信息與知識(shí)的整個(gè)過(guò)程。

  目前主要的商業(yè)數(shù)據(jù)挖掘系統(tǒng)有SAS公司的Enterprise Miner,SPSS公司的Clementine,Sybas公司的Warehouse Studio,MinerSGI公司的Mineset,RuleQuest Research公司的See5,IBM公司的Intelligent,還有 CoverStory, Knowledge Discovery,Quest,EXPLORA, DBMiner,Workbench等。

  2.數(shù)據(jù)挖掘在在線(xiàn)考試中的主要任務(wù)

  2.1數(shù)據(jù)分類(lèi)

  數(shù)據(jù)挖掘技術(shù)通過(guò)對(duì)數(shù)據(jù)庫(kù)中的數(shù)據(jù)進(jìn)行分析,把數(shù)據(jù)按照相似性歸納成若干類(lèi)別,然后做出分類(lèi),并能夠?yàn)槊恳粋(gè)類(lèi)別都做出一個(gè)準(zhǔn)確的描述,挖掘出分類(lèi)的規(guī)則或建立一個(gè)分類(lèi)模型。

  2.2數(shù)據(jù)關(guān)聯(lián)分析

  數(shù)據(jù)庫(kù)中的數(shù)據(jù)關(guān)聯(lián)是一項(xiàng)非常重要,并可以發(fā)現(xiàn)的知識(shí)。數(shù)據(jù)關(guān)聯(lián)就是兩組或兩組以上的數(shù)據(jù)之間有著某種規(guī)律性的聯(lián)系。數(shù)據(jù)關(guān)聯(lián)分析的作用就是找出數(shù)據(jù)庫(kù)中隱藏的聯(lián)系,從中得到一些對(duì)學(xué)校教學(xué)工作管理者有用的信息。就像是在購(gòu)物中,就可以通過(guò)顧客的購(gòu)買(mǎi)物品的聯(lián)系,從中得到顧客的購(gòu)買(mǎi)習(xí)慣。

  2.3預(yù)測(cè)

  預(yù)測(cè)是根據(jù)已經(jīng)得到的數(shù)據(jù),從而對(duì)未來(lái)的情況做出一個(gè)可能性的分析。數(shù)據(jù)挖掘技術(shù)能自動(dòng)在大型的數(shù)據(jù)庫(kù)中做出一個(gè)較為準(zhǔn)確的分析。就像是在市場(chǎng)投資中,可以通過(guò)各種商品促銷(xiāo)的數(shù)據(jù)來(lái)做出一個(gè)未來(lái)商品的促銷(xiāo)走勢(shì)。從而在投資中得到最大的回報(bào)。

  3.數(shù)據(jù)挖掘的方法

  數(shù)據(jù)挖掘技術(shù)融合了多個(gè)學(xué)科、多個(gè)領(lǐng)域的知識(shí)與技術(shù),因此數(shù)據(jù)挖掘的方法也呈現(xiàn)出很多種類(lèi)的形式。就目前的統(tǒng)計(jì)分析類(lèi)的數(shù)據(jù)挖掘技術(shù)的角度來(lái)講,光統(tǒng)計(jì)分析技術(shù)中所用到的數(shù)據(jù)挖掘模型就回歸分析、邏輯回歸分析、有線(xiàn)性分析、非線(xiàn)性分析、單變量分析、多變量分析、最近鄰算法、最近序列分析、聚類(lèi)分析和時(shí)間序列分析等多種方法。數(shù)據(jù)挖掘技術(shù)利用這些方法對(duì)那些異常形式的數(shù)據(jù)進(jìn)行檢查,然后通過(guò)各種數(shù)據(jù)模型和統(tǒng)計(jì)模型對(duì)這些數(shù)據(jù)來(lái)進(jìn)行解釋?zhuān)倪@些數(shù)據(jù)中找出隱藏在其中的商業(yè)機(jī)會(huì)和市場(chǎng)規(guī)律。另外還有知識(shí)發(fā)現(xiàn)類(lèi)數(shù)據(jù)挖掘技術(shù),這種和統(tǒng)計(jì)分析類(lèi)的數(shù)據(jù)挖掘技術(shù)完全不同,其中包括了支持向量機(jī)、人工神經(jīng)元網(wǎng)絡(luò)、遺傳算法、決策樹(shù)、粗糙集、關(guān)聯(lián)順序和規(guī)則發(fā)現(xiàn)等多種方法。

  4.數(shù)據(jù)挖掘在考試成績(jī)分析中的幾點(diǎn)應(yīng)用

  4.1運(yùn)用關(guān)聯(lián)規(guī)則分析教師的年齡對(duì)學(xué)生考試成績(jī)的影響

  數(shù)據(jù)挖掘技術(shù)中的關(guān)聯(lián)分析在教學(xué)分析中,是一種使用頻繁,行之有效的方法,它能挖掘出大量數(shù)據(jù)中項(xiàng)集之間之間有意義的關(guān)聯(lián)聯(lián)系,幫助知道教師的教學(xué)過(guò)程。例如在如今的一些高職院校中,就往往會(huì)把學(xué)生的英語(yǔ)四六級(jí)過(guò)級(jí)率,計(jì)算機(jī)等級(jí)等,以這些為依據(jù)來(lái)評(píng)價(jià)教師的教學(xué)效果。將數(shù)據(jù)挖掘技術(shù)中的關(guān)聯(lián)規(guī)則運(yùn)用于考試的成績(jī)分析當(dāng)中,就能夠挖掘出一些對(duì)學(xué)生過(guò)級(jí)率產(chǎn)生影響的因素,對(duì)教師的教學(xué)過(guò)程進(jìn)行重要的指導(dǎo),讓教師的'教學(xué)效率更高,作用更強(qiáng)。

  還可以通過(guò)關(guān)聯(lián)規(guī)則算法,先設(shè)定一個(gè)最小可信度和支持度,得到初步的關(guān)聯(lián)規(guī)則,根據(jù)相關(guān)規(guī)則,分析出教師的組成結(jié)構(gòu)和過(guò)級(jí)率的影響,從來(lái)進(jìn)行教師隊(duì)伍的結(jié)構(gòu)調(diào)整,讓教師隊(duì)伍更加合理。

  4.2采用分類(lèi)算法探討對(duì)考試成績(jī)有影響的因素

  數(shù)據(jù)挖掘技術(shù)中的分類(lèi)算法就是對(duì)一組對(duì)象或一個(gè)事件進(jìn)行歸類(lèi),然后通過(guò)這些數(shù)據(jù),可以進(jìn)行分類(lèi)模型的建立和未來(lái)的預(yù)測(cè)。分類(lèi)算法可以進(jìn)行考試中得到的數(shù)據(jù)進(jìn)行分類(lèi),然后通過(guò)學(xué)生的一些基本情況進(jìn)行探討一些對(duì)考試成績(jī)有影響的因素。分類(lèi)算法可以用一下步驟實(shí)施:

  4.2.1數(shù)據(jù)采集

  這種方法首先要進(jìn)行數(shù)據(jù)采集,需要這幾方面的數(shù)據(jù),學(xué)生基本信息(姓名、性別、學(xué)號(hào)、籍貫、所屬院系、專(zhuān)業(yè)、班級(jí)等)、學(xué)生調(diào)查信息(比如學(xué)習(xí)前的知識(shí)掌握情況、學(xué)習(xí)興趣、課堂學(xué)習(xí)效果、課后復(fù)習(xí)時(shí)間量等)、成績(jī)(學(xué)生平常學(xué)習(xí)成績(jī),平?荚嚦煽(jī),各種大型考試成績(jī)等)、學(xué)生多次考試中出現(xiàn)的易錯(cuò)點(diǎn)(本次考試中出現(xiàn)的易錯(cuò)點(diǎn),以往考試中出現(xiàn)的易錯(cuò)點(diǎn))

  4.2.2數(shù)據(jù)預(yù)處理

 。1)數(shù)據(jù)集成。把數(shù)據(jù)采集過(guò)程中得到的多種信息,利用數(shù)據(jù)挖掘技術(shù)中的數(shù)據(jù)庫(kù)技術(shù)生產(chǎn)相應(yīng)的學(xué)生考試成績(jī)分析基本數(shù)據(jù)庫(kù)。(2)數(shù)據(jù)清理。在學(xué)生成績(jī)分析數(shù)據(jù)庫(kù)中,肯定會(huì)出現(xiàn)一些情況缺失,對(duì)于這些空缺處,就需要使用數(shù)據(jù)清理技術(shù)來(lái)進(jìn)行這些數(shù)據(jù)庫(kù)中數(shù)據(jù)的填補(bǔ)遺漏。例如,可以采用忽略元組的方法來(lái)刪除那些沒(méi)有參加考試的學(xué)生考試數(shù)據(jù)已經(jīng)在學(xué)生填寫(xiě)的調(diào)查數(shù)據(jù)中村中的空缺項(xiàng)。(3)數(shù)據(jù)轉(zhuǎn)換。數(shù)據(jù)轉(zhuǎn)換主要功能是進(jìn)行進(jìn)行數(shù)據(jù)的離散化操作。在這個(gè)過(guò)程中可以根據(jù)實(shí)際需要進(jìn)行分類(lèi),比如把考試成績(jī)從0~59的分到較差的一類(lèi),將60到80分為中等類(lèi),81到100分為優(yōu)秀等。(4)數(shù)據(jù)消減。數(shù)據(jù)消減的功能就是把所需挖掘的數(shù)據(jù)庫(kù),在消減的過(guò)程又不能影響到最終的數(shù)據(jù)挖掘結(jié)果。比如在分析學(xué)生的基本學(xué)習(xí)情況的影響因素情況中,學(xué)生信息表中中出現(xiàn)的字段很多,可以選擇性的刪除班別、籍貫等引述,形成一份新的學(xué)生基本成績(jī)分析數(shù)據(jù)表。

  4.2.3利用數(shù)據(jù)挖掘技術(shù),得出結(jié)論

  通過(guò)數(shù)據(jù)挖掘技術(shù)在在線(xiàn)考試中的應(yīng)用,得出這些學(xué)生數(shù)據(jù)的相關(guān)分析,比如說(shuō)學(xué)生考試中的易錯(cuò)點(diǎn)在什么地方,學(xué)生考試成績(jī)的自身原因,學(xué)生考試成績(jī)的環(huán)境原因,教師隊(duì)伍的搭配情況等等,從中得出如何調(diào)整學(xué)校教學(xué)資源,教師的教學(xué)方案調(diào)整等等,從而完善學(xué)校對(duì)學(xué)生的教學(xué)。

  5.結(jié)語(yǔ)

  數(shù)據(jù)挖掘技術(shù)在社會(huì)各行各業(yè)中都有一定程度的使用,基于其在數(shù)據(jù)組織、分析能力、知識(shí)發(fā)現(xiàn)和信息深層次挖掘的能力,在使用中取得了顯著的成效,但數(shù)據(jù)挖掘技術(shù)中還存在著一些問(wèn)題,例如數(shù)據(jù)的挖掘算法、預(yù)處理、可視化問(wèn)題、模式識(shí)別和解釋等等。對(duì)于這些問(wèn)題,學(xué)校教學(xué)管理工作者要清醒的認(rèn)識(shí),在在線(xiàn)考試系統(tǒng)中對(duì)數(shù)據(jù)挖掘信息做出合理的使用,讓數(shù)字挖掘技術(shù)在在線(xiàn)考試系統(tǒng)中能夠更加有效的發(fā)揮其長(zhǎng)處,避免其在在線(xiàn)考試系統(tǒng)中的的缺陷。

  參考文獻(xiàn):

  [1]胡玉榮.基于粗糙集理論的數(shù)據(jù)挖掘技術(shù)在高校學(xué)生成績(jī)分析中的作用[J].荊門(mén)職業(yè)技術(shù)學(xué)院學(xué)報(bào),20xx,12(22):12.

  [2][加]韓家煒,堪博(Kam ber M.) .數(shù)據(jù)挖掘:概念與技術(shù)(第2版)[M]范明,譯.北京:機(jī)械工業(yè)出版社,20xx.

  [3]王潔.《在線(xiàn)考試系統(tǒng)的設(shè)計(jì)與開(kāi)發(fā)》[J].山西師范大學(xué)學(xué)報(bào),20xx(2).

  [4] 王長(zhǎng)娥.數(shù)據(jù)挖掘技術(shù)在教育中的應(yīng)用[J].計(jì)算機(jī)與信息技術(shù),20xx(11)

數(shù)據(jù)挖掘論文11

  摘 要:高度開(kāi)放的中國(guó)金融市場(chǎng),特別是中國(guó)銀行業(yè)市場(chǎng)受到日趨激烈的國(guó)外銀行沖擊和挑戰(zhàn),大多數(shù)銀行企業(yè)都在構(gòu)建以客戶(hù)為中心的客戶(hù)關(guān)系管理體系,這一經(jīng)營(yíng)體系理念的構(gòu)建,不僅僅能提高企業(yè)的知名度和顧客的滿(mǎn)意度,而且能提高企業(yè)的經(jīng)濟(jì)效益。但是,隨著網(wǎng)絡(luò)技

  關(guān)鍵詞:客戶(hù)關(guān)系管理畢業(yè)論文

  高度開(kāi)放的中國(guó)金融市場(chǎng),特別是中國(guó)銀行業(yè)市場(chǎng)受到日趨激烈的國(guó)外銀行沖擊和挑戰(zhàn),大多數(shù)銀行企業(yè)都在構(gòu)建以客戶(hù)為中心的客戶(hù)關(guān)系管理體系,這一經(jīng)營(yíng)體系理念的構(gòu)建,不僅僅能提高企業(yè)的知名度和顧客的滿(mǎn)意度,而且能提高企業(yè)的經(jīng)濟(jì)效益。但是,隨著網(wǎng)絡(luò)技術(shù)和信息技術(shù)的發(fā)展,客戶(hù)關(guān)系管理如何能結(jié)合數(shù)據(jù)挖掘技術(shù)和數(shù)據(jù)倉(cāng)庫(kù)技術(shù),增強(qiáng)企業(yè)的核心競(jìng)爭(zhēng)力已經(jīng)成為企業(yè)亟待解決的問(wèn)題。因?yàn),企業(yè)的數(shù)據(jù)挖掘技術(shù)的運(yùn)用能夠解決客戶(hù)的矛盾,為客戶(hù)設(shè)計(jì)獨(dú)立的、擁有個(gè)性化的數(shù)據(jù)產(chǎn)品和數(shù)據(jù)服務(wù),能夠真正意義上以客戶(hù)為核心,防范企業(yè)風(fēng)險(xiǎn),創(chuàng)造企業(yè)財(cái)富。

  關(guān)鍵詞:客戶(hù)關(guān)系管理畢業(yè)論文

  一、數(shù)據(jù)挖掘技術(shù)與客戶(hù)關(guān)系管理兩者的聯(lián)系

  隨著時(shí)代的發(fā)展,銀行客戶(hù)關(guān)系管理的發(fā)展已經(jīng)越來(lái)越依賴(lài)數(shù)據(jù)挖掘技術(shù),而數(shù)據(jù)挖掘技術(shù)是在數(shù)據(jù)倉(cāng)庫(kù)技術(shù)的基礎(chǔ)上應(yīng)運(yùn)而生的,兩者有機(jī)的結(jié)合能夠收集和處理大量的客戶(hù)數(shù)據(jù),通過(guò)數(shù)據(jù)類(lèi)型與數(shù)據(jù)特征,進(jìn)行整合,挖掘具有特殊意義的潛在客戶(hù)和消費(fèi)群體,能夠觀(guān)察市場(chǎng)變化趨勢(shì),這樣的技術(shù)在國(guó)外的銀行業(yè)的客戶(hù)關(guān)系管理廣泛使用。而作為國(guó)內(nèi)的銀行企業(yè),受到國(guó)外銀行業(yè)市場(chǎng)的大幅度沖擊,顯得有些捉襟見(jiàn)肘,面對(duì)大量的數(shù)據(jù)與快速發(fā)展的互聯(lián)網(wǎng)金融體系的沖擊,銀行業(yè)缺乏數(shù)據(jù)分析和存儲(chǔ)功能,往往造成數(shù)據(jù)的流逝,特別是在數(shù)據(jù)的智能預(yù)測(cè)與客戶(hù)關(guān)系管理還處于初步階段。我國(guó)的銀行業(yè)如何能更完善的建立客戶(hù)關(guān)系管理體系與數(shù)據(jù)挖掘技術(shù)相互融合,這樣才能使得企業(yè)獲得更強(qiáng)的企業(yè)核心競(jìng)爭(zhēng)力。

  二、數(shù)據(jù)挖掘技術(shù)在企業(yè)客戶(hù)關(guān)系管理實(shí)行中存在的問(wèn)題

  現(xiàn)今,我國(guó)的金融業(yè)發(fā)展存在著數(shù)據(jù)數(shù)量大,數(shù)據(jù)信息混亂等問(wèn)題,無(wú)法結(jié)合客戶(hù)關(guān)系管理的需要,建立統(tǒng)一而行之有效的數(shù)據(jù)歸納,并以客戶(hù)為中心實(shí)行客戶(hù)關(guān)系管理。

  1.客戶(hù)信息不健全

  在如今的銀行企業(yè),雖然已經(jīng)實(shí)行實(shí)名制戶(hù)籍管理制度,但由于實(shí)行的年頭比較短,特別是以前的數(shù)據(jù)匱乏。重點(diǎn)體現(xiàn)在,銀行的客戶(hù)信息采集主要是姓名和身份證號(hào)碼,而對(duì)于客戶(hù)的職業(yè)、學(xué)歷等相關(guān)信息一概不知,極大的影響了客戶(hù)關(guān)系管理體系的構(gòu)建。另外,數(shù)據(jù)還不能統(tǒng)一和兼容,每個(gè)系統(tǒng)都是獨(dú)立的系統(tǒng),比如:信貸系統(tǒng)、儲(chǔ)蓄系統(tǒng)全部分離。這樣存在交叉、就不能掌握出到底擁有多少客戶(hù),特別是那些需要服務(wù)的目標(biāo)客戶(hù),無(wú)法享受到銀行給予的高質(zhì)量的優(yōu)質(zhì)服務(wù)。

  2.數(shù)據(jù)集中帶來(lái)的差異化的憂(yōu)慮

  以客戶(hù)為中心的客戶(hù)關(guān)系管理體系,是建立在客戶(hù)差異化服務(wù)的基礎(chǔ)上的,而作為銀行大多數(shù)以數(shù)據(jù)集中,全部有總行分配,這樣不僅不利于企業(yè)的差異化服務(wù),給顧客提供優(yōu)質(zhì)得到個(gè)性化業(yè)務(wù),同時(shí),分行也很難對(duì)挖掘潛在客戶(hù)和分析客戶(hù)成分提供一手的數(shù)據(jù),損失客戶(hù)的利益,做到數(shù)據(jù)集中,往往是不明智的選擇。

  3.經(jīng)營(yíng)管理存在弊端

  從組織結(jié)構(gòu)上,我國(guó)的銀行體系設(shè)置機(jī)構(gòu)龐雜,管理人員與生產(chǎn)服務(wù)人員脫節(jié)現(xiàn)象極其普遍,管理人員不懂業(yè)務(wù),只是一味的抓市場(chǎng),而沒(méi)有有效的營(yíng)銷(xiāo)手段,更別說(shuō)以市場(chǎng)為導(dǎo)向,以客戶(hù)為核心,建立客戶(hù)關(guān)系管理體系。大多數(shù)的人完全是靠關(guān)系而非真正意義上靠能力,另外,業(yè)務(wù)流程繁瑣,不利于客戶(hù)享受更多的星級(jí)待遇,這與數(shù)據(jù)發(fā)掘的運(yùn)用背道而馳,很難體現(xiàn)出客戶(hù)關(guān)系管理的價(jià)值。

  三、數(shù)據(jù)挖掘技術(shù)在企業(yè)的應(yīng)用和實(shí)施

  如何能更好的`利用數(shù)據(jù)挖掘技術(shù)與客戶(hù)關(guān)系管理進(jìn)行合理的搭配和結(jié)合是現(xiàn)今我們面臨的最大問(wèn)題。所有我們對(duì)客戶(hù)信息進(jìn)行分析,利用模糊聚類(lèi)分析方法對(duì)客戶(hù)進(jìn)行分類(lèi),通過(guò)建立個(gè)性化的信息服務(wù)體系,真正意義的提高客戶(hù)的價(jià)值。

  1.優(yōu)化客戶(hù)服務(wù)

  以客戶(hù)為中心提高服務(wù)質(zhì)量是銀行發(fā)展的根源。要利用數(shù)據(jù)挖掘技術(shù)的優(yōu)勢(shì),發(fā)現(xiàn)信貸趨勢(shì),及時(shí)掌握客戶(hù)的需求,為客戶(hù)提高網(wǎng)上服務(wù),網(wǎng)上交易,網(wǎng)上查詢(xún)等功能,高度體現(xiàn)互聯(lián)網(wǎng)的作用,動(dòng)態(tài)挖掘數(shù)據(jù),通過(guò)智能化的信貸服務(wù),拓寬銀行業(yè)務(wù)水平,保證客戶(hù)的滿(mǎn)意度。

  2.利用數(shù)據(jù)挖掘技術(shù)建立多渠道客戶(hù)服務(wù)系統(tǒng)

  利用數(shù)據(jù)挖掘技術(shù)整合銀行業(yè)務(wù)和營(yíng)銷(xiāo)環(huán)節(jié)為客戶(hù)提供綜合性的服務(wù)。采用不同的渠道實(shí)現(xiàn)信息共享,針對(duì)目標(biāo)客戶(hù)推薦銀行新產(chǎn)品,拓寬新領(lǐng)域,告別傳統(tǒng)的柜臺(tái)服務(wù)體系,實(shí)行互聯(lián)網(wǎng)與柜臺(tái)體系相結(jié)合的多渠道服務(wù)媒介體系。優(yōu)化客戶(hù)關(guān)系管理理念,推進(jìn)營(yíng)銷(xiāo)戰(zhàn)略的執(zhí)行。提高企業(yè)的美譽(yù)度。

  四、數(shù)據(jù)挖掘技術(shù)是銀行企業(yè)客戶(hù)關(guān)系管理體系構(gòu)建的基礎(chǔ)

  隨著信息技術(shù)的不斷發(fā)展,網(wǎng)絡(luò)技術(shù)的快速推進(jìn),客戶(hù)關(guān)系管理體系要緊跟時(shí)代潮流,緊密?chē)@客戶(hù)為中心,利用信息優(yōu)勢(shì),自動(dòng)獲取客戶(hù)需求,打造出更多的個(gè)性化、差異化客戶(hù)服務(wù)理念,使得為企業(yè)核心競(jìng)爭(zhēng)能力得到真正意義的提高。

數(shù)據(jù)挖掘論文12

  1、數(shù)據(jù)挖掘技術(shù)的概念和實(shí)用價(jià)值

  1.1 數(shù)據(jù)挖掘的概念

  所謂數(shù)據(jù)挖掘,其實(shí)就是從大量繁雜的數(shù)據(jù)中找出對(duì)自己發(fā)展有益的數(shù)據(jù)、模型及規(guī)律。主要依據(jù)事先確定好的商業(yè)目標(biāo),深入分析和研究各種企業(yè)數(shù)據(jù),發(fā)掘里面隱藏的商業(yè)內(nèi)容,還要在工作中不斷提高其科學(xué)性。數(shù)據(jù)挖掘的綜合型較強(qiáng),需要使用諸多專(zhuān)業(yè)理論以及技術(shù)工具,主要有數(shù)據(jù)庫(kù)技術(shù)、統(tǒng)計(jì)學(xué)、機(jī)器學(xué)習(xí)、模型識(shí)別、人工智能、神經(jīng)網(wǎng)絡(luò)等。

  1.1.1 分類(lèi)

  其實(shí)質(zhì)就是對(duì)數(shù)據(jù)進(jìn)行分門(mén)別類(lèi)。先從數(shù)據(jù)中挑選出分類(lèi)完的訓(xùn)練集,然后將其作為依據(jù)來(lái)設(shè)置一個(gè)科學(xué)的分類(lèi)模型,還要將雜亂的數(shù)據(jù)進(jìn)行綜合整理。

  1.1.2 估值

  估值和分類(lèi)有很多相同點(diǎn),其差異在于:分散是對(duì)離散型變量進(jìn)行輸出,但估值輸出的是連續(xù)值,且分類(lèi)的類(lèi)別是有數(shù)目規(guī)定的,但估值卻是隨意的。

  1.1.3 預(yù)測(cè)

  一般情況下,預(yù)測(cè)要借助分類(lèi)或估值才能發(fā)揮效果,具體說(shuō)來(lái),就是用分類(lèi)及估值期間使用的模型來(lái)預(yù)估未知的變量。檢測(cè)的目的與其大同小異,但而其結(jié)果必須經(jīng)時(shí)間驗(yàn)證,也就是說(shuō)在很長(zhǎng)一段時(shí)間后,才可以評(píng)估其準(zhǔn)確性。

  1.1.4 相關(guān)性分組或關(guān)聯(lián)規(guī)則

  要記錄好時(shí)間類(lèi)型及發(fā)生日期,這樣可以為后續(xù)的施工提供借鑒。

  1.1.5 聚類(lèi)

  就是對(duì)各種數(shù)據(jù)進(jìn)行整理并且分類(lèi),以聚集為類(lèi)別。兩者的主要區(qū)別是聚類(lèi)不需要事先定義好類(lèi)別,不用借助訓(xùn)練集。

  1.1.6 描述和可視化

  用歸約、概括、圖形表示等方式來(lái)表示數(shù)據(jù)。

  1.2 數(shù)據(jù)挖掘在電力企業(yè)的使用價(jià)值

  商業(yè)領(lǐng)域?qū)τ跀?shù)據(jù)挖掘技術(shù)的需求較大,因此數(shù)據(jù)挖掘在多個(gè)商業(yè)領(lǐng)域得到了大范圍的應(yīng)用。下文便依據(jù)電力企業(yè)的行業(yè)特征來(lái)論述一下數(shù)據(jù)挖掘技術(shù)在電力企業(yè)中的重要作用。

  1.2.1 指導(dǎo)設(shè)備更新

  在發(fā)生了下述兩種情況時(shí)就要對(duì)設(shè)備進(jìn)行更新:首先,電力設(shè)施意外毀壞,這便要第一時(shí)間更換,一般電力設(shè)備監(jiān)控設(shè)施可以檢測(cè)出這類(lèi)故障,這樣也能夠在第一時(shí)間進(jìn)行維修。其次是更換老化的設(shè)備,這就需要以經(jīng)驗(yàn)為依據(jù),例如檢查設(shè)備的使用年限等,但這種方式并不具有多大的科學(xué)性,因?yàn)楹芏嘣O(shè)備可能由于保養(yǎng)得當(dāng)而延長(zhǎng)使用年限,如果貿(mào)然更換會(huì)產(chǎn)生巨大的浪費(fèi);還有些設(shè)備的使用時(shí)間可能不長(zhǎng),但是其性能卻已經(jīng)不滿(mǎn)足標(biāo)準(zhǔn),若不及時(shí)更換也會(huì)產(chǎn)生巨大的浪費(fèi)。一般情況下,我們可以借助故障保修、電力耗費(fèi)及相關(guān)電力參數(shù)等各種數(shù)據(jù)來(lái)確定電力設(shè)備的故障及老化狀況,最終確定是否更換設(shè)備。

  1.2.2 業(yè)績(jī)?cè)u(píng)估

  我國(guó)的電力企業(yè)一直沒(méi)有一套標(biāo)準(zhǔn)的.體系來(lái)評(píng)價(jià)集團(tuán)公司分公司的成績(jī)。若只評(píng)估其所創(chuàng)造的經(jīng)濟(jì)利潤(rùn),則會(huì)因各地區(qū)的發(fā)展有所誤差,并且電力行業(yè)是與我們的生產(chǎn)生活息息相關(guān)的,安全性及其它性能的重要意義遠(yuǎn)大于利潤(rùn)。但數(shù)據(jù)挖掘技術(shù)卻能夠綜合分析諸多影響因素,通過(guò)分析由利潤(rùn)、利潤(rùn)增長(zhǎng)率、同行對(duì)比、投訴舉報(bào)、生產(chǎn)成本等數(shù)據(jù)組成的主題倉(cāng)庫(kù)來(lái)研究區(qū)域或者是自公司的運(yùn)營(yíng)情況,并用圖表等簡(jiǎn)潔明了的方式體現(xiàn)出來(lái),為決策提供依據(jù)。

  1.2.3 指導(dǎo)電力企業(yè)的建設(shè)規(guī)劃

  最近,我國(guó)的廣東頻繁發(fā)生電力供不應(yīng)求的情況,其主要原因便是沒(méi)能很好的掌握市場(chǎng)進(jìn)步的趨勢(shì),在電廠(chǎng)的建設(shè)及電網(wǎng)建設(shè)方面都沒(méi)能滿(mǎn)足市場(chǎng)的需求,這時(shí)數(shù)據(jù)挖掘工作的重要性便得到了很好的體現(xiàn)。將新增用戶(hù)(報(bào)裝)、現(xiàn)有用戶(hù)、用戶(hù)位置、用戶(hù)用電量、國(guó)家的建設(shè)計(jì)劃等相關(guān)資料實(shí)行認(rèn)真的研究分析便可以制定出電力企業(yè)的發(fā)展計(jì)劃,有此為指導(dǎo),才能促進(jìn)電力行業(yè)的飛速發(fā)展。

  1.2.4 指導(dǎo)電力的生產(chǎn)和購(gòu)買(mǎi)

  我國(guó)推出電力企業(yè)改革方案后,廣東省電力集團(tuán)便在積極的踐行,到01年底已大體完成廠(chǎng)網(wǎng)分離。改革的逐步深化,而言使得我們面臨了一些新的問(wèn)題。例如在電力購(gòu)買(mǎi)方面,傳統(tǒng)的電廠(chǎng)和電網(wǎng)屬一個(gè)單位,電廠(chǎng)會(huì)供給電網(wǎng)充足的電力?稍谌缃,電網(wǎng)用電時(shí)一定要提前購(gòu)買(mǎi),但因?yàn)殡娏Φ孽r明特征即買(mǎi)多少用多少,使得購(gòu)買(mǎi)時(shí)間和購(gòu)買(mǎi)量無(wú)法準(zhǔn)確的確定。而借助數(shù)據(jù)挖掘技術(shù)可以很好的解決這一問(wèn)題。對(duì)有關(guān)的主體車(chē)庫(kù)進(jìn)行深入挖掘便可確定需購(gòu)買(mǎi)的電力總量,并對(duì)發(fā)電企業(yè)的生產(chǎn)計(jì)劃進(jìn)行指導(dǎo)。

  1.2.5 減少電力損耗,改善電力質(zhì)量,減少設(shè)備損耗

  電力產(chǎn)品具有自身的顯著特征,主要體現(xiàn)在它不能進(jìn)行儲(chǔ)存,只有按需供給。可是,發(fā)電和用電是有著很大差異的,要想保證電力的質(zhì)量,就必須不斷提高設(shè)施的安全性,并對(duì)其實(shí)施科學(xué)的調(diào)整,F(xiàn)今使用的主要方式是建設(shè)蓄能電廠(chǎng),若電力有多余則要保存起來(lái),等電力供應(yīng)不足時(shí)則用這部分電力,將其進(jìn)行安排調(diào)度并制定合理的疾患,便能實(shí)現(xiàn)電力儲(chǔ)存技術(shù)的靈活調(diào)節(jié),實(shí)現(xiàn)降低電力浪費(fèi),提高電力質(zhì)量,避免設(shè)備的耗損。

  2、使用數(shù)據(jù)挖掘的必要性和可行性

  2.1 我國(guó)電力企業(yè)信息化現(xiàn)狀使采用數(shù)據(jù)挖掘技術(shù)成為可能

  觀(guān)察以廣電企業(yè)的現(xiàn)狀可以知道,電網(wǎng)的信息化已經(jīng)有了很大的進(jìn)步,也就是不再僅僅借助計(jì)算機(jī)完成統(tǒng)計(jì)報(bào)表,管理信息也不是單機(jī)單項(xiàng)應(yīng)用工作的時(shí)期,其正處在信息化的中級(jí)發(fā)展環(huán)節(jié),企業(yè)有自己的局域網(wǎng),廣電集團(tuán)也已經(jīng)實(shí)現(xiàn)了光纖網(wǎng)的全省覆蓋,企業(yè)完成信息化之后,能夠使內(nèi)部的管理工作更加高效,如MIS、OA、物資管理、財(cái)務(wù)管理以及客戶(hù)服務(wù)中心等。能夠獲得企業(yè)的許多基本數(shù)據(jù),并使應(yīng)用平臺(tái)更加的科學(xué),而企業(yè)在進(jìn)行數(shù)據(jù)挖掘工作時(shí),便可以將這眾多數(shù)據(jù)作為有效依據(jù)。

  2.2 我國(guó)電力企業(yè)改革的趨勢(shì)使采用數(shù)據(jù)挖掘技術(shù)成為必然

  我國(guó)黨政領(lǐng)導(dǎo)集團(tuán)在積極的轉(zhuǎn)變行業(yè)壟斷的現(xiàn)狀,促進(jìn)競(jìng)爭(zhēng)方式的合理化。我國(guó)電力企業(yè)中已經(jīng)使用了“廠(chǎng)網(wǎng)分家”模式,這使得發(fā)電競(jìng)爭(zhēng)有了科學(xué)的模式,廣電集團(tuán)也已經(jīng)結(jié)束了這部分的工作。接下來(lái)便是向電網(wǎng)運(yùn)轉(zhuǎn)方向轉(zhuǎn)變。為在將來(lái)的競(jìng)爭(zhēng)中保持優(yōu)勢(shì),電力企業(yè)一定要盡可能的降低生產(chǎn)經(jīng)營(yíng)的成本,這樣有利于更好的為客戶(hù)提供服務(wù),并熟悉自己及競(jìng)爭(zhēng)企業(yè)的實(shí)際情況。上述的所有事情,都要使用現(xiàn)代信息技術(shù)來(lái)解決,而數(shù)據(jù)挖掘技術(shù)又起著極其重要的作用。

  3、展望

  作為智能系統(tǒng)的心臟,信息通信系統(tǒng)在今后電網(wǎng)業(yè)的進(jìn)步中有著非常積極的意義。現(xiàn)今,我國(guó)電網(wǎng)業(yè)早已設(shè)立了在國(guó)內(nèi)、國(guó)際都很先進(jìn)的集成系統(tǒng)。三地集中式數(shù)據(jù)也開(kāi)始慢慢運(yùn)轉(zhuǎn)起來(lái),各企業(yè)的一級(jí)業(yè)務(wù)面也越來(lái)越廣,各種數(shù)據(jù)中心也都開(kāi)始運(yùn)轉(zhuǎn)起來(lái),我國(guó)電網(wǎng)的數(shù)據(jù)和種類(lèi)都開(kāi)始步入正軌。其“量類(lèi)時(shí)”特征,也在海量、實(shí)時(shí)的電網(wǎng)業(yè)務(wù)內(nèi)有了更大的作用,所以必須對(duì)其進(jìn)行深入研究。

  現(xiàn)今,我們通常把電網(wǎng)業(yè)務(wù)數(shù)據(jù)歸為三種:首先,單位生產(chǎn)的資料,有發(fā)電量、電壓穩(wěn)定性等指標(biāo)等;其次,單位工作中的數(shù)據(jù),包括交易價(jià)格、用戶(hù)的需求方面的數(shù)據(jù)等;最后是單位的管理資料,如ERP、一體化平臺(tái)、協(xié)同辦公等方面的數(shù)據(jù)。我們要熟練了解這諸多數(shù)據(jù)的特征,然后開(kāi)展深入的探究,還能推出很多高附加值的服務(wù),這也能促進(jìn)電網(wǎng)安全性檢測(cè)的順利進(jìn)行,還可以更好的掌控企業(yè)的經(jīng)營(yíng)、滿(mǎn)足用戶(hù)的需求,使企業(yè)的管理水平得到提高。

  比如,在設(shè)立電力企業(yè)的“大營(yíng)銷(xiāo)”模式時(shí),要以滿(mǎn)足顧客需求為目標(biāo),建立各種服務(wù)平臺(tái)以第一時(shí)間滿(mǎn)足客戶(hù)各種需求,如:95588、114等。為了完善服務(wù)模式,提高服務(wù)質(zhì)量,應(yīng)該詳細(xì)的分析各種數(shù)據(jù),使得服務(wù)水平和營(yíng)銷(xiāo)能力得到大幅度的提升和改善;分析型數(shù)據(jù)是進(jìn)行服務(wù)和開(kāi)展?fàn)I銷(xiāo)的必要前提和重要基礎(chǔ),應(yīng)該得到足夠的重視,對(duì)原有的營(yíng)銷(xiāo)組織模式進(jìn)行查漏補(bǔ)缺,通過(guò)借鑒其他單位的成功經(jīng)驗(yàn)來(lái)彌補(bǔ)自己的不不足和缺陷,對(duì)各種服務(wù)資源進(jìn)行合理的配置,盡可能讓大多數(shù)人滿(mǎn)意,為了更好的利用數(shù)據(jù)并提高營(yíng)銷(xiāo)能力,要建立數(shù)據(jù)監(jiān)控分析模型;營(yíng)銷(xiāo)數(shù)據(jù)之間是存在著隱藏關(guān)系的,顯而易見(jiàn),這些隱藏信息不容易被發(fā)現(xiàn),為了增強(qiáng)分析數(shù)據(jù)的全面性、系統(tǒng)性、直觀(guān)性、便捷性,建立各種系統(tǒng)性算法模型庫(kù)不僅是極其有必要的,而且是相當(dāng)重要的,當(dāng)然這種系統(tǒng)性的算法模型庫(kù)是針對(duì)營(yíng)銷(xiāo)制定的,這樣做可以增強(qiáng)把握市場(chǎng)動(dòng)態(tài)的及時(shí)性,我們知道,任何類(lèi)型的營(yíng)銷(xiāo)必定離不開(kāi)市場(chǎng),市場(chǎng)是開(kāi)展?fàn)I銷(xiāo)主要遵循的依據(jù),脫離了市場(chǎng),營(yíng)銷(xiāo)就會(huì)抓不住頭腦,因而,算法模型庫(kù)的建立可以為企業(yè)單位創(chuàng)造更多的經(jīng)濟(jì)效益和社會(huì)效益,增強(qiáng)企業(yè)的核心競(jìng)爭(zhēng)力,擴(kuò)大企業(yè)單位的市場(chǎng)份額,使企業(yè)更穩(wěn)的立足于競(jìng)爭(zhēng)激烈的市場(chǎng)之上,甚至是處于領(lǐng)頭羊的地位,促進(jìn)國(guó)民經(jīng)濟(jì)建設(shè),為人民提供更好的服務(wù)。

  數(shù)據(jù)有著很好的增值價(jià)值,其他的服務(wù)也可以通過(guò)數(shù)據(jù)增值價(jià)值得到衍生。所以,加大對(duì)數(shù)據(jù)的利用與研究勢(shì)在必行。把數(shù)據(jù)當(dāng)中重要的依據(jù)、基礎(chǔ)甚至是紐帶,沿著這個(gè)紐帶進(jìn)行研究與利用。將數(shù)據(jù)研究和使用的成果合理的運(yùn)用起來(lái),例如,將其轉(zhuǎn)化為新型的支付方式和消費(fèi)形態(tài),使客戶(hù)感受到非同一般的感覺(jué),突破了以往的業(yè)務(wù)系統(tǒng)僅僅專(zhuān)注于自己內(nèi)容的方式,電網(wǎng)的生產(chǎn)效率會(huì)得到提高,企業(yè)的管理水平也會(huì)因此得到大幅度的改善與提高。

數(shù)據(jù)挖掘論文13

  摘要:隨著計(jì)算機(jī)信息網(wǎng)絡(luò)的快速發(fā)展,數(shù)據(jù)挖掘在軟件工程中的地位越來(lái)越突出。軟件工程數(shù)據(jù)挖掘是在冗余的數(shù)據(jù)中發(fā)現(xiàn)有用的數(shù)據(jù),從而得到更好地利用。社會(huì)的發(fā)展,科技的進(jìn)步使得社會(huì)進(jìn)入了網(wǎng)絡(luò)信息熱時(shí)代,隨之計(jì)算機(jī)軟件也不斷增加,人們獲取的信息大部分是人手動(dòng)操作軟件獲得的,這樣的信息量具有一定的局限性。因此,為了滿(mǎn)足當(dāng)今社會(huì)的需要,必須借助于軟件工程數(shù)據(jù)挖掘的手段。

  關(guān)鍵詞:軟件工程;數(shù)據(jù)挖掘;研究現(xiàn)狀

  中圖分類(lèi)號(hào):TP311 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(20xx)26-0020-02

  利用數(shù)據(jù)挖掘技術(shù)對(duì)大量冗余的數(shù)據(jù)進(jìn)行篩選從而得到少量精確的信息。冗余的數(shù)據(jù)是指既包含有用信息有包含無(wú)用信息,利用數(shù)據(jù)挖掘技術(shù)剔除掉多余的無(wú)用信息留下有用信息,這樣既可以提高手機(jī)數(shù)據(jù)的質(zhì)量又可以提高工作效率。所以,數(shù)據(jù)挖掘技術(shù)在當(dāng)前的軟件工程中起著越來(lái)越重要的作用。數(shù)據(jù)挖掘技術(shù)提取、篩選、分析和整理數(shù)據(jù)比人工操作軟件獲得的數(shù)據(jù)更精確更高效。同時(shí),使用這種技術(shù)為軟件開(kāi)發(fā)者提供了有利的條件,它可以給軟件開(kāi)發(fā)者提供一些對(duì)其開(kāi)發(fā)軟件有用的信息。軟件開(kāi)發(fā)者想要更有效率的開(kāi)發(fā)出更高質(zhì)量的軟件,就必須獲得更多的更有用的數(shù)據(jù),而想要收集和整理出有用數(shù)據(jù)就需要借助數(shù)據(jù)挖掘技術(shù)來(lái)實(shí)現(xiàn),進(jìn)而提高工作效率。

  1 數(shù)據(jù)挖掘的基本概述

  軟件工程數(shù)據(jù)主要是指開(kāi)發(fā)軟件過(guò)程中所涉及的各類(lèi)數(shù)據(jù),如需求分析、可行性分析、設(shè)計(jì)等文檔,開(kāi)發(fā)商通信、軟件注釋、代碼、版本、測(cè)試用例和結(jié)果、使用說(shuō)明、用戶(hù)反饋等信息數(shù)據(jù),一般情況下其是軟件開(kāi)發(fā)者獲取軟件數(shù)據(jù)的唯一來(lái)源;而數(shù)據(jù)挖掘是指在海量數(shù)據(jù)中集中發(fā)現(xiàn)有用知識(shí)或信息的過(guò)程。

  軟件工程數(shù)據(jù)挖掘的工作原理 主要包括數(shù)據(jù)預(yù)處理階段、挖掘階段以及評(píng)估階段三個(gè)方面。在挖掘階段主要是運(yùn)用分類(lèi)、統(tǒng)計(jì)、關(guān)聯(lián)、聚類(lèi)、異常檢測(cè)等一系列算法的過(guò)程。在評(píng)估階段數(shù)據(jù)挖掘的意義主要在于其結(jié)果應(yīng)易被用戶(hù)理解,其結(jié)果評(píng)估主要有兩個(gè)環(huán)節(jié)分別是模式過(guò)濾和模式表示。

  數(shù)據(jù)挖掘在計(jì)算機(jī)軟件工程中的研究相當(dāng)多,它是分析數(shù)據(jù)的一種新穎方式。目前,隨著社會(huì)工作的復(fù)雜度,需要更加完善的軟件,因此對(duì)于軟件代碼的數(shù)量也在急劇增加進(jìn)而導(dǎo)致了數(shù)據(jù)量的快速增長(zhǎng)。而傳統(tǒng)的數(shù)據(jù)計(jì)算方式已經(jīng)不能滿(mǎn)足目前對(duì)于大量數(shù)據(jù)進(jìn)行分析的要求,所以,研究者希望能夠發(fā)掘出一種新的數(shù)據(jù)分析方式更高效的整理出有用的數(shù)據(jù)信息。軟件開(kāi)發(fā)中會(huì)積累大量的數(shù)據(jù),比如說(shuō)文本數(shù)據(jù),測(cè)試數(shù)據(jù),用戶(hù)信息數(shù)據(jù)以及用戶(hù)體驗(yàn)反饋數(shù)據(jù)等等,軟件開(kāi)發(fā)者為了開(kāi)發(fā)出更好的軟件就必須分析和整理這些數(shù)據(jù)。但是,目前軟件工程開(kāi)發(fā)的軟件越來(lái)越大,其數(shù)據(jù)越累越復(fù)雜對(duì)于數(shù)據(jù)的處理已經(jīng)超出了人工處理的能力的范疇,所以說(shuō)繼續(xù)使用傳統(tǒng)數(shù)據(jù)處理的方式來(lái)收集,整理和分析數(shù)據(jù)已經(jīng)不可能實(shí)現(xiàn)。因此,推動(dòng)了人們對(duì)于新的數(shù)據(jù)處理方式的研究,所以才提出了軟件工程數(shù)據(jù)挖掘技術(shù)。

  2 軟件工程數(shù)據(jù)挖掘的應(yīng)用

  隨著計(jì)算機(jī)軟件工程的發(fā)展,可以發(fā)現(xiàn)傳統(tǒng)的數(shù)據(jù)挖掘技術(shù)具有很多的不足,存在一定的缺陷。傳統(tǒng)的數(shù)據(jù)挖掘技術(shù)的定位系統(tǒng)不完善,定位不精確,并沒(méi)有體現(xiàn)出數(shù)據(jù)挖掘技術(shù)的高性能,它不足以滿(mǎn)足當(dāng)代對(duì)于數(shù)據(jù)處理的要求,因此需要對(duì)傳統(tǒng)的數(shù)據(jù)挖掘技術(shù)進(jìn)行改進(jìn)和完善,這是我們目前的首要任務(wù)之一。為了迎合現(xiàn)代化網(wǎng)絡(luò)信息技術(shù)的快速發(fā)展,需要發(fā)掘出新的數(shù)據(jù)處理模式,就是在這樣的背景條件下,誕生了軟件工程數(shù)據(jù)挖掘技術(shù)。相比于存在很多缺陷與不足的傳統(tǒng)軟件工程而言,軟件工程數(shù)據(jù)挖掘技術(shù)更加簡(jiǎn)單、方便、高效以及精確。軟件工程數(shù)據(jù)挖掘技術(shù)并不需要特定的技術(shù)平臺(tái),體現(xiàn)了其普適性。當(dāng)前,我國(guó)已經(jīng)開(kāi)始深入的研究軟件工程數(shù)據(jù)挖掘技術(shù),但是,仍然需要更深的開(kāi)發(fā)其性能以便更好地滿(mǎn)足社會(huì)的需求。

  3 軟件工程數(shù)據(jù)挖掘面臨的挑戰(zhàn)

  軟件工程數(shù)據(jù)相比于普通數(shù)據(jù)更加復(fù)雜,所以對(duì)于軟件工程數(shù)據(jù)進(jìn)行處理具有很大的挑戰(zhàn)性。處理軟件工程的大量數(shù)據(jù)具有:軟件工程數(shù)據(jù)復(fù)雜性,軟件工程的數(shù)據(jù)處理非傳統(tǒng)以及需要嚴(yán)格精確的軟件工程數(shù)據(jù)的分析結(jié)果等三方面的困難。

  3.1 對(duì)數(shù)據(jù)復(fù)雜性的分析

  軟件工程數(shù)據(jù)包括結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)。軟件工程中所產(chǎn)生的缺陷報(bào)告以及各種版本信息構(gòu)成了結(jié)構(gòu)化數(shù)據(jù)信息;而軟件工程處理過(guò)程中所產(chǎn)生的代碼信息和文本文檔信息構(gòu)成了非結(jié)構(gòu)化數(shù)據(jù)信息。由于這兩類(lèi)數(shù)據(jù)包含的具體內(nèi)容不同,所以需要分別處理這兩種數(shù)據(jù),需要使用不同的算法對(duì)他們進(jìn)行處理。雖然說(shuō)需要不同方式處理這兩種數(shù)據(jù)但是并不表示這兩種數(shù)據(jù)之間沒(méi)有任何聯(lián)系,事實(shí)上,它們之間存在著重要的對(duì)應(yīng)關(guān)系。例如:代碼中存在著缺陷報(bào)告,版本信息中存在著對(duì)應(yīng)的文檔信息,由于它們之間存在著這樣的對(duì)應(yīng)關(guān)系,所以使得人們不能很好地對(duì)其進(jìn)行整體分析,這就促使了人們開(kāi)發(fā)出一種新的算法,新的數(shù)據(jù)分析技術(shù)能夠同時(shí)將結(jié)構(gòu)化信息和非結(jié)構(gòu)化信息這兩種對(duì)應(yīng)數(shù)據(jù)一起挖掘出來(lái)。

  3.2 對(duì)數(shù)據(jù)處理非傳統(tǒng)的分析

  分析和評(píng)估軟件工程數(shù)據(jù)挖掘出來(lái)的信息,這是數(shù)據(jù)挖掘過(guò)程的最后一步。客戶(hù)是軟件工程數(shù)據(jù)挖掘數(shù)據(jù)處理的最后宿體,軟件開(kāi)發(fā)者需要對(duì)最終挖掘出來(lái)的數(shù)據(jù)進(jìn)行轉(zhuǎn)變,格式轉(zhuǎn)變是為了滿(mǎn)足廣大客戶(hù)對(duì)于數(shù)據(jù)不同的`要求。但是,由于需要對(duì)數(shù)據(jù)進(jìn)行格式轉(zhuǎn)變,相當(dāng)于增加了一定的工作量,那么軟件工程數(shù)據(jù)挖掘的效率則會(huì)被大大降低。對(duì)于客戶(hù)而言,他們需要的信息各種各樣并不單一,比如說(shuō)客戶(hù)可能會(huì)同時(shí)需要具體的例子和編程代碼等;或者說(shuō)需要具體例子和缺陷報(bào)告等;或者三者皆需要。由此可見(jiàn),我們?nèi)匀恍枰倪M(jìn)和完善軟件工程數(shù)據(jù)挖掘技術(shù)來(lái)提高其效率。怎樣才能做到讓客戶(hù)得到滿(mǎn)意的數(shù)據(jù)挖掘結(jié)果呢?那么就需要高效的數(shù)據(jù)挖掘技術(shù)將各類(lèi)信息進(jìn)行歸納總結(jié),改變其格式。這樣的技術(shù),不僅僅可以滿(mǎn)足客戶(hù)需求而且還可以使軟件開(kāi)發(fā)者從中得到更大的利益。

  3.3 對(duì)數(shù)據(jù)挖掘結(jié)果好壞的評(píng)價(jià)標(biāo)準(zhǔn)

  對(duì)于傳統(tǒng)的數(shù)據(jù)挖掘技術(shù)而言,它也有一套自己的對(duì)于數(shù)據(jù)結(jié)果處理好壞的分析標(biāo)準(zhǔn),而這個(gè)標(biāo)準(zhǔn)對(duì)于傳統(tǒng)數(shù)據(jù)挖掘技術(shù)數(shù)據(jù)處理的分析較準(zhǔn)確。但是,在當(dāng)前的軟件工程所要處理的數(shù)據(jù)量很大,傳統(tǒng)的評(píng)價(jià)標(biāo)準(zhǔn)已經(jīng)不能滿(mǎn)足現(xiàn)在的數(shù)據(jù)分析要求;使用不同的數(shù)據(jù)結(jié)果評(píng)價(jià)標(biāo)準(zhǔn)來(lái)評(píng)判不同的數(shù)據(jù)挖掘結(jié)果。然而不同的評(píng)價(jià)標(biāo)準(zhǔn)之間的聯(lián)系并不緊密,因此就需要開(kāi)發(fā)者針對(duì)不同的數(shù)據(jù)類(lèi)型做出不同的評(píng)價(jià)分析標(biāo)準(zhǔn)以便滿(mǎn)足客戶(hù)需求。想要對(duì)數(shù)據(jù)分析結(jié)果是否準(zhǔn)確,數(shù)據(jù)挖掘的信息是否合理等等這些不同的問(wèn)題進(jìn)行更加深刻的了解,就要求開(kāi)發(fā)者有獨(dú)特的見(jiàn)解,對(duì)于數(shù)據(jù)結(jié)果是否精確有一定的判斷能力?傊,獲取準(zhǔn)確的信息就是軟件工程數(shù)據(jù)挖掘的目的。所以,最后獲得的數(shù)據(jù)是否滿(mǎn)足要求就是評(píng)判軟件工程數(shù)據(jù)挖掘結(jié)果是否完美的標(biāo)準(zhǔn)。endprint

  4 對(duì)軟件工程數(shù)據(jù)挖掘應(yīng)用進(jìn)行分析

  4.1 對(duì)軟件數(shù)據(jù)挖掘技術(shù)進(jìn)行分析

  在軟件開(kāi)發(fā)的過(guò)程中,數(shù)據(jù)挖掘技術(shù)包括兩個(gè)方面:(1)程序編寫(xiě);(2)程序成果。在這個(gè)過(guò)程中,程序結(jié)構(gòu)和程序功能技術(shù)的主要作用就是檢索出有效的信息。提升信息的有效性需要聯(lián)系到客戶(hù)的實(shí)際需要,同時(shí)也需要對(duì)程序編寫(xiě)過(guò)程進(jìn)行智能化培訓(xùn)。將調(diào)用、重載和多重繼承等關(guān)系家合起來(lái)進(jìn)行有效的記錄各種相關(guān)信息,重視靜態(tài)規(guī)則的同時(shí)利用遞歸測(cè)試的方式來(lái)分配工作,從而更有效的掌握關(guān)聯(lián)度之間的可信性。

  4.2 做好軟件維護(hù)中的軟件工程數(shù)據(jù)挖掘工作

  在軟件維護(hù)的過(guò)程中,軟件修復(fù)和軟件改善工作依賴(lài)于數(shù)據(jù)挖掘技術(shù)。數(shù)據(jù)挖掘技術(shù)在軟件缺陷以及軟件結(jié)構(gòu)等也起到了重要的作用。軟件修復(fù)即維護(hù)者通過(guò)依據(jù)缺陷分派進(jìn)行有效的評(píng)估并改善缺陷程序進(jìn)而確定修復(fù)級(jí)別或者維護(hù)者可以選擇缺陷修復(fù)方式,無(wú)論哪種方式最終目的都是進(jìn)行軟件修復(fù)來(lái)保證數(shù)據(jù)挖掘的高效性。缺陷分派即將缺陷轉(zhuǎn)化為文本類(lèi)型,采取有效措施來(lái)進(jìn)行修復(fù)。但是,這樣的方式它的實(shí)際準(zhǔn)確率并不高,因而需要利用強(qiáng)化檢測(cè)來(lái)完善缺陷報(bào)告技術(shù)。

  4.3 注重高性能數(shù)據(jù)挖掘技術(shù)開(kāi)發(fā)工作

  數(shù)據(jù)挖掘技術(shù)體現(xiàn)在軟件開(kāi)發(fā)工作中的創(chuàng)新性不可或缺,在實(shí)際的工作過(guò)程中,目前的軟件工程數(shù)據(jù)挖掘更加重視兩個(gè)工作:(1)規(guī)則分析方式;(2)項(xiàng)目檢索工作?偠灾,想要高效快速地尋找病毒,并對(duì)其進(jìn)行全方位分析和評(píng)估得到準(zhǔn)確的病毒數(shù)據(jù)需要高性能數(shù)據(jù)挖掘技術(shù)。只有提升數(shù)據(jù)分析的可行性,提升軟件開(kāi)發(fā)安全性能,才能更好地實(shí)現(xiàn)軟件工程的良好發(fā)展。

  5 總結(jié)

  綜上所述,數(shù)據(jù)挖掘技術(shù)的應(yīng)用非常廣泛,比如說(shuō)分析代碼、軟件故障檢測(cè)以及軟件項(xiàng)目管理等三個(gè)方面應(yīng)用較多。值得關(guān)注的是,當(dāng)前對(duì)于數(shù)據(jù)挖掘技術(shù)的研究還不夠成熟。因此,研究者需要對(duì)軟件工程數(shù)據(jù)挖掘技術(shù)進(jìn)行深入的研究,從而能夠促進(jìn)軟件更好地開(kāi)發(fā)和管理。相信在不久的將來(lái),我們一定可以在數(shù)據(jù)挖掘方面取得非常好的優(yōu)化效果。

  參考文獻(xiàn):

  [1] 江義晟.軟件工程數(shù)據(jù)挖掘研究進(jìn)展[J].電子技術(shù)與軟件工程,20xx(22).

  [2] 胡金萍.探析軟件工程數(shù)據(jù)挖掘研究進(jìn)展[J].電腦知識(shí)與技術(shù),20xx(34).

  [3] 馬保平.關(guān)于對(duì)軟件工程中的數(shù)據(jù)挖掘技術(shù)的探討[J].電子技術(shù)與軟件工程,20xx(19).

  [4] 徐琳,王寧.數(shù)據(jù)挖掘技術(shù)在軟件工程中的應(yīng)用分析[J].數(shù)字通信世界,20xx(8).

數(shù)據(jù)挖掘論文14

  題目:數(shù)據(jù)挖掘技術(shù)在神經(jīng)根型頸椎病方劑研究中的優(yōu)勢(shì)及應(yīng)用進(jìn)展

  關(guān)鍵詞:數(shù)據(jù)挖掘技術(shù); 神經(jīng)根型頸椎病; 方劑; 綜述;

  1 數(shù)據(jù)挖掘技術(shù)簡(jiǎn)介

  數(shù)據(jù)挖掘技術(shù)[1] (Knowledge Discovery in Datebase, KKD) , 是一種新興的信息處理技術(shù), 它融匯了人工智能、模式別、模糊數(shù)學(xué)、數(shù)據(jù)庫(kù)、數(shù)理統(tǒng)計(jì)等多種技術(shù)方法, 專(zhuān)門(mén)用于海量數(shù)據(jù)的處理, 從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的數(shù)據(jù)集中, 提取隱含在其中的、人們事先不知道的、但又是潛在的有用的信息和知識(shí), 其目的是發(fā)現(xiàn)規(guī)律而不是驗(yàn)證假設(shè)。數(shù)據(jù)挖掘技術(shù)主要適用于龐大的數(shù)據(jù)庫(kù)的研究, 其特點(diǎn)在于:基于數(shù)據(jù)分析方法角度的分類(lèi), 其本質(zhì)屬于觀(guān)察性研究, 數(shù)據(jù)來(lái)源于日常診療工作資料, 應(yīng)用的技術(shù)較傳統(tǒng)研究更先進(jìn), 分析工具、理論模型與傳統(tǒng)研究區(qū)別較大。其操作步驟包括[2]:選擇數(shù)據(jù), 數(shù)據(jù)處理, 挖掘分析, 結(jié)果解釋, 其中結(jié)果解釋是數(shù)據(jù)挖掘技術(shù)研究的關(guān)鍵。其方法包括分類(lèi)、聚類(lèi)、關(guān)聯(lián)、序列、決策樹(shù)、貝斯網(wǎng)絡(luò)、因子、辨別等分析[3], 其結(jié)果通常表示為概念、規(guī)則、規(guī)律、模式、約束、可視化等形式圖[4]。當(dāng)今數(shù)據(jù)挖掘技術(shù)的方向主要在于:特定數(shù)據(jù)挖掘, 高效挖掘算法, 提高結(jié)果的有效性、確定性和表達(dá)性, 結(jié)果的可視化, 多抽象層上的交互式數(shù)據(jù)挖掘, 多元數(shù)據(jù)挖掘及數(shù)據(jù)的安全性和保密性。因其優(yōu)勢(shì)和獨(dú)特性被運(yùn)用于多個(gè)領(lǐng)域中, 且結(jié)果運(yùn)用后取得顯著成效, 因此越來(lái)越多的中醫(yī)方劑研究者將其運(yùn)用于方劑中藥物的研究。

  2 數(shù)據(jù)挖掘術(shù)在神經(jīng)根型頸椎病治方研究中的優(yōu)勢(shì)

  中醫(yī)對(duì)于神經(jīng)根型頸椎病的治療準(zhǔn)則為辨證論治, 從古至今神經(jīng)根型頸椎病的中醫(yī)證型有很多, 其治方是集中醫(yī)之理、法、方、藥為一體的數(shù)據(jù)集合, 具有以“方-藥-證”為核心的多維結(jié)構(gòu)。方劑配伍本質(zhì)上表現(xiàn)為方與方、方與藥、藥與藥、藥與劑量, 以及方藥與證、病、癥交叉錯(cuò)綜的關(guān)聯(lián)與對(duì)應(yīng)[5], 而中醫(yī)方劑講究君臣佐使的配伍, 藥物有升降沉浮, 四氣五味及歸經(jīng)之別, 對(duì)于神經(jīng)根型頸椎病的治療, 治方中藥物的種類(lèi)、炮制方法、用量、用法等都是千變?nèi)f化的, 而這些海量、模糊、看似隨機(jī)的藥物背后隱藏著對(duì)臨床有用的信息和規(guī)律, 但這些大數(shù)據(jù)是無(wú)法在可承受的時(shí)間范圍內(nèi)可用常規(guī)軟件工具進(jìn)行捕捉、管理和處理的, 是需要一個(gè)新處理模式才能具有更強(qiáng)的決策力、洞察力和流程優(yōu)化能力, 而數(shù)據(jù)挖掘技術(shù)有可能從這些海量的的數(shù)據(jù)中發(fā)現(xiàn)新知識(shí), 揭示背后隱藏的關(guān)系和規(guī)則, 并且對(duì)未知的情況進(jìn)行預(yù)測(cè)[6]。再者, 中醫(yī)辨治充滿(mǎn)非線(xiàn)性思維, “方-藥-證”間的多層關(guān)聯(lián)、序列組合、集群對(duì)應(yīng), 形成了整體論的思維方式和原則, 而數(shù)據(jù)挖掘技術(shù)數(shù)據(jù)挖掘在技術(shù)線(xiàn)路上與傳統(tǒng)數(shù)據(jù)處理方法不同在于其能對(duì)數(shù)據(jù)庫(kù)內(nèi)的數(shù)據(jù)以線(xiàn)性和非線(xiàn)性方式解析, 尤善處理模糊的、非量化的數(shù)據(jù)。例如趙睿曦等[7]在研究張氏骨傷治療腰椎間盤(pán)突出癥的用藥規(guī)律時(shí), 選取了100張治方, 因該病病因病機(jī)復(fù)雜, 證候不一, 骨傷名師張玉柱先生對(duì)該病的治則治法、藥物使用是不同的。因此他們利用Excel建立方證數(shù)據(jù)庫(kù), 采用SPPS Clementine12.0軟件對(duì)這些數(shù)據(jù)的用藥頻次、藥物關(guān)聯(lián)規(guī)則及藥物聚類(lèi)進(jìn)行分析, 最后總結(jié)出張氏骨傷治療腰椎間盤(pán)突出癥遵循病從肝治、病從血治、標(biāo)本兼治的原則, 也歸納出治療三種不同證型的腰突癥的三類(lèi)自擬方。由此看出數(shù)據(jù)挖掘技術(shù)在方劑研究中的應(yīng)用對(duì)數(shù)據(jù)背后信息、規(guī)律等的挖掘及名家經(jīng)驗(yàn)的推廣具有重大意義, 因此數(shù)據(jù)挖掘技術(shù)在神經(jīng)根型頸椎病的治方研究中也同樣發(fā)揮著巨大的作用。

  3 數(shù)據(jù)挖掘技術(shù)在神經(jīng)根型頸椎治方中的應(yīng)用進(jìn)展

  神經(jīng)根型頸椎病在所有頸椎病中最常見(jiàn), 約占50%~60%[8], 醫(yī)家對(duì)其治方的研究也是不計(jì)其數(shù)。近年來(lái)數(shù)據(jù)挖掘技術(shù)也被運(yùn)用于其治方研究中, 筆者通過(guò)萬(wàn)方、中國(guó)知網(wǎng)等總共檢索出以下幾篇文獻(xiàn), 雖數(shù)量不多但其優(yōu)勢(shì)明顯。劉向前等[9]在挖掘古方治療神經(jīng)根型頸椎病的用藥規(guī)律時(shí), 通過(guò)檢索《中華醫(yī)典》并從中篩選以治療頸項(xiàng)肩臂痛為主的古方219首并建立數(shù)據(jù)庫(kù), 對(duì)不同證治古方的用藥類(lèi)別、總味數(shù)、單味藥使用頻數(shù)及藥對(duì) (組) 出現(xiàn)頻數(shù)進(jìn)行統(tǒng)計(jì), 總結(jié)出風(fēng)寒濕痹證、痰濕阻痹證、寒濕阻滯證、正虛不足證的用藥特點(diǎn), 得出解表藥、祛風(fēng)濕藥、活血化瘀藥、補(bǔ)虛藥是治療頸項(xiàng)肩臂痛古方組成的主要藥物。古為今用, 該研究對(duì)于現(xiàn)代醫(yī)家在治療該病中有很好的借鑒和參考意義。齊兵獻(xiàn)等[10]檢索CNKI (1980-20xx年) 相關(guān)文獻(xiàn)中治療神經(jīng)根型頸椎病的方劑建立數(shù)據(jù)庫(kù), 采用SPSS11.5統(tǒng)計(jì)軟件這些治方常用藥物使用頻次頻率、性味頻率、歸經(jīng)頻率分析比較, 治療神經(jīng)根型頸椎病的中藥共計(jì)99味, 使用頻次479味次;所用藥物種類(lèi)依次以補(bǔ)益藥、活血化瘀藥、祛風(fēng)濕藥運(yùn)用最多, 其中藥味以辛、苦為主, 藥性以溫、寒為主, 歸經(jīng)以肝、脾、心為主, 而本病以肝腎虧虛, 氣血瘀滯為主, 臨床以補(bǔ)益藥、活血化瘀藥、祛風(fēng)濕藥等中藥運(yùn)用最多。這對(duì)于醫(yī)家治療該病選用藥物的性味、歸經(jīng)等具有指導(dǎo)意義。陳元川等[11]檢索20xx年1月至20xx年3月發(fā)表的.以單純口服中藥治療神經(jīng)根型頸椎病的有關(guān)文獻(xiàn), 對(duì)其中的方劑和藥物進(jìn)行統(tǒng)計(jì)、歸類(lèi)、分析, 最終納入32首方劑, 涉及111味中藥, 補(bǔ)氣藥、發(fā)散風(fēng)寒藥、活血止痛藥、補(bǔ)血藥等使用頻次較高;葛根、白芍、黃芪、當(dāng)歸、桂枝等藥物使用頻次較高, 證實(shí)與古方桂枝加葛根湯主藥相同, 且該方扶陽(yáng)解表的治法與該研究得出的扶正祛邪的結(jié)果相吻合, 同時(shí)也證實(shí)石氏傷科強(qiáng)調(diào)治傷科病當(dāng)“以氣為主, 以血為先”等正確性。所以大數(shù)據(jù)背后的規(guī)律和關(guān)系在很多方面古今是一致的, 同時(shí)數(shù)據(jù)依據(jù)的支持也為現(xiàn)代神經(jīng)根型頸椎病治療提供有力的保障。謝輝等[12]收集20xx至20xx年10月3日的166張治療神經(jīng)根型頸椎病的治方建立數(shù)據(jù)庫(kù), 采用關(guān)聯(lián)規(guī)則算法、復(fù)雜系統(tǒng)熵聚類(lèi)等無(wú)監(jiān)督數(shù)據(jù)挖掘方法, 利用中醫(yī)傳承輔助平臺(tái) (TCMISS) 軟件分析處方中各種藥物的使用頻次、藥物之間的關(guān)聯(lián)規(guī)則、核心藥物組合和新處方, 從中挖掘出治療該病中醫(yī)中的常用藥物、藥對(duì), 闡明了治療該病以解肌散寒藥、補(bǔ)氣活血藥、祛風(fēng)勝濕藥和溫經(jīng)通絡(luò)藥為主, 治法主要包括解肌舒筋、益氣活血和補(bǔ)益肝腎, 這一方面很清晰明了地展示了藥物使用頻率、藥物之間的聯(lián)系, 證實(shí)其與很多古代經(jīng)典中治療神經(jīng)根型頸椎病的治則、治法及用藥規(guī)律是吻合的, 是臨床用藥的積累和升華, 可有效地指導(dǎo)臨床并提高療效;另一方面也為中藥新藥的創(chuàng)制提供處方來(lái)源, 指導(dǎo)新藥研發(fā)[13]。

  4 小結(jié)

  數(shù)據(jù)挖掘技術(shù)作為一種新型的研究技術(shù), 在神經(jīng)根型頸椎病的治方研究中的運(yùn)用相對(duì)于其他領(lǐng)域是偏少的, 并且基本上是研究文獻(xiàn)資料上出現(xiàn)的治方, 在對(duì)名老中醫(yī)個(gè)人治療經(jīng)驗(yàn)及用藥規(guī)律的總結(jié)是缺乏的, 因此研究范圍廣而缺乏針對(duì)性, 同時(shí)使用該技術(shù)的相關(guān)軟件種類(lèi)往往是單一的,F(xiàn)在研究者在研究中醫(yī)方劑時(shí)往往采用傳統(tǒng)的研究方法, 這就導(dǎo)致在大數(shù)據(jù)的研究中耗時(shí)、耗力甚則無(wú)能為力, 同樣也難以精準(zhǔn)地提取大數(shù)據(jù)背后的隱藏的潛在關(guān)系和規(guī)則及缺乏對(duì)未知情況的預(yù)測(cè)。產(chǎn)生這樣的現(xiàn)狀, 一方面是很多研究者尚未清楚該技術(shù)在方劑研究中的優(yōu)勢(shì)所在, 思維模式尚未更新;另一方面是很多研究者尚未清楚該技術(shù)的操作技能及軟件種類(lèi)及其應(yīng)用范圍。故以后應(yīng)向更多研究者普及該技術(shù)的軟件種類(lèi)、其中的優(yōu)勢(shì)及操作技能, 讓該技術(shù)在臨床中使用更廣, 產(chǎn)生更大的效益。

  參考文獻(xiàn)

  [1]舒正渝.淺談數(shù)據(jù)挖掘技術(shù)及應(yīng)用[J].中國(guó)西部科技, 20xx, 9 (5) :38-39.

  [2]曹毅, 季聰華.臨床科研設(shè)計(jì)與分析[M].杭州:浙江科學(xué)技術(shù)出版社, 20xx:189.

  [3]王靜, 崔蒙.數(shù)據(jù)挖掘技術(shù)在中醫(yī)方劑學(xué)研究中的應(yīng)用[J].中國(guó)中醫(yī)藥信息雜志, 20xx, 15 (3) :103-104.

  [4]陳丈偉.數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘[M].北京:清華大學(xué)出版社, 20xx:5.

  [5]楊玉珠.數(shù)據(jù)挖掘技術(shù)綜述與應(yīng)用[J].河南科技, 20xx, 10 (19) :21.

  [6]余侃侃.數(shù)據(jù)挖掘技術(shù)在方劑配伍中的研究現(xiàn)狀及研究方法[J].中國(guó)醫(yī)藥指南, 20xx, 6 (24) :310-312.

  [7]趙睿曦.方證數(shù)據(jù)挖掘分析張氏骨傷對(duì)腰椎間盤(pán)突出癥的辨證用藥規(guī)律[J].陜西中醫(yī)藥大學(xué)學(xué)報(bào), 20xx, 39 (6) :44-46.

  [8]李曙明, 尹戰(zhàn)海, 王瑩.神經(jīng)根型頸椎病的影像學(xué)特點(diǎn)和分型[J].中國(guó)矯形外科雜志, 20xx, 21 (1) :7-11.

  [9]劉向前, 陳民, 黃廣平等.頸項(xiàng)肩臂痛內(nèi)治古方常用藥物的統(tǒng)計(jì)分析[J].中華中醫(yī)藥學(xué)刊, 20xx, 30 (9) :42-44.

  [10]齊兵獻(xiàn), 樊成虎, 李兆和.神經(jīng)根型頸椎病中醫(yī)用藥規(guī)律的文獻(xiàn)研究[J].河南中醫(yī), 20xx, 32 (4) :518-519.

  [11]陳元川, 王翔, 龐堅(jiān), 等.單純口服中藥治療神經(jīng)根型頸椎病用藥分析[J].上海中醫(yī)藥雜志, 20xx, 48 (6) :78-80.

  [12]謝輝, 劉軍, 潘建科, 等.基于數(shù)據(jù)挖掘方法的神經(jīng)根型頸椎病用藥規(guī)律研究[J].世界中西醫(yī)結(jié)合雜志, 20xx, 10 (6) :849-852.

  [13]唐仕歡, 楊洪軍.中醫(yī)組方用藥規(guī)律研究進(jìn)展述評(píng)[J].中國(guó)實(shí)驗(yàn)方劑學(xué)雜志, 20xx (5) :359-363.

數(shù)據(jù)挖掘論文15

  1理論研究

  1.1客戶(hù)關(guān)系管理

  客戶(hù)關(guān)系管理的目標(biāo)是依靠高效優(yōu)質(zhì)的服務(wù)吸引客戶(hù),同時(shí)通過(guò)對(duì)業(yè)務(wù)流程的全面優(yōu)化和管理,控制企業(yè)運(yùn)行成本。客戶(hù)關(guān)系管理是一種管理理念,將企業(yè)客戶(hù)視作企業(yè)發(fā)展最重要的企業(yè)資源,采用企業(yè)服務(wù)優(yōu)化等手段來(lái)管理客戶(hù)關(guān)系?蛻(hù)關(guān)系管理并不是單純的信息技術(shù)或者管理技術(shù),而是一種企業(yè)生物戰(zhàn)略,通過(guò)對(duì)企業(yè)客戶(hù)的分段充足,強(qiáng)化客戶(hù)滿(mǎn)意的行為,優(yōu)化企業(yè)可盈利性,將客戶(hù)處理工作上升到企業(yè)級(jí)別,不同部門(mén)負(fù)責(zé)與客戶(hù)進(jìn)行交互,但是整個(gè)企業(yè)都需要向客戶(hù)負(fù)責(zé),在信息技術(shù)的支持下實(shí)現(xiàn)企業(yè)和客戶(hù)連接環(huán)節(jié)的自動(dòng)化管理。

  1.2客戶(hù)細(xì)分

  客戶(hù)細(xì)分由美國(guó)學(xué)者溫德?tīng)柺访芩乖?0世紀(jì)50年代提出,認(rèn)為客戶(hù)細(xì)分是根據(jù)客戶(hù)屬性將客戶(hù)分成集合,F(xiàn)代營(yíng)銷(xiāo)學(xué)中的客戶(hù)細(xì)分是按照客戶(hù)特征和共性將客戶(hù)群分為不同等級(jí)或者子群體,尋找相同要素,對(duì)不同類(lèi)別客戶(hù)心理與需求急性研究和評(píng)估,從而指導(dǎo)進(jìn)行企業(yè)服務(wù)資源的分配,是企業(yè)獲得客戶(hù)價(jià)值的一種理論與方法。因此我們注意到,客戶(hù)細(xì)分其實(shí)是一個(gè)分類(lèi)問(wèn)題,但是卻有著顯著的特點(diǎn)。

  1.2.1客戶(hù)細(xì)分是動(dòng)態(tài)的企業(yè)不斷發(fā)展變化,用戶(hù)數(shù)據(jù)不斷積累,市場(chǎng)因素的變化,都會(huì)造成客戶(hù)細(xì)分的變化。所以客戶(hù)細(xì)分工作需要根據(jù)客戶(hù)情況的變化進(jìn)行動(dòng)態(tài)調(diào)整,

  減少錯(cuò)誤分類(lèi),提高多次細(xì)分中至少有一次是正確分類(lèi)的可能性。

  1.2.2受眾多因素影響

  隨著時(shí)間的推移,客戶(hù)行為和心理會(huì)發(fā)生變化,所以不同時(shí)間的數(shù)據(jù)會(huì)反映出不同的規(guī)律,客戶(hù)細(xì)分方法需要在變化過(guò)程中準(zhǔn)確掌握客戶(hù)行為的規(guī)律性。

  1.2.3客戶(hù)細(xì)分有不同的分類(lèi)標(biāo)準(zhǔn)

  一般分類(lèi)問(wèn)題強(qiáng)調(diào)準(zhǔn)確性,客戶(hù)關(guān)系管理則強(qiáng)調(diào)有用性,講求在特定限制條件下實(shí)現(xiàn)特定目標(biāo)。

  1.3數(shù)據(jù)挖掘

  數(shù)據(jù)挖掘就是從大型數(shù)據(jù)庫(kù)數(shù)據(jù)中提取有價(jià)值的、隱含的、事前未知的潛在有用信息。數(shù)據(jù)挖掘技術(shù)不斷發(fā)展,挖掘?qū)ο蟛辉偈菃我粩?shù)據(jù)庫(kù),已經(jīng)逐漸發(fā)展到文件系統(tǒng)、數(shù)據(jù)集合以及數(shù)據(jù)倉(cāng)庫(kù)的挖掘分析。

  2客戶(hù)細(xì)分的數(shù)據(jù)挖掘

  2.1邏輯模型

  客戶(hù)數(shù)據(jù)中有著若干離散客戶(hù)屬性和連續(xù)客戶(hù)屬性,每個(gè)客戶(hù)屬性為一個(gè)維度,客戶(hù)作為空間點(diǎn),全部客戶(hù)都能夠形成多為空間,作為客戶(hù)的屬性空間,假設(shè)A={A1,A2,…Am}是一組客戶(hù)屬性,屬性可以是連續(xù)的,也可以離散型,這些屬性就形成了客戶(hù)m維屬性空間。同時(shí)設(shè)g是一個(gè)描述客戶(hù)屬性的一個(gè)指標(biāo),f(g)是符合該指標(biāo)的客戶(hù)集合,即為概率外延,則任一確定時(shí)刻都是n個(gè)互不相交集合。在客戶(hù)價(jià)值概念維度上,可分為“有價(jià)值客戶(hù)”“潛在價(jià)值客戶(hù)”“無(wú)價(jià)值客戶(hù)”三種類(lèi)型,定義RB如下:(1)顯然RB是一個(gè)等價(jià)關(guān)系,經(jīng)RB可分類(lèi)屬性空間為若干等價(jià)類(lèi),每個(gè)等價(jià)類(lèi)都是一個(gè)概念類(lèi),建立客戶(hù)細(xì)分,就是客戶(hù)屬性空間和概念空間映射關(guān)系的建立過(guò)程。

  2.2客戶(hù)細(xì)分?jǐn)?shù)據(jù)挖掘?qū)嵤?/p>

  通過(guò)數(shù)據(jù)庫(kù)已知概念類(lèi)客戶(hù)數(shù)據(jù)進(jìn)行樣本學(xué)習(xí)和數(shù)據(jù)挖掘,進(jìn)行客戶(hù)屬性空間與概念空間映射的自動(dòng)歸納。首先確定一組概念類(lèi)已知客戶(hù)集合。首先確定一個(gè)映射:p:C→L,使,如果,則。,求p(c)確定所屬概念類(lèi)。數(shù)據(jù)部分有客戶(hù)數(shù)據(jù)存儲(chǔ)和概念維數(shù)據(jù)構(gòu)成,客戶(hù)數(shù)據(jù)存儲(chǔ)有企業(yè)全部?jī)?nèi)在屬性、外在屬性以及行為屬性等數(shù)據(jù),方法則主要有關(guān)聯(lián)規(guī)則分析、深井網(wǎng)絡(luò)分類(lèi)、決策樹(shù)、實(shí)例學(xué)習(xí)等數(shù)據(jù)挖掘方法,通過(guò)對(duì)客戶(hù)數(shù)據(jù)存儲(chǔ)數(shù)據(jù)學(xué)習(xí)算法來(lái)建立客戶(hù)數(shù)據(jù)和概念維之間的映射關(guān)系。

  2.3客戶(hù)細(xì)分?jǐn)?shù)據(jù)分析

  建立客戶(hù)動(dòng)態(tài)行為描述模型,滿(mǎn)足客戶(hù)行為非確定性和非一致性要求,客戶(hù)中心的管理體制下,客戶(hù)細(xì)分影響企業(yè)戰(zhàn)術(shù)和戰(zhàn)略級(jí)別決策的生成,所以數(shù)據(jù)挖掘要能夠彌補(bǔ)傳統(tǒng)數(shù)據(jù)分析方法在可靠性方面的缺陷。

  2.3.1客戶(hù)外在屬性

  外在屬性有客戶(hù)地理分布、客戶(hù)組織歸屬情況和客戶(hù)產(chǎn)品擁有情況等?蛻(hù)的組織歸屬是客戶(hù)社會(huì)組織類(lèi)型,客戶(hù)產(chǎn)品擁有情況是客戶(hù)是否擁有或者擁有哪些與其他企業(yè)或者其他企業(yè)相關(guān)產(chǎn)品。

  2.3.2內(nèi)在屬性

  內(nèi)在屬性有人口因素和心理因素等,人口因素是消費(fèi)者市場(chǎng)細(xì)分的重要變量。相比其他變量,人口因素更加容易測(cè)量。心理因素則主要有客戶(hù)愛(ài)好、性格、信用情況以及價(jià)值取向等因素。

  2.3.3消費(fèi)行為

  消費(fèi)行為屬性則重點(diǎn)關(guān)注客戶(hù)購(gòu)買(mǎi)前對(duì)產(chǎn)品的了解情況,是客戶(hù)細(xì)分中最客觀(guān)和重要的因素。

  2.4數(shù)據(jù)挖掘算法

  2.4.1聚類(lèi)算法

  按照客戶(hù)價(jià)值標(biāo)記聚類(lèi)結(jié)果,通過(guò)分類(lèi)功能,建立客戶(hù)特征模型,準(zhǔn)確描述高價(jià)值客戶(hù)的一些特有特征,使得企業(yè)在之后的市場(chǎng)活動(dòng)中能夠迅速發(fā)現(xiàn)并抓住類(lèi)似的高價(jià)值客戶(hù),全面提高客戶(hù)的整體價(jià)值水平。通常都采用中心算法進(jìn)行客戶(hù)的聚類(lèi)分析,分析涉及的字段主要有客戶(hù)的基本信息以及與客戶(hù)相關(guān)業(yè)務(wù)信息,企業(yè)采用中心算法,按照企業(yè)自身的行業(yè)性質(zhì)以及商務(wù)環(huán)境,選擇不同的聚類(lèi)分析策略,有主屬性聚類(lèi)分析和全屬性聚類(lèi)分析兩類(lèi)。主屬性聚類(lèi)分析是企業(yè)根據(jù)在企業(yè)標(biāo)度變量中選擇主要弧形作為聚類(lèi)分析變量。通常區(qū)間標(biāo)度變量選用的度量單位會(huì)對(duì)聚類(lèi)分析結(jié)果產(chǎn)生很大影響,選擇的度量單位越小,就會(huì)獲得越大的可能值域,對(duì)聚類(lèi)結(jié)果的影響也就越大。

  2.4.2客戶(hù)分析預(yù)測(cè)

  行業(yè)競(jìng)爭(zhēng)愈加激烈,新客戶(hù)的'獲得成本越來(lái)越高,在保持原有工作價(jià)值的同時(shí),客戶(hù)的流失也受到了企業(yè)的重視。為了控制客戶(hù)流失,就需要對(duì)流失客戶(hù)的數(shù)據(jù)進(jìn)行認(rèn)真分析,找尋流失客戶(hù)的根本原因,防止客戶(hù)的持續(xù)流失。數(shù)據(jù)挖掘聚類(lèi)功能同樣能夠利用在客戶(hù)流失數(shù)據(jù)分析工作中,建立基于流失客戶(hù)數(shù)據(jù)樣本庫(kù)的分類(lèi)函數(shù)以及分類(lèi)模式,通過(guò)模型分析客戶(hù)流失因素,能夠獲得一個(gè)最有可能流失的客戶(hù)群體,同時(shí)編制一個(gè)有針對(duì)性的挽留方案。之后對(duì)數(shù)據(jù)進(jìn)行分析并利用各種數(shù)據(jù)挖掘技術(shù)和方法在多個(gè)可供選擇的模型中找出最佳模型。初始階段,模型的擬合程度可能不理想,但是隨著模型的不斷更換和優(yōu)化,最終就有可能找出合適的模型進(jìn)行數(shù)據(jù)描述并挖掘出流失數(shù)據(jù)規(guī)律。通常模擬模型都通過(guò)數(shù)據(jù)分析專(zhuān)業(yè)和業(yè)務(wù)專(zhuān)家協(xié)作完成,采用決策樹(shù)、貝葉斯網(wǎng)絡(luò)、神經(jīng)網(wǎng)絡(luò)等流失分析模型,實(shí)現(xiàn)客戶(hù)行為的預(yù)測(cè)分析。

  3結(jié)語(yǔ)

  從工業(yè)營(yíng)銷(xiāo)中的客戶(hù)細(xì)分觀(guān)點(diǎn)出發(fā),在數(shù)據(jù)挖掘、客戶(hù)關(guān)系管理等理論基礎(chǔ)上,采用統(tǒng)計(jì)學(xué)、運(yùn)籌學(xué)和數(shù)據(jù)挖掘技術(shù),對(duì)客戶(hù)細(xì)分的數(shù)據(jù)挖掘方法進(jìn)行了研究,建立了基于決策樹(shù)的客戶(hù)細(xì)分模型,是一種效率很高的管理工具。

  作者:區(qū)嘉良 呂淑儀 單位:中國(guó)石化廣東石油分公司

【數(shù)據(jù)挖掘論文】相關(guān)文章:

數(shù)據(jù)挖掘論文07-16

數(shù)據(jù)挖掘論文07-15

旅游管理下數(shù)據(jù)挖掘運(yùn)用論文11-18

數(shù)據(jù)挖掘論文錦集(15篇)07-28

旅游管理下數(shù)據(jù)挖掘運(yùn)用論文6篇11-18

計(jì)算機(jī)數(shù)據(jù)庫(kù)論文07-28

關(guān)于大數(shù)據(jù)時(shí)代下的隱私保護(hù)探究論文04-14

基于大數(shù)據(jù)的江蘇省農(nóng)村電商建設(shè)不足與完善論文03-09

數(shù)據(jù)分析報(bào)告02-02