發(fā)布時間:2022年04月15日 04:20:43分享人:我們在改變來源:互聯(lián)網(wǎng)27
在weka中數(shù)據(jù)預(yù)處理包括:數(shù)據(jù)的缺失值處理、標(biāo)準(zhǔn)化、規(guī)范化和離散化處理。

1.數(shù)據(jù)的缺失值處理:weka.filters.unsupervised.attribute.ReplaceMissingValues。對于數(shù)值屬性,用平均值代替缺失值,對于nominal屬性,用它的mode(出現(xiàn)最多的值)來代替缺失值。
2.標(biāo)準(zhǔn)化(standardize):類weka.filters.unsupervised.attribute.Standardize。標(biāo)準(zhǔn)化給定數(shù)據(jù)集中所有數(shù)值屬性的值到一個0均值和單位方差的正態(tài)分布。
3.規(guī)范化(Nomalize):類weka.filters.unsupervised.attribute.Normalize。規(guī)范化給定數(shù)據(jù)集中的所有數(shù)值屬 性值,類屬性除外。結(jié)果值默認(rèn)在區(qū)間[0,1],但是利用縮放和平移參數(shù),我們能將數(shù)值屬性值規(guī)范到任何區(qū)間。如:但scale=2.0,translation=-1.0時,你能將屬性值規(guī)范到區(qū)間[-1,+1]。
4.離散化(discretize):類weka.filters.supervised.attribute.Discretize和weka.filters.unsupervised.attribute.Discretize。分別進(jìn)行監(jiān)督和無監(jiān)督的數(shù)值屬性的離散化,用來離散數(shù)據(jù)集中的一些數(shù)值屬性到分類屬性。
更詳細(xì)參照:http://www.cfanz.cn/?c=article&a=read&id=4193
愛華網(wǎng)本文地址 » http://www.klfzs.com/a/25101015/251776.html
更多閱讀

如何恢復(fù)硬盤中的數(shù)據(jù)——簡介電腦數(shù)據(jù)是以磁盤的形式存儲的。對于大多數(shù)人來說,存儲東西是相當(dāng)方便的。但是很多人卻不知道該如何快速的恢復(fù)已經(jīng)刪除的數(shù)據(jù)。下面咱們就說下如何利用工具來恢復(fù)數(shù)據(jù)。如何恢復(fù)硬盤中的數(shù)據(jù)——工具

原文地址:《5號特工組》中的酒井美惠子和竹內(nèi)云子來自同一個原型嗎?作者:吠陀有觀點認(rèn)為《5號特工組》中的酒井美惠子和竹內(nèi)云子來自同一個原型南造云子。南造云子于1937年7月奉命潛入南京,將國民政府行政院主任秘書黃浚和外交部副科

線程中的鎖可以分為樂觀鎖和悲觀鎖,這兩個都是實現(xiàn)鎖機(jī)制的兩種辦法。悲觀鎖:根據(jù)字面意思,悲觀,就是不是太好的。當(dāng)一個線程訪問這個數(shù)據(jù)的時候,悲觀鎖會把這個數(shù)據(jù)給鎖住,不被其他線程所訪問,直到這個線程完成了對數(shù)據(jù)的提交后,其他線程

用EXECL中的數(shù)據(jù)透視表做統(tǒng)計非常方便,下面我用一個簡單的例子給大家介紹下(本文使用的是MS OFFICE2007):假設(shè)我有個表格,要按月將不同列分別作統(tǒng)計步驟如下:點擊“插入”-“數(shù)據(jù)透視表”點擊圖示中的按鈕,選擇數(shù)據(jù)透視表要統(tǒng)計

想必大家都遇到這么一種情況,只是想改變設(shè)計中的RAM或者ROM的數(shù)據(jù),而卻要對整個工程進(jìn)行重新布局布線,這就要花費(fèi)了大量的時間了。采用data2mem工具可以直接修改bitstream中blockram中的數(shù)據(jù)段。我們需要準(zhǔn)備三個文件做為data2mem工具