女人被狂躁到高潮视频免费无遮挡,内射人妻骚骚骚,免费人成小说在线观看网站,九九影院午夜理论片少妇,免费av永久免费网址

當(dāng)前位置:首頁(yè) > > 充電吧
[導(dǎo)讀]聚類(lèi)clustering,無(wú)監(jiān)督學(xué)習(xí)unsupervised learning分類(lèi)也。 聚類(lèi)有不少經(jīng)典的方法,我們先從基本概念,本質(zhì)屬性開(kāi)始討論,慢慢把這些方法掌握,應(yīng)用到實(shí)際問(wèn)題中。1、基本概念。?

聚類(lèi)clustering,無(wú)監(jiān)督學(xué)習(xí)unsupervised learning分類(lèi)也。 聚類(lèi)有不少經(jīng)典的方法,我們先從基本概念,本質(zhì)屬性開(kāi)始討論,慢慢把這些方法掌握,應(yīng)用到實(shí)際問(wèn)題中。

1、基本概念。

? 既然要把給出的特征向量分成不同的類(lèi)里,我們首先應(yīng)該想到的是,什么是類(lèi)(cluster或者group)? 在研究過(guò)程中大家不斷的給出一些定義, 但是都比較模糊和寬泛,很難找到一個(gè)大家都容易接受的定義,最近的一個(gè),差不多大家都比較認(rèn)同的定義是這樣描述的。

"continuous regions of this space containing a relatively high density of points, separated from other high density regions by regions of relatively low density of points"

this space 是指特征向量空間,每個(gè)特征向量被看成空間中的一個(gè)點(diǎn)。


什么是聚類(lèi)呢??

我們需要聚類(lèi)的數(shù)據(jù)集是:X = {x_1, ..., x_N}, 表示有N個(gè)特征向量需要聚類(lèi)。

定義X的m聚類(lèi),就是將X分成m組向量,每一組類(lèi)用C表示,C_1, ..., C_m

其中 C_i != 空集; C的并是X; 任意兩個(gè)類(lèi)的交集是空集。在同一個(gè)類(lèi)中的特征向量是相似的(similar),不同類(lèi)中的特征向量不相似(dissimilar),量化這兩個(gè)詞有點(diǎn)困難,可能需要根據(jù)你的實(shí)際情況來(lái)定義相似性和不相似性。?

大約有三種不同的類(lèi)別,如下圖

圖1, Compact Cluster

圖 2, Elongated clusters


圖3、 Spherical and ellipsoidal clusters

這三種不同的cluster類(lèi)型,對(duì)相似度的量化有所差異。


前面描述的這種聚類(lèi)方式一般稱(chēng)之為硬聚類(lèi)(hard 或者 crisp)

還有一種方式是軟聚類(lèi),就是說(shuō)每個(gè)特征屬于某個(gè)類(lèi)有一個(gè)隸屬度來(lái)表述它,比如x屬于C_1的隸屬度為0.2, 屬于C_2的隸屬度為0.8 ,對(duì)于兩類(lèi)的情況,這樣是合理的。


2、 關(guān)于proximity measure

之前寫(xiě)這篇博文的時(shí)候,不想寫(xiě)這部分,現(xiàn)在覺(jué)得還是寫(xiě)寫(xiě)的好啊,保證知識(shí)的完整性,多多思考還是好的。

我們可以用 相似度(similarity)或不相似度(dissimilarity) 來(lái)量化兩個(gè)特征向量、特征向量與一組特征向量以及兩組特征向量之間的proximity。

多數(shù)人認(rèn)為兩個(gè)向量的proximity測(cè)度是最基礎(chǔ)的,proximity就翻譯成近鄰吧。

什么是相似度?定義兩個(gè)向量之間的相似度,它是一個(gè)函數(shù),滿(mǎn)足如下規(guī)則:

? ?* 相似度函數(shù)與特征向量的輸入順序無(wú)關(guān)。 s(v1, v2) = s(v2, v1)

? ?* 任意的同一個(gè)特征向量的相似度取得最大值。 s(v,v) 取得相似度函數(shù)的值域中的最大值。并且當(dāng)且僅當(dāng)輸入向量相同的時(shí)候,才能取得這個(gè)最大值。

? ?* 還有一個(gè)不等式需要滿(mǎn)足: s(x,y) s(y,z) <= [s(x,y)+s(y,z)]s(x,z), for all x,y,z in X


什么是不相似度? 也用函數(shù)定義,也滿(mǎn)足一下規(guī)則:

? ?* 當(dāng)且僅當(dāng)兩個(gè)輸入向量相同時(shí),不相似度函數(shù)取到最小值,就是說(shuō)只有這個(gè)時(shí)候,兩個(gè)向量才最不不相似,就是最相似。

? ?* 不相似度函數(shù)的值與輸入順序無(wú)關(guān)。

? ?* 滿(mǎn)足三角不等式。 d(x,z) <= d(x,y) + d(y,z) , 對(duì)任意 x,y,z in X都成立。


常用的,或者現(xiàn)在大家用過(guò)的相似度與不相似度函數(shù),大家可以參考 《Pattern Recognition》第四版 影印版 604頁(yè)。

在書(shū)中根據(jù)特征向量的類(lèi)型,分了幾種情況。 向量的分量為可連續(xù)實(shí)數(shù)時(shí)、向量的分量為整數(shù)時(shí)、混合類(lèi)型情況,還有模糊測(cè)度,數(shù)據(jù)缺失情況下的測(cè)度。


關(guān)于特征向量與一組特征向量之間的測(cè)度,可以由兩個(gè)方向我們選擇。一種是,集合中的每個(gè)向量都參與與給定的另一個(gè)向量之間測(cè)度,去個(gè)最大的或者最小的,等等。

一種是找一個(gè)類(lèi)的代表,用給定的向量與這個(gè)代表之間做測(cè)量,來(lái)表示類(lèi)與給定向量之間的近鄰測(cè)度。


相似的,兩組特征向量之間也可以采用這兩個(gè)方向。?


這就給了我們一些選擇的余地,根據(jù)我們的需要作出相應(yīng)的認(rèn)為選擇。


對(duì)某個(gè)類(lèi)選一個(gè)代表出來(lái)也是可以研究下的,不過(guò)現(xiàn)在能想到的,大家都差不多想到了,我們只有在實(shí)際用的時(shí)候給出一個(gè)合適的測(cè)度,來(lái)對(duì)我們后面?zhèn)€聚類(lèi)工作更適合就好了。


向compact類(lèi)型的類(lèi),我們可以考慮均值矢量,均值中心,中值中心等。 像線(xiàn)性或者其它形狀的類(lèi),我們也許可以找一些跟形狀類(lèi)似的代表。





本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專(zhuān)欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

納祥科技推出太陽(yáng)能+Type-C雙充電自行車(chē)前燈方案,方案核心模塊包含太陽(yáng)能板、單片機(jī)、三極管、3顆LED燈珠與1200mAh電池,通過(guò)低功耗單片機(jī)與三極管驅(qū)動(dòng),支持強(qiáng)光/弱光/爆閃3種模式,高流明遠(yuǎn)射程,適配多種車(chē)型

關(guān)鍵字: 方案開(kāi)發(fā) 電子方案 自行車(chē)前燈方案 納祥科技

慕尼黑2025年9月11日 /美通社/ -- 當(dāng)?shù)貢r(shí)間9月9日,賽力斯動(dòng)力在德國(guó)慕尼黑國(guó)際車(chē)展期間舉辦技術(shù)發(fā)布與交流會(huì),正式在海外市場(chǎng)推出全新一代賽力斯超級(jí)增程、高效發(fā)動(dòng)機(jī)和新一代分布式電驅(qū)動(dòng)系統(tǒng),同時(shí)與來(lái)自全球的汽車(chē)產(chǎn)...

關(guān)鍵字: 慕尼黑 分布式 發(fā)動(dòng)機(jī) 新能源汽車(chē)

慕尼黑2025年9月11日 /美通社/ -- 高端智能電動(dòng)汽車(chē)品牌問(wèn)界(AITO)在2025年德國(guó)國(guó)際汽車(chē)及智慧出行博覽會(huì)(IAA MOBILITY)上,正式發(fā)布了其最新全球產(chǎn)品陣容——專(zhuān)為中東市場(chǎng)深度本地化打造的AIT...

關(guān)鍵字: AI 智能駕駛 測(cè)試 生態(tài)系統(tǒng)

舍弗勒首次為中國(guó)頭部車(chē)企大規(guī)模生產(chǎn)高壓逆變磚 天津工廠(chǎng)一年內(nèi)完成量產(chǎn)準(zhǔn)備,逆變器模塊性能參數(shù)顯著提升 與合作伙伴羅姆半導(dǎo)體共研尖端碳化硅技術(shù),效率更高、性能更優(yōu) 模塊化可擴(kuò)展設(shè)計(jì)使逆變磚易于集成,可廣泛...

關(guān)鍵字: 逆變 高壓 逆變器 集成

舍弗勒以"專(zhuān)注驅(qū)動(dòng)技術(shù)的科技公司"為主題亮相IAA MOBILITY 2025(B3館B40展臺(tái)) 合并緯湃科技后首次亮相IAA MOBILITY,展示拓展后的汽車(chē)產(chǎn)品組合 憑借在軟件、...

關(guān)鍵字: 電氣 軟件 驅(qū)動(dòng)技術(shù) BSP

拉斯維加斯2025年9月11日 /美通社/ -- 在9月8日至11日舉辦的RE+ 2025展會(huì)上,全球綜合儲(chǔ)能解決方案供應(yīng)商德賽電池(Desay Battery)全面展示了其創(chuàng)新成果,并宣布與深圳市華寶新能源股份有限公司...

關(guān)鍵字: 電池 電芯 人工智能 鋰電

香港2025年 9月12日 /美通社/ -- 全球領(lǐng)先的互聯(lián)網(wǎng)社區(qū)創(chuàng)建者 - 網(wǎng)龍網(wǎng)絡(luò)控股有限公司 ("網(wǎng)龍"或"本公司",香港交易所股票代碼:777)欣然宣布,其子公司My...

關(guān)鍵字: AI 遠(yuǎn)程控制 控制技術(shù) BSP

慕尼黑2025年9月12日 /美通社/ -- 慕尼黑當(dāng)?shù)貢r(shí)間9月10日,在2025德國(guó)國(guó)際汽車(chē)及智慧出行博覽會(huì)(IAA MOBILITY)上,國(guó)際獨(dú)立第三方檢測(cè)、檢驗(yàn)和認(rèn)證機(jī)...

關(guān)鍵字: 測(cè)試 慕尼黑 模型 HUBER

上海2025年9月12日 /美通社/ -- 近日,國(guó)際獨(dú)立第三方檢測(cè)、檢驗(yàn)和認(rèn)證機(jī)構(gòu)德國(guó)萊茵TÜV大中華區(qū)(簡(jiǎn)稱(chēng)"TÜV萊茵")為上海...

關(guān)鍵字: 測(cè)試 信息安全 安全管理 開(kāi)關(guān)

廣州2025年9月12日 /美通社/ -- 9月11日,由國(guó)際獨(dú)立第三方檢測(cè)、檢驗(yàn)和認(rèn)證機(jī)構(gòu)德國(guó)萊茵TÜV大中華區(qū)(簡(jiǎn)稱(chēng)"TÜV萊茵"...

關(guān)鍵字: 數(shù)字化 供應(yīng)鏈 控制 電子
關(guān)閉