圖像分類(lèi)是機器學(xué)習和模式識別領(lǐng)域中一個(gè)十分重要的研究熱點(diǎn),其目的是基于標簽已知且完整的圖像數據集訓練一個(gè)分類(lèi)器,并對新樣本的標簽進(jìn)行預測和分類(lèi)。傳統的圖像分類(lèi)問(wèn)題通常是單標簽分類(lèi)問(wèn)題,即一張圖片僅對應一個(gè)類(lèi)別標簽。然而,現實(shí)世界的圖像往往具有多義性,即一張圖片通常和多個(gè)類(lèi)別標簽相關(guān)聯(lián)。針對傳統的單標簽學(xué)習框架難以解決的多義性問(wèn)題,通過(guò)給樣本對象明確地指定一組相關(guān)類(lèi)別標簽的標簽子集,多標簽學(xué)習框架應運而生?,F有的大多數多標簽學(xué)習算法都是假設訓練樣本的標簽集是完整的,然而,在實(shí)際應用中,訓練樣本的標簽往往是不完整的。并且,訓練樣本的標簽通常采用人工標注,耗時(shí)又耗力,而且由于人工標注存在主觀(guān)性,標簽語(yǔ)義存在歧義,致使訓練樣本的部分標簽漏標、缺失。隨著(zhù)互聯(lián)網(wǎng)和社交媒體的發(fā)展,大量由用戶(hù)標注并上傳的圖像數據唾手可得,但是這些圖像數據往往存在標簽缺失問(wèn)題。如何利用這些容易獲取卻具有標簽缺失問(wèn)題的數據來(lái)訓練一個(gè)健壯、有效的多標簽分類(lèi)算法,仍然是一個(gè)亟待解決的問(wèn)題。本文主要研究針對存在標簽缺失問(wèn)題的多標簽圖像分類(lèi)問(wèn)題,主要研究?jì)热萑缦?1.利用標簽間固有的關(guān)聯(lián)性以及示例間的相似性,提出了一種基于示例級和標簽級關(guān)聯(lián)的多標簽圖像分類(lèi)算法。該算法首先采用線(xiàn)性重組策略計算每個(gè)示例與其近鄰示例間的相似性,其次采用標簽矩陣的低秩表示挖掘標簽間的高階關(guān)聯(lián)性,然后采用一種加權最小二乘損失函數保證給定標簽與預測標簽的一致性,最后,通過(guò)拉普拉斯流形正則化聯(lián)合兩種關(guān)聯(lián)以及損失函數構建最終的目標函數。在多個(gè)圖像數據集上的實(shí)驗證明,該算法能夠有效處理標簽缺失問(wèn)題。2.基于低秩特征映射與低秩標簽恢復,提出了一種針對標簽缺失問(wèn)題的雙重低秩的多標簽圖像分類(lèi)算法。該算法首先假設算法的特征映射系數矩陣具有低秩性,來(lái)挖掘特征空間中的標簽關(guān)聯(lián)。然后假設標簽關(guān)聯(lián)矩陣是一個(gè)低秩矩陣,來(lái)挖掘標簽間的高階關(guān)聯(lián)性,并同時(shí)利用低秩的標簽關(guān)聯(lián)恢復原標簽矩陣的缺失標簽。然后通過(guò)保證預測標簽與恢復后的標簽之間的一致性,將標簽關(guān)聯(lián)的提取、標簽恢復與模型的訓練結合到一起。最后通過(guò)正則化引入示例級的關(guān)聯(lián)性。