看到一篇會議論文[1],宣稱用lenet-5在fmnist上可以實現(xiàn)超過98%的識別率。
當時看到就驚呆了!
先介紹一下論文主體內容:
第一部分引言強調了CNN在計算機視覺中有廣泛的應用,并引出了lenet5是一個重要的CNN模型,并分6個方面闡述Fashion-MNIST是一個復雜的數據集。
第二部分介紹了相關的工作,即識別Fashion-MNIST的工作。
紅圈處為本文結果,可達98.8%
第三部分方法部分首先介紹了lenet5的結構,如下圖
之后介紹了評價指標,主要關注accuracy
第四部分介紹了實驗結果,并對實驗結果進行了討論
恕我無知,這是我第一次看到test acc比train acc還要高,而且對于Fashion-MNIST,竟然在8epochs達到了98.8%,我當然想重復這個實驗,畢竟在Fashion-MNIST github頁面上,RESNet18[2]也只能實現(xiàn)95%的準確率,最高為96.7%
根據文中給出的十分有限的超參數:學習 = 0.005 batchsize = 32 epochs = 10,我找出了用matlab寫的CNN程序,準備重復這個實驗,由于論文中未提及用bn核dropout等技術,我也沒用,下圖是我的結果:
呵呵,下圖是我用其他結構跑的結果,超過92%
網絡結構為:
XDM,是我對這篇論文的內容理解有誤嗎?有沒有識別過Fashion-MNIST的出來發(fā)個話啊
[1](PDF) Classification of Garments from Fashion MNIST Dataset Using CNN LeNet-5 Architecture (http://researchgate.net)
[2]https://github.com/zalandoresearch/fashion-mnist